Смотри внимательно. Как компьютеры видят мир и зачем это нужно

Сергей Кузнецов

Компьютерное (машинное) зрение можно найти в медицине, сельском хозяйстве, транспорте, индустрии развлечений и много где еще. Эта технология по-прежнему несовершенна, но искусственный интеллект уже сейчас помогает решать задачи, с которыми не справляется человек. Рассказываем, как устроено компьютерное зрение и насколько велики его возможности.

Мы регулярно прибегаем к помощи алгоритмов — например, когда смотрим прогноз погоды, ищем билеты или просто хотим отдохнуть. Это такая же часть нашей жизни, как одежда и обувь, автомобили и смартфоны. Тем не менее искусственный интеллект, так глубоко проникший во все сферы нашей жизни, до сих пор может вызывать недоверие и страх. Этим текстом мы открываем проект «ИИ спешит на помощь», в котором расскажем, на что способны современные технологии с использованием ИИ, где они приносят наибольшую пользу и почему не стоит бояться восстания машин. Материал подготовлен совместно с федеральным проектом «Искусственный интеллект».

История зрения

Первая статья про машинное зрение, «Глаза и уши компьютера» Оливера Селфриджа, была опубликована в 1955 году. Тогда же появились ЭВМ-2 — первые машины, основанные не на электронных лампах, а на полупроводниковых диодах и транзисторах. Это был качественный скачок в технологиях: размеры ЭВМ уменьшились, а их производительность, наоборот, выросла. Немногим ранее появились и первые работы, посвященные искусственному интеллекту, — например, в 1949 году вышла книга физиолога и нейропсихолога Дональда Хебба «Организация поведения», где он описал принципы обучения нейронов.

Машинное зрение — это применение компьютерного зрения в промышленности. Компьютерное и машинное зрение не одно и то же, однако эти термины близки друг к другу. Для простоты далее в тексте мы используем их в одном значении — компьютерного зрения.

К 1958 году искусственный интеллект и машинное зрение пересеклись в одной точке: американский ученый Фрэнк Розенблатт разработал математическую модель восприятия информации мозгом — перцептрон. Два года спустя ее реализовали на машине «Марк-1». Перцептрон стал одной из первых нейросетей, а «Марк-1» — одним из первых нейрокомпьютеров. В 1960–1970-х годах появились первые системы обработки изображений, а американский инженер Лоуренс Робертс сформулировал концепцию машинного построения трехмерных образов объектов. То, что сейчас умеет делать iPhone, всего 60 лет назад существовало лишь как идея на бумаге.

Искусственный интеллект совершенствуется параллельно с прогрессом в сфере обработки данных: чем мощнее процессоры и чем больше данных они могут обработать, тем точнее и быстрее можно получать результат. Поэтому активное развитие машинного зрения началось только в 1990-х годах — тогда были созданы прототипы беспилотного транспорта, зародились системы распознавания лиц, а во всех индустриях наметился интерес к распознаванию изображений. Сейчас технологии компьютерного зрения применяются повсюду — этому способствовало увеличение количества и качества нейросетей, рост вычислительных мощностей компьютеров, а также скорости и пропускной способности цифровых сетей.

Видеть все

Компьютерное зрение тесно связано с искусственным интеллектом и машинным обучением. По сути это возможность машины «видеть» окружающий мир. Само собой, компьютеры видят не так, как человек, но они умеют распознавать визуальную информацию и реагировать на нее. Зрение — не единственный способ получения информации из внешнего мира, но один из самых полных и достоверных.

Простейший пример компьютерного зрения можно найти в смартфоне: когда вы запускаете камеру, машинное зрение позволяет гаджету разобраться, на что вы наводите объектив. Если это человек, смартфон понимает, что необходимо сфокусироваться на лице и, например, включить бьютификатор, а если пейзаж — понизить или повысить экспозицию в зависимости от освещенности. Многие смартфоны умеют и более детально определять сцену, но в основе всех решений лежат похожие алгоритмы: разработчики на большом объеме изображений обучили искусственный интеллект находить совпадения и включать нужный режим.

Смотри внимательно. Как компьютеры видят мир и зачем это нужно

История зрения

Видеть все

Рекомендуемые статьи

Говори меньше, спрашивай больше и навсегда измени свой стиль управления

Новый британский монарх уже успел получить наследство

Вы наверняка думали, что яичная скорлупа — бесполезная вещь

Как поддержать свою команду, когда почва уходит из-под ног?

На что опираться, выбирая комплектующие для домашнего кинотеатра?

Кто пожертвовал Московской консерватории орган, а кто — 400 тысяч рублей

Как исполнение мечты о собственном ресторане привело Леру Шулюмову в суд

Как конкуренция и соревнование сформировали западноевропейское искусство

Психолог рассказала о нескольких проверенных способах найти серьезные отношения

Почему мы так подвержены воздействию холода?

Как сделать реминерализующую пасту своими руками

Казимир Валишевский — «ничтожество», обладающее умом и ловкостью

188-я серия о кругосветном путешествии москвички Ирины Сидоренко: Бразилия

Как же мы закурили — и когда?

16 лет за учебу в Советском Союзе приходилось платить

Лучшие книги, написанные в прошлом столетии

Что чувствуют и думают те, кто страдает социофобией?

Фрагмент из книги «Зависимость» об алкоголизме и его причинах

Швеция была великой державой почти столетие, но уступила этот статус России

Как помочь куртке и ботинкам стать водонепроницаемыми

Как психика делает секс болезненным

Рассказываем о принципах ответственной косметологии

Алена Яковлева уже более тридцати пяти лет служит в Театре сатиры

Как открыть банковский счет в Казахстане

Выяснилось, что Wattpad стал площадкой для сексуальных маньяков

Археологи раскопали крупнейший курган могильника Новозаведенное-V

Чем солидней автор, тем отчаянней ему нужна возможность переключиться

Гибрид между двумя видами птиц, предок которых жил 10 миллионов лет назад

Исследователи обнаружили предка брахиопод, мшанок и форонид

Какими могут быть отношения братьев и сестер и как они влияют на взросление?