Как устроено компьютерное зрение и насколько велики его возможности

N+1Hi-Tech

Смотри внимательно. Как компьютеры видят мир и зачем это нужно

Сергей Кузнецов

Компьютерное (машинное) зрение можно найти в медицине, сельском хозяйстве, транспорте, индустрии развлечений и много где еще. Эта технология по-прежнему несовершенна, но искусственный интеллект уже сейчас помогает решать задачи, с которыми не справляется человек. Рассказываем, как устроено компьютерное зрение и насколько велики его возможности.

Мы регулярно прибегаем к помощи алгоритмов — например, когда смотрим прогноз погоды, ищем билеты или просто хотим отдохнуть. Это такая же часть нашей жизни, как одежда и обувь, автомобили и смартфоны. Тем не менее искусственный интеллект, так глубоко проникший во все сферы нашей жизни, до сих пор может вызывать недоверие и страх. Этим текстом мы открываем проект «ИИ спешит на помощь», в котором расскажем, на что способны современные технологии с использованием ИИ, где они приносят наибольшую пользу и почему не стоит бояться восстания машин. Материал подготовлен совместно с федеральным проектом «Искусственный интеллект».

История зрения

Первая статья про машинное зрение, «Глаза и уши компьютера» Оливера Селфриджа, была опубликована в 1955 году. Тогда же появились ЭВМ-2 — первые машины, основанные не на электронных лампах, а на полупроводниковых диодах и транзисторах. Это был качественный скачок в технологиях: размеры ЭВМ уменьшились, а их производительность, наоборот, выросла. Немногим ранее появились и первые работы, посвященные искусственному интеллекту, — например, в 1949 году вышла книга физиолога и нейропсихолога Дональда Хебба «Организация поведения», где он описал принципы обучения нейронов.

Машинное зрение — это применение компьютерного зрения в промышленности. Компьютерное и машинное зрение не одно и то же, однако эти термины близки друг к другу. Для простоты далее в тексте мы используем их в одном значении — компьютерного зрения.

К 1958 году искусственный интеллект и машинное зрение пересеклись в одной точке: американский ученый Фрэнк Розенблатт разработал математическую модель восприятия информации мозгом — перцептрон. Два года спустя ее реализовали на машине «Марк-1». Перцептрон стал одной из первых нейросетей, а «Марк-1» — одним из первых нейрокомпьютеров. В 1960–1970-х годах появились первые системы обработки изображений, а американский инженер Лоуренс Робертс сформулировал концепцию машинного построения трехмерных образов объектов. То, что сейчас умеет делать iPhone, всего 60 лет назад существовало лишь как идея на бумаге.

Искусственный интеллект совершенствуется параллельно с прогрессом в сфере обработки данных: чем мощнее процессоры и чем больше данных они могут обработать, тем точнее и быстрее можно получать результат. Поэтому активное развитие машинного зрения началось только в 1990-х годах — тогда были созданы прототипы беспилотного транспорта, зародились системы распознавания лиц, а во всех индустриях наметился интерес к распознаванию изображений. Сейчас технологии компьютерного зрения применяются повсюду — этому способствовало увеличение количества и качества нейросетей, рост вычислительных мощностей компьютеров, а также скорости и пропускной способности цифровых сетей.

Видеть все

Компьютерное зрение тесно связано с искусственным интеллектом и машинным обучением. По сути это возможность машины «видеть» окружающий мир. Само собой, компьютеры видят не так, как человек, но они умеют распознавать визуальную информацию и реагировать на нее. Зрение — не единственный способ получения информации из внешнего мира, но один из самых полных и достоверных.

Простейший пример компьютерного зрения можно найти в смартфоне: когда вы запускаете камеру, машинное зрение позволяет гаджету разобраться, на что вы наводите объектив. Если это человек, смартфон понимает, что необходимо сфокусироваться на лице и, например, включить бьютификатор, а если пейзаж — понизить или повысить экспозицию в зависимости от освещенности. Многие смартфоны умеют и более детально определять сцену, но в основе всех решений лежат похожие алгоритмы: разработчики на большом объеме изображений обучили искусственный интеллект находить совпадения и включать нужный режим.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Жажда успеха: как выжить на пути к поставленным целям Жажда успеха: как выжить на пути к поставленным целям

Как достигнуть цели и при этом не выгореть?

Psychologies
Геотермальные батареи решат главную проблему альтернативной генерации Геотермальные батареи решат главную проблему альтернативной генерации

Что такое геотермальные источники энергии?

ТехИнсайдер
Один день в городе Один день в городе

Отправляемся в Ялту в поисках счастья

Лиза
Глаза, мозг, ромб Михаэлиса: 8 самых неожиданных эрогенных зон Глаза, мозг, ромб Михаэлиса: 8 самых неожиданных эрогенных зон

Гайд по эрогенным зонам

Maxim
«Безумно ревную парня к порно»: что делать? «Безумно ревную парня к порно»: что делать?

Что делать, если вы испытываете ревность и считаете просмотр порно изменой?

Psychologies
Жестокий роман: как алгоритмы соцсетей пропускают неприемлемый контент Жестокий роман: как алгоритмы соцсетей пропускают неприемлемый контент

Как рекламные объявления нарушают политику соцсетей

Forbes
Как растянуть шерстяную вещь, которая села после стирки: простое решение сложной проблемы Как растянуть шерстяную вещь, которая села после стирки: простое решение сложной проблемы

Что делать, если после стирки ваша шерстяная вещь стала меньше?

ТехИнсайдер
Навстречу себе Навстречу себе

5 неявных признаков, которые выдают в тебе неуверенного человека

Лиза
9 вещей, которые нельзя делать перед посещением врача 9 вещей, которые нельзя делать перед посещением врача

Чтобы результаты обследований были правильными, важно соблюдать правила

Лиза
Женщины русского Харбина: как эмигрантки из России жили в Китае Женщины русского Харбина: как эмигрантки из России жили в Китае

Как оказавшиеся на чужбине в Китае женщины переживали трудные времена

Forbes
Ученые из Великобритании выяснили, что вегетарианцы чаще страдают от депрессии. Но дело не в питании Ученые из Великобритании выяснили, что вегетарианцы чаще страдают от депрессии. Но дело не в питании

Исследователи установили, что вегетарианцы чаще мясоедов страдают от депрессии

Inc.
Трекинг в программах развития: исконно российский рецепт для роста бизнеса Трекинг в программах развития: исконно российский рецепт для роста бизнеса

Что такое трекинг и чем он может быть полезен технологическим компаниям

СНОБ
Омега: как удержать баланс Омега: как удержать баланс

Почему дисбаланс полиненасыщенных кислот может привести к проблемам?

Здоровье
Как создать группу поддержки самостоятельно Как создать группу поддержки самостоятельно

Как организовать группу поддержки и где этому научиться

Psychologies
«Что я оплакиваю»: как перестать горевать о прошлом, вырвавшись на свободу «Что я оплакиваю»: как перестать горевать о прошлом, вырвавшись на свободу

Отрывок из книги «Так можно» — о том, как позволить себе ощущение свободы

Forbes
Кто был прототипом Маугли из произведения Киплинга? Дина Саничар — индийский мальчик, танцующий с волками Кто был прототипом Маугли из произведения Киплинга? Дина Саничар — индийский мальчик, танцующий с волками

Можно вытащить человека из джунглей, но джунгли из человека — нет

ТехИнсайдер
50 — это новые 30? 50 — это новые 30?

Быть молодым и считаться молодым – разные вещи

Добрые советы
Долой все лишнее Долой все лишнее

Можно ли сбросить лишние килограммы с помощью результатов анализов?

Лиза
Арктическая экспедиция: кто и зачем развивает туризм на Таймыре Арктическая экспедиция: кто и зачем развивает туризм на Таймыре

Зачем на Таймыре строить отели, создавать круизы и проводить экспедиции?

Forbes
Что случилось с дворцами Романовых после революции 1917 года? Фото «До» и «После» Что случилось с дворцами Романовых после революции 1917 года? Фото «До» и «После»

Что стало с дворцами Романовых после прихода большевиков к власти?

ТехИнсайдер
Легкой поступью Легкой поступью

Как решить проблему с болью в стопе и не допускать рецидивов?

Лиза
Конфликт желаемого и реального: что такое когнитивный диссонанс Конфликт желаемого и реального: что такое когнитивный диссонанс

О том, как работает когнитивный диссонанс, какими бывают его проявления

Forbes
Существует ли гендерная психология? Краткий курс по отличиям мужчин и женщин Существует ли гендерная психология? Краткий курс по отличиям мужчин и женщин

Так в чем же наши психологические различия?

Psychologies
Астрономию исключили из школьной программы. Для чего нужно изучать космос? Астрономию исключили из школьной программы. Для чего нужно изучать космос?

Зачем человечество тратит миллиарды долларов на изучение космоса?

Maxim
Одна вокруг света: деревенский аэродром и фейерверк из бабочек Одна вокруг света: деревенский аэродром и фейерверк из бабочек

191-я серия о кругосветном путешествии москвички Ирины Сидоренко: Бразилия

Forbes
Секс в эпоху ядерной угрозы Секс в эпоху ядерной угрозы

Как интересно было ученым ХХ века изучать генетическую рекомбинацию

СНОБ
5 признаков несерьезных отношений — проверьте вашу пару 5 признаков несерьезных отношений — проверьте вашу пару

Как понять, какое будущее ждет вашу пару?

Psychologies
Как поражение Германии в Сталинградской битве перевернуло Вторую мировую войну Как поражение Германии в Сталинградской битве перевернуло Вторую мировую войну

Решение Гитлера в 1942 году атаковать Сталинград оказалось разрушительным

ТехИнсайдер
Археологи обнаружили в Ставропольском крае захоронение сарматского воина-аристократа Археологи обнаружили в Ставропольском крае захоронение сарматского воина-аристократа

Археологи раскопали крупнейший курган могильника Новозаведенное-V

N+1
Искусство в интерьере: как не превратить квартиру в музей Искусство в интерьере: как не превратить квартиру в музей

Как интегрировать графику, граффити и абстракцию в интерьер

РБК
Открыть в приложении