Как устроено компьютерное зрение и насколько велики его возможности

N+1Hi-Tech

Смотри внимательно. Как компьютеры видят мир и зачем это нужно

Сергей Кузнецов

Компьютерное (машинное) зрение можно найти в медицине, сельском хозяйстве, транспорте, индустрии развлечений и много где еще. Эта технология по-прежнему несовершенна, но искусственный интеллект уже сейчас помогает решать задачи, с которыми не справляется человек. Рассказываем, как устроено компьютерное зрение и насколько велики его возможности.

Мы регулярно прибегаем к помощи алгоритмов — например, когда смотрим прогноз погоды, ищем билеты или просто хотим отдохнуть. Это такая же часть нашей жизни, как одежда и обувь, автомобили и смартфоны. Тем не менее искусственный интеллект, так глубоко проникший во все сферы нашей жизни, до сих пор может вызывать недоверие и страх. Этим текстом мы открываем проект «ИИ спешит на помощь», в котором расскажем, на что способны современные технологии с использованием ИИ, где они приносят наибольшую пользу и почему не стоит бояться восстания машин. Материал подготовлен совместно с федеральным проектом «Искусственный интеллект».

История зрения

Первая статья про машинное зрение, «Глаза и уши компьютера» Оливера Селфриджа, была опубликована в 1955 году. Тогда же появились ЭВМ-2 — первые машины, основанные не на электронных лампах, а на полупроводниковых диодах и транзисторах. Это был качественный скачок в технологиях: размеры ЭВМ уменьшились, а их производительность, наоборот, выросла. Немногим ранее появились и первые работы, посвященные искусственному интеллекту, — например, в 1949 году вышла книга физиолога и нейропсихолога Дональда Хебба «Организация поведения», где он описал принципы обучения нейронов.

Машинное зрение — это применение компьютерного зрения в промышленности. Компьютерное и машинное зрение не одно и то же, однако эти термины близки друг к другу. Для простоты далее в тексте мы используем их в одном значении — компьютерного зрения.

К 1958 году искусственный интеллект и машинное зрение пересеклись в одной точке: американский ученый Фрэнк Розенблатт разработал математическую модель восприятия информации мозгом — перцептрон. Два года спустя ее реализовали на машине «Марк-1». Перцептрон стал одной из первых нейросетей, а «Марк-1» — одним из первых нейрокомпьютеров. В 1960–1970-х годах появились первые системы обработки изображений, а американский инженер Лоуренс Робертс сформулировал концепцию машинного построения трехмерных образов объектов. То, что сейчас умеет делать iPhone, всего 60 лет назад существовало лишь как идея на бумаге.

Искусственный интеллект совершенствуется параллельно с прогрессом в сфере обработки данных: чем мощнее процессоры и чем больше данных они могут обработать, тем точнее и быстрее можно получать результат. Поэтому активное развитие машинного зрения началось только в 1990-х годах — тогда были созданы прототипы беспилотного транспорта, зародились системы распознавания лиц, а во всех индустриях наметился интерес к распознаванию изображений. Сейчас технологии компьютерного зрения применяются повсюду — этому способствовало увеличение количества и качества нейросетей, рост вычислительных мощностей компьютеров, а также скорости и пропускной способности цифровых сетей.

Видеть все

Компьютерное зрение тесно связано с искусственным интеллектом и машинным обучением. По сути это возможность машины «видеть» окружающий мир. Само собой, компьютеры видят не так, как человек, но они умеют распознавать визуальную информацию и реагировать на нее. Зрение — не единственный способ получения информации из внешнего мира, но один из самых полных и достоверных.

Простейший пример компьютерного зрения можно найти в смартфоне: когда вы запускаете камеру, машинное зрение позволяет гаджету разобраться, на что вы наводите объектив. Если это человек, смартфон понимает, что необходимо сфокусироваться на лице и, например, включить бьютификатор, а если пейзаж — понизить или повысить экспозицию в зависимости от освещенности. Многие смартфоны умеют и более детально определять сцену, но в основе всех решений лежат похожие алгоритмы: разработчики на большом объеме изображений обучили искусственный интеллект находить совпадения и включать нужный режим.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как жить без Photoshop. Альтернативные бесплатные решения для дизайнеров и не только Как жить без Photoshop. Альтернативные бесплатные решения для дизайнеров и не только

Можно ли заменить Photoshop?

Цифровой океан
Очень страшные истории: Очень страшные истории:

Крипи-история про похоронное бюро от Моран Джурич

VOICE
В чем смысл жизни: почему люди веками ищут ответ на этот вопрос и можно ли его найти В чем смысл жизни: почему люди веками ищут ответ на этот вопрос и можно ли его найти

Нужно ли искать свой смысл жизни?

Psychologies
Между свободой и концлагерем: зачем нацисты создавали гетто и что в них происходило Между свободой и концлагерем: зачем нацисты создавали гетто и что в них происходило

Нацисты стремились не только уничтожить евреев, но сделать процесс «эффективным»

Forbes
Машины с настоящим автопилотом могут не появиться никогда. И вот почему Машины с настоящим автопилотом могут не появиться никогда. И вот почему

Почему про фантазии о самостоятельных автомобилях лучше не вспоминать?

РБК
Как быстро и дешево почистить салон автомобиля: помогут средства, которые найдутся дома Как быстро и дешево почистить салон автомобиля: помогут средства, которые найдутся дома

Как приготовить необходимые средства для чистки ковриков и сидений

TechInsider
Каким получился новый роман Пелевина «KGBT+» и стоит ли его читать Каким получился новый роман Пелевина «KGBT+» и стоит ли его читать

«KGBT+» — худший труд Виктора Пелевина

РБК
Сандвичи, блокчейн и боты: новые схемы бизнеса криптотрейдеров Сандвичи, блокчейн и боты: новые схемы бизнеса криптотрейдеров

Прозрачность криптовалют позволяет трейдерам наживаться на простых людях

Forbes
Одна вокруг света: бескрайние хлопковые поля по дороге в Амазонию Одна вокруг света: бескрайние хлопковые поля по дороге в Амазонию

189-я серия о кругосветном путешествии москвички Ирины Сидоренко: Бразилия

Forbes
Руки делают Руки делают

Для героев этого проекта хобби – не просто увлечение

Новый Очаг
«Это сильнейшее из всего, что может представить Европа»: как продвигали Кандинского «Это сильнейшее из всего, что может представить Европа»: как продвигали Кандинского

Отрывок из книги «Герварт Вальден — куратор нового искусства. Жизнь и судьба»

Forbes
Как и что говорить на поминках: советы актрисы и психолога Как и что говорить на поминках: советы актрисы и психолога

Что и как говорить на поминках (при этом остаться собой и не ляпнуть лишнего)

Psychologies
Без промаха Без промаха

Как избежать досадных ошибок при ремонте

Добрые советы
Текст должен быть событием: кто такая Анни Эрно, получившая Нобелевскую премию по литературе Текст должен быть событием: кто такая Анни Эрно, получившая Нобелевскую премию по литературе

Почему тексты нобелевского лауреата Анни Эрно могут казаться слишком личными

Правила жизни
Ты ему не мать, но и он не прицеп: как построить отношения с его ребенком от первого брака Ты ему не мать, но и он не прицеп: как построить отношения с его ребенком от первого брака

Что, если ребенок партнера воспринимает тебя в штыки, даже не давая тебе шанса?

VOICE
Девственники поневоле: кто такие инцелы и за что они не любят женщин Девственники поневоле: кто такие инцелы и за что они не любят женщин

Инцел — это человек, который не может найти себе сексуального партнера

Maxim
Щелчок по носу: как мы растем через кризисы Щелчок по носу: как мы растем через кризисы

О точках роста в кризисных ситуациях рассказывает коуч Оксана Набок

Psychologies
Учителя, дети или родители: кто несет ответственность за школьный буллинг? Учителя, дети или родители: кто несет ответственность за школьный буллинг?

Какие меры необходимо предпринимать для профилактики и борьбы с буллингом?

Psychologies
Сашины слезы Сашины слезы

«Аврора»: московский комедийный нуар Романа Волобуева

Weekend
Почему забота превращается в гиперопеку: 3 глубинные причины — проверьте себя Почему забота превращается в гиперопеку: 3 глубинные причины — проверьте себя

Как отличить опеку от заботы? Как научиться заботиться правильно?

Psychologies
Просо и ячмень оказались основными культурами у жителей средневекового оазиса Миран Просо и ячмень оказались основными культурами у жителей средневекового оазиса Миран

Несмотря на сложные условия, жителям Миран удавалось выращивать пшеницу

N+1
Время для счастья Время для счастья

Эти женщины доказывают, что можно оставаться привлекательными в любом возрасте

Добрые советы
Кто же автор «Сказки о царе Салтане» Кто же автор «Сказки о царе Салтане»

О процедуре текстовой атрибуции

Наука
Из широких штанин: осваиваем стиль 2000-х, глядя на молодого Эминема Из широких штанин: осваиваем стиль 2000-х, глядя на молодого Эминема

Мы составили небольшой гид по стилю Y2K

Правила жизни
5 способов справляться с неопределенностью 5 способов справляться с неопределенностью

Неопределенность всегда появляется, когда в нашу жизнь врываются перемены

Psychologies
«52 упрямые женщины»: вдохновляющие истории об ученых, которые изменили мир «52 упрямые женщины»: вдохновляющие истории об ученых, которые изменили мир

Книга об ученых, которые совершили важнейшие открытия и чьи имена забыты

СНОБ
Научный халифат Научный халифат

Что ислам подарил христианскому Западу

Вокруг света
Как адаптироваться к новым реалиям жизни Как адаптироваться к новым реалиям жизни

Как же справиться с переменами и начать двигаться вперед, несмотря ни на что?

Лиза
Как дожить до 100 лет: шведские секреты долголетия Как дожить до 100 лет: шведские секреты долголетия

Выход на пенсию — начало нового и долгого периода жизни

Psychologies
5 отличных детективов, которые ты мог пропустить 5 отличных детективов, которые ты мог пропустить

5 книг специально для любителей закрученных сюжетов

Maxim
Открыть в приложении