Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

От мела к модели: как искусственный интеллект перестраивает образовательный процесс От мела к модели: как искусственный интеллект перестраивает образовательный процесс

ИИ вошел во многие сферы жизни. Не избежала его и система образования

ТехИнсайдер
LinkedIn: 45% компаний стали чаще обращали внимание на навыки, а не образование LinkedIn: 45% компаний стали чаще обращали внимание на навыки, а не образование

Работодатели стали обращать внимание на навыки соискателя работы

Inc.
Подводный пылесос и чистящее желе: четыре российских технологии для борьбы с нефтяным загрязнением Подводный пылесос и чистящее желе: четыре российских технологии для борьбы с нефтяным загрязнением

Как решения используют в России по уборке нефтепродуктов?

Inc.
Бежать бояться Бежать бояться

«Слово пацана. Кровь на асфальте»: наши «Банды Нью-Йорка»

Weekend
«Кухня Древнего мира» «Кухня Древнего мира»

О сырах, которые в Древнем Риме считались скромной пищей

N+1
Как работает мозг, и как поддерживать его здоровье Как работает мозг, и как поддерживать его здоровье

Как привычки и образ жизни влияют на мозг?

ТехИнсайдер
Влюбленные в облаках и со стертой памятью: фильмы Мишеля Гондри от худшего к лучшему Влюбленные в облаках и со стертой памятью: фильмы Мишеля Гондри от худшего к лучшему

Все игровые фильмы одного из главных фантазеров современного кино Мишеля Гондри

Правила жизни
Одиночество, переезд и люди, которые живут на улице: три новые книги для детей и подростков Одиночество, переезд и люди, которые живут на улице: три новые книги для детей и подростков

Книги о подростковом одиночестве и несколько историй о миграции сквозь века

Правила жизни
Девки не сидели в теремах: какой была интимная жизнь на Руси Девки не сидели в теремах: какой была интимная жизнь на Руси

Как на самом деле жили женщины в допетровскую эпоху?

Forbes
Автор в голове у героя: 5 выдающихся фантастических циклов с повествованием от первого лица Автор в голове у героя: 5 выдающихся фантастических циклов с повествованием от первого лица

Книги, которые создают у читателя эмоциональную связь с героем-рассказчиком

ТехИнсайдер
Установлена лазерная связь на расстоянии 16 миллионов километров. Это в 40 раз дальше Луны Установлена лазерная связь на расстоянии 16 миллионов километров. Это в 40 раз дальше Луны

Самая дальняя в истории демонстрация оптической связи

ТехИнсайдер
Вокруг света по «голубой воде» Вокруг света по «голубой воде»

Hallberg-Rassy — одна из лучших в мире верфей для парусных яхт открытого моря

Y Magazine
Владимир Машков: «Я не бегу ни от проблем, ни от забот. Это мой путь. И у меня есть цель» Владимир Машков: «Я не бегу ни от проблем, ни от забот. Это мой путь. И у меня есть цель»

Моя задача, чтобы работал не только один я, а коллектив

Караван историй
Крылышки и бяк-бяк-бяк Крылышки и бяк-бяк-бяк

«Ниша»: руины советского мифа как актуальный предмет исследования

Weekend
Пропаганда насилия и кража образа Линдси Лохан. В чем обвиняли создателей GTA Пропаганда насилия и кража образа Линдси Лохан. В чем обвиняли создателей GTA

Скандалы вокруг серии игр Grand Theft Auto

СНОБ
Почему после ядерного взрыва в Хиросиме и Нагасаки уже живут люди, а Чернобыль до сих пор считается зоной отчуждения? Почему после ядерного взрыва в Хиросиме и Нагасаки уже живут люди, а Чернобыль до сих пор считается зоной отчуждения?

Почему в Хиросиме и Нагасаки уже проживают люди, а в Чернобыле еще нет?

ТехИнсайдер
Синдром Ребекки: 3 причины, почему нынешние партнеры следят за бывшими и наоборот Синдром Ребекки: 3 причины, почему нынешние партнеры следят за бывшими и наоборот

Синдром Ребекки: что это такое и как этот синдром влияет на жизнь человека

Psychologies
Что означает значок замка в адресной строке браузера: многие понимают его неправильно Что означает значок замка в адресной строке браузера: многие понимают его неправильно

Стоит ли беспокоиться, когда значок замка появляется в браузере?

ТехИнсайдер
Бунтующий человек. Каким был писатель и философ Альбер Камю Бунтующий человек. Каким был писатель и философ Альбер Камю

Чем, кроме своих литературных произведений, запомнился Камю

СНОБ
Личные и общие границы в отношениях: как защитить свою территорию и перестать нападать на чужую Личные и общие границы в отношениях: как защитить свою территорию и перестать нападать на чужую

Как понять, кто и где вторгается в наше пространство, а где вы делаете это сами

Psychologies
Из спортивной журналистки в предпринимательницы Из спортивной журналистки в предпринимательницы

Как Мария Командная сменила футбол на косметику

Inc.
«Я принимаю антидепрессанты. Как это повлияет на секс?»: история из практики сексолога «Я принимаю антидепрессанты. Как это повлияет на секс?»: история из практики сексолога

Как антидепрессанты влияют на секс, либидо и эрекцию

Psychologies
Абьюз партнера, бедность и страхи: почему на самом деле женщины делают аборты Абьюз партнера, бедность и страхи: почему на самом деле женщины делают аборты

Почему женщины решаются прервать беременность, как это решение влияет на них?

Forbes
«Я такого не ожидал!»: этот психологический тест вызвал бурю эмоций в сети. Узнайте, что ваш любимый кофе говорит о вас «Я такого не ожидал!»: этот психологический тест вызвал бурю эмоций в сети. Узнайте, что ваш любимый кофе говорит о вас

Ваш любимый кофейный напиток может много сказать о вашем характере!

ТехИнсайдер
Летчик, моряк, любовник и филантроп: история принца Чарльза, который теперь — король Великобритании Карл III Летчик, моряк, любовник и филантроп: история принца Чарльза, который теперь — король Великобритании Карл III

Какой была жизнь нового короля Великобритании до престола? Ключевые вехи

Правила жизни
Классика жанра: 3 выдающихся фантастических романа 90-х, которые вы могли пропустить Классика жанра: 3 выдающихся фантастических романа 90-х, которые вы могли пропустить

Фантастические романы, которые до сих пор впечатляют идеями и сюжетами

ТехИнсайдер
7 телефонных привычек, которые выдают тревожного человека 7 телефонных привычек, которые выдают тревожного человека

То, как мы обращаемся со своим смартфоном, может рассказать о многом

Psychologies
Домик на крыше Домик на крыше

Сколько стоит пентхаус

Деньги
Как Россия османам надавала: политическая стычка с русскими, которая изменила судьбу Турции Как Россия османам надавала: политическая стычка с русскими, которая изменила судьбу Турции

Каким был переломный момент в войне России и Османской империи

ТехИнсайдер
7 стереотипов, которые вредят отношениям 7 стереотипов, которые вредят отношениям

Стереотипы, которые мешают достичь гармонии в отношениях

Psychologies
Открыть в приложении