Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Вы похудели и вес встал на одном месте? Вот почему это происходит: интересный факт! Вы похудели и вес встал на одном месте? Вот почему это происходит: интересный факт!

Почему у людей прекращается успешная потеря веса и вес выходит на плато

ТехИнсайдер
Стройными рядами Стройными рядами

Как девушки в СССР следили за фигурой

Лиза
Что такое компилятор? Как работает: виды и примеры Что такое компилятор? Как работает: виды и примеры

Как компилятор помогает человек и компьютеру понять друг друга

Цифровой океан
Ученые опубликовали меню королевских трапез британских монархов Георга III и Георга IV Ученые опубликовали меню королевских трапез британских монархов Георга III и Георга IV

Какие блюда подавались к столу двух британских королей?

ТехИнсайдер
Ты лучший: можно ли завести роман с близким другом? Ты лучший: можно ли завести роман с близким другом?

Стоит ли вступать в отношения с близким другом? Расцениваем все риски

VOICE
Сканер души Сканер души

ИИ определяет личные качества людей по фотографии

Цифровой океан
Пятая часть осетрины и черной икры из стран в нижнем течении Дуная оказались браконьерскими Пятая часть осетрины и черной икры из стран в нижнем течении Дуная оказались браконьерскими

Уровень браконьерства подрывает усилия по охране последних осетровых Европы

N+1
«Наследие»: отрывок из нового романа Владимира Сорокина о докторе Гарине «Наследие»: отрывок из нового романа Владимира Сорокина о докторе Гарине

Глава из книги Владимира Сорокина «Наследие»

Forbes
На маленьком плацу На маленьком плацу

Как один лейтенант довел целую империю до политического кризиса

Weekend
Помните Макдоналдс? Вот как чизбургер и наггетсы связаны с вашей личностью! Помните Макдоналдс? Вот как чизбургер и наггетсы связаны с вашей личностью!

Заказ определенного блюда может многое рассказать о том, какой вы человек

ТехИнсайдер
В Британии нашли любовные письма, написанные в XVIII веке плененным французским морякам. Они похожи на современные переписки в WhatsApp В Британии нашли любовные письма, написанные в XVIII веке плененным французским морякам. Они похожи на современные переписки в WhatsApp

О чем писали люди XVIII века в любовных письмах?

Правила жизни
5 видов психотерапии, которые помогут практически с любой проблемой 5 видов психотерапии, которые помогут практически с любой проблемой

Как сделать правильный выбор среди множества направлений психотерапии?

Psychologies
Как работает мозг, и как поддерживать его здоровье Как работает мозг, и как поддерживать его здоровье

Как привычки и образ жизни влияют на мозг?

ТехИнсайдер
Нина Дворжецкая: «На «Оттепели» меня назвали пионервожатой» Нина Дворжецкая: «На «Оттепели» меня назвали пионервожатой»

Нина Дворжецкая поделилась своими взглядами на профессию артиста

Коллекция. Караван историй
Красная курица, или Парижские жители Красная курица, или Парижские жители

«Цыпленок для Линды»: нарисованная история про память

Weekend
У этого животного совсем нет извилин. Но оно скорее умрет не от глупости, а от венерического заболевания У этого животного совсем нет извилин. Но оно скорее умрет не от глупости, а от венерического заболевания

Эти животные слишком ленивы, чтобы умереть

ТехИнсайдер
От охотничьих пиджаков до добротного винтажа: краткая история твида От охотничьих пиджаков до добротного винтажа: краткая история твида

Самая благородная ткань — это вовсе не бархат, а традиционный британский твид

Правила жизни
Что означает значок замка в адресной строке браузера: многие понимают его неправильно Что означает значок замка в адресной строке браузера: многие понимают его неправильно

Стоит ли беспокоиться, когда значок замка появляется в браузере?

ТехИнсайдер
Слишком дорого: как в России сокращается рынок зарубежных онкопрепаратов Слишком дорого: как в России сокращается рынок зарубежных онкопрепаратов

Лекарства, применяемые для лечения рака, исключат из системы финансирования

Forbes
Цифровая лихорадка Цифровая лихорадка

С каждым годом майнинг биткоинов требует больше ресурсов, но не останавливается

ТехИнсайдер
Доска почёта Доска почёта

Как изготавливают самые быстрые и красивые сноуборды

Robb Report
Про напиток из цикория Про напиток из цикория

Есть время и место для кофе и есть время и место для цикория

Наука и жизнь
Идущие за лучом Идущие за лучом

Управление мозгом с помощью света порождает много надежд и столько же опасений

Вокруг света
Эпидемия одиночества: 8 признаков того, что ваше состояние становится опасным для жизни Эпидемия одиночества: 8 признаков того, что ваше состояние становится опасным для жизни

В чем опасность одиночества? И как справиться с этим чувством?

Psychologies
Роболапа с эластичной подошвой распознает тип поверхности на слух Роболапа с эластичной подошвой распознает тип поверхности на слух

Инженеры разработали чувствительную роболапу под названием TRACE Paw

N+1
«Любовь и голуби» глазами психолога: когда измена идет на пользу «Любовь и голуби» глазами психолога: когда измена идет на пользу

Оказывается, иногда интрижка даже укрепляет отношения

Psychologies
Я люблю людей. О спектакле «Мизантроп и я» на сцене РАМТа Я люблю людей. О спектакле «Мизантроп и я» на сцене РАМТа

В РАМТе состоялась премьера спектакля «Мизантроп и я»

СНОБ
«Я принимаю антидепрессанты. Как это повлияет на секс?»: история из практики сексолога «Я принимаю антидепрессанты. Как это повлияет на секс?»: история из практики сексолога

Как антидепрессанты влияют на секс, либидо и эрекцию

Psychologies
Движения людей выдали их намерение найти информацию Движения людей выдали их намерение найти информацию

Характер движений подсказал другим, что этот человек занят поиском информации

N+1
«Требуйте в лучших магазинах и аптеках»: история советского шампанского «Требуйте в лучших магазинах и аптеках»: история советского шампанского

Советское шампанское: как оно появилось и стало массовым

ТехИнсайдер
Открыть в приложении