Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Дымзавесы и перцовый газ: как оборонка СССР создавала противоугонные системы Дымзавесы и перцовый газ: как оборонка СССР создавала противоугонные системы

Охранная система, которая работала по принципу газового оружия, существовала

ТехИнсайдер
«Останавливаться я не собираюсь» «Останавливаться я не собираюсь»

Екатерина Молоховская на сцене — артистка, а в жизни — психолог

OK!
Как можно использовать искусственный интеллект для создания видео? Интересные факты Как можно использовать искусственный интеллект для создания видео? Интересные факты

Как работают ИИ-видеогенераторы, где их применяют и что ждет нас в будущем

ТехИнсайдер
После антибиотиков: как биологи пытаются предотвратить будущие пандемии После антибиотиков: как биологи пытаются предотвратить будущие пандемии

Как наука и общество должны бороться с пандемиями

Forbes
Обман зрения: как популярные оптические иллюзии дурят наш мозг Обман зрения: как популярные оптические иллюзии дурят наш мозг

Оптические иллюзии - это прямое подтверждение того, что наш мозг чертовски ленив

Популярная механика
Не «Домострой», а детские сады: какой должна быть поддержка материнства Не «Домострой», а детские сады: какой должна быть поддержка материнства

Противопоставление материнства и работы не решат демографическую проблему

Forbes
С помощью гаджетов, с которыми играют дети, можно направлять развитие их мозга С помощью гаджетов, с которыми играют дети, можно направлять развитие их мозга

Как регулировать воздействие цифровых устройств на детский мозг?

ТехИнсайдер
«Сейчас нам предстоит битва»: зачем японские женщины становились самураями «Сейчас нам предстоит битва»: зачем японские женщины становились самураями

Японист Ольга Лебедева рассказывает о трех самых знаменитых воительницах Японии

Forbes
Lexus LX 600 F Sport. Универсальный внедорожный премиум Lexus LX 600 F Sport. Универсальный внедорожный премиум

Новый Lexus LX – премиальный внедорожник, который вполне можно испачкать в грязи

4x4 Club
Абьюз партнера, бедность и страхи: почему на самом деле женщины делают аборты Абьюз партнера, бедность и страхи: почему на самом деле женщины делают аборты

Почему женщины решаются прервать беременность, как это решение влияет на них?

Forbes
Устройство расстройства Устройство расстройства

«Книга решений»: Мишель Гондри о том, что общего у маньяка и режиссера

Weekend
6 вопросов, чтобы решиться на разрыв отношений с родственником 6 вопросов, чтобы решиться на разрыв отношений с родственником

Несколько подсказок тем, кто хочет прекратить отношения с близким

Psychologies
Расхламляем сарай: занятные самоделки из дождевой бочки, ржавого ведра и прочей дачной утвари Расхламляем сарай: занятные самоделки из дождевой бочки, ржавого ведра и прочей дачной утвари

Если на даче скопилось много металлических предметов, не торопитесь прятать их

ТехИнсайдер
«О поверхностях мы не знаем ничего» «О поверхностях мы не знаем ничего»

Пластиковые отходы действительно можно превратить в доходы

Наука
Три самых известных российских киллера 90-х Три самых известных российских киллера 90-х

Наемные убийцы, делавшие свою работу с артистизмом, достойным Голливуда

Maxim
С чистого листа. 5 главных песен Джона Леннона С чистого листа. 5 главных песен Джона Леннона

Рассматриваем биографию Джона Леннона через 5 его главных песен

СНОБ
Минус 100 кг и новая жизнь Минус 100 кг и новая жизнь

За полтора года блогер Алиса Дубровская похудела более чем на 100 кг

Новый очаг
От охотничьих пиджаков до добротного винтажа: краткая история твида От охотничьих пиджаков до добротного винтажа: краткая история твида

Самая благородная ткань — это вовсе не бархат, а традиционный британский твид

Правила жизни
Красота заменит думскроллинг Красота заменит думскроллинг

Как взаимодействие с нейросетями может скрасить ваши будни

ТехИнсайдер
«Театр — сообщество любителей винила» «Театр — сообщество любителей винила»

Константин Хабенский — о том, что сделано за два года в МХТ

OK!
«Бензин самотеком не подавать»: о чем предупреждали водителей советских автобусов «Бензин самотеком не подавать»: о чем предупреждали водителей советских автобусов

Что значит надпись «бензин самотеком не подавать» и в чем минусы самотека

ТехИнсайдер
Интеллектуальная проходимость Интеллектуальная проходимость

Как электроника увеличивает внедорожные возможности машины

ТехИнсайдер
Финишная прямая Финишная прямая

Чек-лист по подготовке к Новому году – за месяц до праздника

Лиза
Как выбрать идеальный свитер и носить его, если тебе за 50: советы стилистов Как выбрать идеальный свитер и носить его, если тебе за 50: советы стилистов

Что нужно учесть, выбирая свитер на холодное время года?

VOICE
4 фразы, которые гарантированно разрушат отношения 4 фразы, которые гарантированно разрушат отношения

Фразы, которые подтачивают доверие друг к другу и постепенно разрушают союз

Psychologies
Куда уходит энергия? Куда уходит энергия?

Где же наша бодрость? Почему мы поддерживаем режим дня, но сил не хватает?

Psychologies
Индийские афалины украли наживку из ловушек для крабов Индийские афалины украли наживку из ловушек для крабов

Зоологи запечатлели необычное поведение дельфинов на видео

N+1
Чувствовать, а не ждать Чувствовать, а не ждать

Как счастье проявляется в нашей жизни, почему мы боимся о нем говорить?

Новый очаг
Установлена лазерная связь на расстоянии 16 миллионов километров. Это в 40 раз дальше Луны Установлена лазерная связь на расстоянии 16 миллионов километров. Это в 40 раз дальше Луны

Самая дальняя в истории демонстрация оптической связи

ТехИнсайдер
«Я принимаю антидепрессанты. Как это повлияет на секс?»: история из практики сексолога «Я принимаю антидепрессанты. Как это повлияет на секс?»: история из практики сексолога

Как антидепрессанты влияют на секс, либидо и эрекцию

Psychologies
Открыть в приложении