Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Нет удержу!» Чем улыбнул первый тест-драйв «ушастого Запорожца», проведенный советским журналистом «Нет удержу!» Чем улыбнул первый тест-драйв «ушастого Запорожца», проведенный советским журналистом

«Ушастый Запорожец» — тесный, шумный, тихоходный или совсем иной?

ТехИнсайдер
«Книги редко становятся бестселлерами просто так — приходится похлопотать»: как они попадают в списки The New York Times «Книги редко становятся бестселлерами просто так — приходится похлопотать»: как они попадают в списки The New York Times

Как писатели получают места в рейтинге бестселлеров от NYT

VC.RU
Ученые превратили тараканов в киборгов, наделив их способностями для спасательных операций Ученые превратили тараканов в киборгов, наделив их способностями для спасательных операций

Тараканы-киборги — идеальные помощники для спасательных операций

Inc.
«Как заниматься сексом»: фильм о том, почему первый опыт часто оказывается травмой «Как заниматься сексом»: фильм о том, почему первый опыт часто оказывается травмой

«Как заниматься сексом»: фильм о подростках, исследующих свою сексуальность

Forbes
Используй ложку и телефон: 20 способов доставить себе удовольствие Используй ложку и телефон: 20 способов доставить себе удовольствие

Двадцать разных способов мастурбации на любой вкус и цвет

Cosmopolitan
Сожгите это немедленно Сожгите это немедленно

15 интересных способов сжечь калории без спорта и диет

Лиза
Не «Домострой», а детские сады: какой должна быть поддержка материнства Не «Домострой», а детские сады: какой должна быть поддержка материнства

Противопоставление материнства и работы не решат демографическую проблему

Forbes
ИИ научился предсказывать появление гигантских волн-убийц в океане ИИ научился предсказывать появление гигантских волн-убийц в океане

Ученые нашли формулу, позволяющую предсказать появление гигантских волн-убийц

ТехИнсайдер
Бежать бояться Бежать бояться

«Слово пацана. Кровь на асфальте»: наши «Банды Нью-Йорка»

Weekend
Оксана Кириллова: «Виланд». Первая часть трилогии Оксана Кириллова: «Виланд». Первая часть трилогии

Отрывок из романа, связывающего Германию 1930-х и Россию 1990-х

СНОБ
Футбол под индейку: как НФЛ и другие лиги собирают рекордные рейтинги в праздники Футбол под индейку: как НФЛ и другие лиги собирают рекордные рейтинги в праздники

Как спортивные лиги США капитализируют праздничные дни

Forbes
Конкурс страшных рассказов: «Квартирная магия», Анастасия Безган Конкурс страшных рассказов: «Квартирная магия», Анастасия Безган

Пощекочите себе нервы и прочитайте страшный рассказ на ночь

VOICE
Генетики прочитали 1526 геномов бантуговорящих африканцев Генетики прочитали 1526 геномов бантуговорящих африканцев

Палеогенетики исследовали ДНК 1763 африканцев

N+1
Семь достоинств кофе Семь достоинств кофе

Научные исследования в корне меняют наши представления о кофе

Здоровье
Ребенок начинает учить язык еще в утробе матери Ребенок начинает учить язык еще в утробе матери

Будущий ребенок начинают изучать язык, на котором вы говорите, еще до рождения!

ТехИнсайдер
Отношения с нарциссами: 11 правил поведения Отношения с нарциссами: 11 правил поведения

Простые советы, которые помогут снизить вред от общения с токсичной личностью

Psychologies
Стройными рядами Стройными рядами

Как девушки в СССР следили за фигурой

Лиза
Как в детстве, но лучше. Топ игр для автомобилистов на VK Play Как в детстве, но лучше. Топ игр для автомобилистов на VK Play

Игры для автолюбителей: от гоночных аркад до симулятора водителя автобуса

РБК
10 самых уродливых пикапов всех времён 10 самых уродливых пикапов всех времён

Увы, не все из этих грузовиков создавались для того, чтобы стать супермоделями

4x4 Club
Когда возникает «наука», или История понятия «science» Когда возникает «наука», или История понятия «science»

Развитие научного знания в Англии в XVII веке

Знание – сила
Математик и Рейх Математик и Рейх

Трагичная судьба немецкого математика Феликса Хаусдорфа

Знание – сила
Только я! Только я!

Что такое эгоцентризм и как его распознать

Лиза
Всем по собаке Всем по собаке

Как помогать бездомным животным и на какие фонды стоит обратить внимание

Grazia
Что скрывают панические атаки Что скрывают панические атаки

Вас замучили панические атаки, ипохондрия и другие страхи?

Psychologies
Тайна острова Джекилл Тайна острова Джекилл

Кто и как создал Федеральную резервную систему США

Деньги
Эксперты Кембриджа назвали слово 2023 года: что оно значит и как влияет на нашу жизнь Эксперты Кембриджа назвали слово 2023 года: что оно значит и как влияет на нашу жизнь

Как искусственный интеллект проникает в наш словарный запас

Psychologies
Изобретая заговоры, или История главного злодея XVII века Изобретая заговоры, или История главного злодея XVII века

Падение Титуса Оутса, выдумавшего католический заговор

Знание – сила
Червь Морриса: как 35 лет назад любопытный студент чуть не погубил Интернет Червь Морриса: как 35 лет назад любопытный студент чуть не погубил Интернет

Это один из первых компьютерных вирусов, парализовавший почти все США

ТехИнсайдер
Премия за самый короткий импульс света Премия за самый короткий импульс света

Как электроны связаны с современной наукой?

Наука и жизнь
Ночная тревожность: как вернуть здоровый сон Ночная тревожность: как вернуть здоровый сон

Если переживания накапливаются и мешают сну, то это уже плохо. Как быть?

Здоровье
Открыть в приложении