Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Ученые показали, что мы краснеем, когда нам неловко перед собой Ученые показали, что мы краснеем, когда нам неловко перед собой

Краска стыда связана с эмоциональным обучением и тем, что делает сам человек

ТехИнсайдер
Полетели головы: каким получился «Год рождения» Михаила Местецкого? Полетели головы: каким получился «Год рождения» Михаила Местецкого?

«Я верю только в панк, рок-н-ролл»: рецензия на фильм «Год рождения»

Правила жизни
Что такое коммутатор. Для чего и где он используется, какие виды бывают Что такое коммутатор. Для чего и где он используется, какие виды бывают

Для чего коммутатор нужен и какова его роль в сетевой инфраструктуре

Цифровой океан
Исключи из рациона Исключи из рациона

7 продуктов, которые только прикидываются диетическими

Лиза
Что такое AWD: как работает, плюсы и минусы, отличия от 4WD Что такое AWD: как работает, плюсы и минусы, отличия от 4WD

Разбираемся в том, что скрывается под тремя буквами с окончанием «WD»

РБК
Идем на восток Идем на восток

Увидеть 3 архитектурные эпохи, пожить в XVIII веке и отведать арзамасских гусей

Вокруг света
Нестыдный рефлекс: 5 причин, почему сдерживать чихание вредно Нестыдный рефлекс: 5 причин, почему сдерживать чихание вредно

Почему позволять себе свободно чихать — это на здоровье

ТехИнсайдер
Александр Олешко: «Гурченко этой фразой давала мне шанс исправить ситуацию...» Александр Олешко: «Гурченко этой фразой давала мне шанс исправить ситуацию...»

Александр Олешко — о Валентине Леонтьевой, любви к дикторам и телевидении

Коллекция. Караван историй
«Книги редко становятся бестселлерами просто так — приходится похлопотать»: как они попадают в списки The New York Times «Книги редко становятся бестселлерами просто так — приходится похлопотать»: как они попадают в списки The New York Times

Как писатели получают места в рейтинге бестселлеров от NYT

VC.RU
Умный нос Умный нос

«Электронный нос» поможет избежать вредных примесей в упаковке

Наука
«Я занималась сексом с мужчинами у него на глазах»: бывшая возлюбленная P Diddy обвинила его в многолетнем насилии «Я занималась сексом с мужчинами у него на глазах»: бывшая возлюбленная P Diddy обвинила его в многолетнем насилии

Бывшая Пи Дидди заявила, что он 13 лет подвергал ее насилию и издевательствам

VOICE
Обязательный зимний набор автомобилиста Обязательный зимний набор автомобилиста

Вам когда-нибудь приходилось зимним утром выручать соседа?

4x4 Club
Между бегством и свободой Между бегством и свободой

Как Саша Соколов соединил многие противоположности — и отменил их

Weekend
«Книга решений» Мишеля Гондри: история гения… или пациента с ментальным расстройством? «Книга решений» Мишеля Гондри: история гения… или пациента с ментальным расстройством?

Разбираем типажи из фильма «Книга решений» режиссера Мишеля Гондри

Psychologies
Как лингвисты пытаются разбудить «спящие» языки Как лингвисты пытаются разбудить «спящие» языки

Когда язык умирает, а когда просто спит? Можно ли его разбудить?

ТехИнсайдер
Через апокалипсис революции к тысячелетнему царству Через апокалипсис революции к тысячелетнему царству

Как возникла коммунистическая утопия

Weekend
10 самых уродливых пикапов всех времён 10 самых уродливых пикапов всех времён

Увы, не все из этих грузовиков создавались для того, чтобы стать супермоделями

4x4 Club
Как снова найти себя после абьюзивных отношений: 7 шагов Как снова найти себя после абьюзивных отношений: 7 шагов

Как восстановиться, выбравшись из абьюзивных отношений?

Psychologies
В Британии нашли любовные письма, написанные в XVIII веке плененным французским морякам. Они похожи на современные переписки в WhatsApp В Британии нашли любовные письма, написанные в XVIII веке плененным французским морякам. Они похожи на современные переписки в WhatsApp

О чем писали люди XVIII века в любовных письмах?

Правила жизни
10 самых лучших и горячих азиатских порноактрис в 2023 году 10 самых лучших и горячих азиатских порноактрис в 2023 году

Самые зажигательные девушки Азии

Maxim
На пороге сверхспособностей На пороге сверхспособностей

Может ли человек развить в себе сверхспособности?

Знание – сила
«Сделаю каре после расставания»: о чем может рассказать прическа «Сделаю каре после расставания»: о чем может рассказать прическа

То, как часто человек меняет прическу и цвет волос, способно сказать о многом

Psychologies
Очки, блокирующие синий свет: как за ними ухаживать и чистить, чтобы не стереть защитное покрытие Очки, блокирующие синий свет: как за ними ухаживать и чистить, чтобы не стереть защитное покрытие

Как правильно чистить очки с защитой от синего света

ТехИнсайдер
Низкоуглеводная диета: плюсы, минусы, продукты и интересные рецепты Низкоуглеводная диета: плюсы, минусы, продукты и интересные рецепты

Низкоуглеводная диета: разбираемся в плюсах и минусах такого типа питания

РБК
Как Дайана Найэд проплыла от Кубы до Флориды и установила мировой рекорд в 64 года Как Дайана Найэд проплыла от Кубы до Флориды и установила мировой рекорд в 64 года

«Фри-соло»: необычный, но захватывающий байопик

Forbes
Помнят ли белки, где они спрятали свои запасы на зиму? Помнят ли белки, где они спрятали свои запасы на зиму?

Составляют ли белки «карту сокровищ»?

ТехИнсайдер
Поддастся даже самый упрямый питомец: как приучить кота к лотку Поддастся даже самый упрямый питомец: как приучить кота к лотку

Как приучить к лотку и котенка, и взрослого кота

ТехИнсайдер
Уроки внедорожного мастерства. Крутые спуски и поперечные канавы Уроки внедорожного мастерства. Крутые спуски и поперечные канавы

Поговорим об очень крутых спусках, с которых на первый взгляд нельзя съехать

4x4 Club
От охотничьих пиджаков до добротного винтажа: краткая история твида От охотничьих пиджаков до добротного винтажа: краткая история твида

Самая благородная ткань — это вовсе не бархат, а традиционный британский твид

Правила жизни
Всем ли полезны Омега-3 Всем ли полезны Омега-3

Врачи ссылаются на то, что Омега-3 кислоты необходимы и безопасны. Так ли это?

Лиза
Открыть в приложении