Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему нейросети стали ошибаться и отвечать неправильно? Объясняет эксперт Почему нейросети стали ошибаться и отвечать неправильно? Объясняет эксперт

Почему ИИ-боты выдают так много неточностей?

ТехИнсайдер
Расплата за ошибки: что будет с Binance и криптоиндустрией после рекордного штрафа Расплата за ошибки: что будет с Binance и криптоиндустрией после рекордного штрафа

Подход криптобирж к клиентам может стать более жестким

Forbes
Оригами-робота научили прижимать ноги и ходить по-крабьи Оригами-робота научили прижимать ноги и ходить по-крабьи

Инженер из Германии разработал четвероногого оригами-робота Fold Walker

N+1
Слишком дорого: как в России сокращается рынок зарубежных онкопрепаратов Слишком дорого: как в России сокращается рынок зарубежных онкопрепаратов

Лекарства, применяемые для лечения рака, исключат из системы финансирования

Forbes
Американец начал употреблять бром по совету ChatGPT и заработал психоз Американец начал употреблять бром по совету ChatGPT и заработал психоз

Мужчина заработал психоз после совета ChatGPT

N+1
Стесняюсь спросить: главные мифы о лечении зубов Стесняюсь спросить: главные мифы о лечении зубов

Вместе с экспертом разбираем самые популярные мифы об уходе за зубами

Правила жизни
Умный сон: 17 правил на каждую ночь Умный сон: 17 правил на каждую ночь

Как наладить свой сон?

Новый очаг
Роза севера Роза севера

Самые могущественные во Франции «спонсоры» подарили Шартрскому собору розу

Вокруг света
10 исторических фактов, которые раскрывают секреты секса на Руси 10 исторических фактов, которые раскрывают секреты секса на Руси

Как менялись сексуальные обычаи и практики в России за последнюю тысячу лет

Psychologies
«Валентина Толкунова — это вся моя жизнь», — рассказывает директор певицы Любовь Майорова «Валентина Толкунова — это вся моя жизнь», — рассказывает директор певицы Любовь Майорова

Любовь Майорова вспоминает о певице Валентине Толкуновой

Коллекция. Караван историй
Удиви меня: без каких навыков не найти работу за рубежом Удиви меня: без каких навыков не найти работу за рубежом

Основные причины отказа российским кандидатам в международных компаниях

Forbes
Владимир Машков: «Я не бегу ни от проблем, ни от забот. Это мой путь. И у меня есть цель» Владимир Машков: «Я не бегу ни от проблем, ни от забот. Это мой путь. И у меня есть цель»

Моя задача, чтобы работал не только один я, а коллектив

Караван историй
«Нас взяли в оборот ушлые рекламщики»: Энцо Феррари об экономике автомобильных гонок «Нас взяли в оборот ушлые рекламщики»: Энцо Феррари об экономике автомобильных гонок

Глава из автобиографии Энцо Феррари «Мои ужасные радости»

Forbes
Почему наша память становится хуже и как ее улучшить: 5 советов от невролога Почему наша память становится хуже и как ее улучшить: 5 советов от невролога

Что приводит к ухудшению памяти и что стоит сделать, чтобы улучшить ее

Psychologies
Суровый режиссер Майкл Манн рассказывает про свой новый «Феррари», так зовется его новый фильм Суровый режиссер Майкл Манн рассказывает про свой новый «Феррари», так зовется его новый фильм

Интервью с человеком, который снял «Схватку», «Полицию Майами» и «Соучастника»

Maxim
10 самых ярких Ferrari, о которых стыдно не знать мужчине 10 самых ярких Ferrari, о которых стыдно не знать мужчине

Изучаем культовую и самую дорогую продукцию Ferrari

Maxim
Александр Аузан: В России «две страны в одной» Александр Аузан: В России «две страны в одной»

Что «зашито» в культурном коде россиян

СНОБ
Глубокий вдох Глубокий вдох

Какую пользу приносит дыхательная гимнастика?

Лиза
Поднять тонус в теле Поднять тонус в теле

Каких ошибок избегать, чтобы с сексом не возникало проблем?

Psychologies
Колумбия будет стерилизовать «кокаиновых» бегемотов Колумбия будет стерилизовать «кокаиновых» бегемотов

Когда Пабло Эскобар завел бегемотов, он не ожидал, что им понравится Колумбия

ТехИнсайдер
Как выбрать и ухаживать за экошубой, чтобы она выглядела Как выбрать и ухаживать за экошубой, чтобы она выглядела

По каким критериям выбирать искусственную шубу и как потом за ней ухаживать?

VOICE
Хичкок на кухне Хичкок на кухне

«Точка кипения»: спин-офф кулинарного триллера

Weekend
Энергия вулкана Энергия вулкана

Obsidian — первая суперъяхта, которую Feadship передала заказчику в 2023 году

Y Magazine
Куда уходит энергия? Куда уходит энергия?

Где же наша бодрость? Почему мы поддерживаем режим дня, но сил не хватает?

Psychologies
Как отмыть руки после чистки грибов: 5 проверенных методов Как отмыть руки после чистки грибов: 5 проверенных методов

Что тогда делать с образовавшими темными и жирными пятнами на руках от грибов?

ТехИнсайдер
«Возгонка эмоций приводит к тому, что приходится постоянно повышать дозу проклятий» «Возгонка эмоций приводит к тому, что приходится постоянно повышать дозу проклятий»

Об отторжении пафоса в русской культуре и о моментах, когда пафос уместен

Weekend
Заносить перо в рану Заносить перо в рану

Альбер Лондр — классик французской расследовательской журналистики

Дилетант
Как и когда шимпанзе ловят термитов на удочку Как и когда шимпанзе ловят термитов на удочку

Есть ли связь между доступностью термитов и тем, когда шимпанзе их ловят?

ТехИнсайдер
«Откуда берутся дети? Краткий путеводитель по переходу из лагеря чайлдфри к тихим радостям семейственности» «Откуда берутся дети? Краткий путеводитель по переходу из лагеря чайлдфри к тихим радостям семейственности»

Как во время беременности работает иммунитет

N+1
С чистого листа. 5 главных песен Джона Леннона С чистого листа. 5 главных песен Джона Леннона

Рассматриваем биографию Джона Леннона через 5 его главных песен

СНОБ
Открыть в приложении