Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Пушистые герои: реальные истории о кошках, которые спасли жизнь людям Пушистые герои: реальные истории о кошках, которые спасли жизнь людям

Реальные случаи, когда кошкам удалось спасти жизнь людям

ТехИнсайдер
«Мы поцеловались первый раз в кадре» «Мы поцеловались первый раз в кадре»

Актеры Анастасия Талызина и Сергей Новосад — о судьбоносных съемках и везении

OK!
Кофе и нейросети: какую роль играет ИИ в привлечении зумеров при кадровом дефиците Кофе и нейросети: какую роль играет ИИ в привлечении зумеров при кадровом дефиците

Как в борьбе за таланты генеративный ИИ становится ключевым инструментом

Forbes
Креативная Вселенная Креативная Вселенная

Как прошел и чем завершился студенческий конкурс дизайна Omoda

Автопилот
Это не то,что вы подумали: страпонтен, клитория, епитрахиль — слова, за которые вам не должно быть стыдно Это не то,что вы подумали: страпонтен, клитория, епитрахиль — слова, за которые вам не должно быть стыдно

О словах, за которые вам не должно быть стыдно, пусть и звучат они забавно

ТехИнсайдер
Планета номер Икс Планета номер Икс

Гипотетическую девятую планету до сих пор не увидели ни в один телескоп

ТехИнсайдер
Насморк Насморк

Нос стал хуже дышать. Обычно это никого не пугает. И зря

Здоровье
Проверка связи: почему так важно регулярно проходить полные медицинские обследования Проверка связи: почему так важно регулярно проходить полные медицинские обследования

Как остановить время с помощью простых — и не очень — обследований

Forbes
Тонкая допросная линия Тонкая допросная линия

«Голубиный туннель»: фильм Эррола Морриса о Джоне Ле Карре

Weekend
Кто вы из «Секса в большом городе»? Ученый разделил женщин-одиночек на 4 типа Кто вы из «Секса в большом городе»? Ученый разделил женщин-одиночек на 4 типа

Вы Кэрри, Саманта, Шарлотта или Миранда?

Psychologies
Анна Кранк Анна Кранк

Анна Кранк — о розовых пони, боксе и русском национальном феминизме

Собака.ru
«Наши мастера не уступают мировым производителям»: Олег Клодт о рынке архитектуры «Наши мастера не уступают мировым производителям»: Олег Клодт о рынке архитектуры

Архитектор Олег Клодт — о том, чем отличается девелопмент в России и на Западе?

Forbes
10 цитат Петра Ганнушкина, которые позволят проверить, не психопат ли вы 10 цитат Петра Ганнушкина, которые позволят проверить, не психопат ли вы

К каким выводам о человеке пришел один из родоначальников российской психиатрии

Psychologies
«Я не видел, но лампочку поменяйте». Как пройти техосмотр — личный опыт «Я не видел, но лампочку поменяйте». Как пройти техосмотр — личный опыт

Насколько сложно пройти техосмотр?

РБК
Пришло время платить Пришло время платить

Какие налоги надо платить и как проверить, есть ли долги

Лиза
Бензин вместо дизеля. Что будет, если заправить автомобиль не тем топливом Бензин вместо дизеля. Что будет, если заправить автомобиль не тем топливом

Что нужно делать, если вы залили в бензобак дизельное топливо?

4x4 Club
Мы выяснили, что такое — «Москвич 6». Это точно «китаец»? Мы выяснили, что такое — «Москвич 6». Это точно «китаец»?

Может ли «Москвич 6» в чем-то обставить своих земляков или это еще один китаец

РБК
Червь Морриса: как 35 лет назад любопытный студент чуть не погубил Интернет Червь Морриса: как 35 лет назад любопытный студент чуть не погубил Интернет

Это один из первых компьютерных вирусов, парализовавший почти все США

ТехИнсайдер
Суровый режиссер Майкл Манн рассказывает про свой новый «Феррари», так зовется его новый фильм Суровый режиссер Майкл Манн рассказывает про свой новый «Феррари», так зовется его новый фильм

Интервью с человеком, который снял «Схватку», «Полицию Майами» и «Соучастника»

Maxim
Глупые истории с татуировками: рассказываем, как не надо Глупые истории с татуировками: рассказываем, как не надо

Поучительные истории про татуировки

Maxim
Как увеличить словарный запас: лучшие методики от филологов и лингвистов Как увеличить словарный запас: лучшие методики от филологов и лингвистов

Какие способы помогут расширить лексикон и улучшить речь

Forbes
Не просто игра Не просто игра

Учёные доказали, что настольные игры помогают развить математические способности

Здоровье
Удар шведкой Удар шведкой

Ищем Скандинавию в китайском кроссовере Geely Monjaro

Автопилот
«Картинки в голове: И другие рассказы о моей жизни с аутизмом» «Картинки в голове: И другие рассказы о моей жизни с аутизмом»

Как лекарства облегчают жизнь людям с РАС

N+1
Психологи рассказали, почему нельзя задавать детям вопрос «Как дела в школе?» Психологи рассказали, почему нельзя задавать детям вопрос «Как дела в школе?»

Как спросить ребенка о его прошедшем дне, чтобы он дал честный ответ?

Inc.
Куда уходит энергия? Куда уходит энергия?

Где же наша бодрость? Почему мы поддерживаем режим дня, но сил не хватает?

Psychologies
Cупермедведь Cупермедведь

Как Джон Полсон заработал миллиарды на неплатежах по ипотеке

Деньги
Критикан высокой кухни Критикан высокой кухни

«Ничего»: гурманский кулинарный сериал

Weekend
Пропаганда насилия и кража образа Линдси Лохан. В чем обвиняли создателей GTA Пропаганда насилия и кража образа Линдси Лохан. В чем обвиняли создателей GTA

Скандалы вокруг серии игр Grand Theft Auto

СНОБ
Объединяй и властвуй Объединяй и властвуй

Блогосфера сегодня завоевала большую аудиторию, распространилась на все сферы

OK!
Открыть в приложении