Что происходит с системами распознавания текстов и документов сегодня

ТехИнсайдерHi-Tech

Как появилась технология распознавания текста: функция в смартфоне, благодаря которой мы забыли про ручной ввод

Unsplash

Первые программные продукты на базе технологий распознавания текста, они же OCR, появились в России ровно 30 лет назад. Их развитие ознаменовалось крайне интересным противостоянием разработчиков. В этой гонке систем распознавания участвовала, с одной стороны, группа выпускников МФТИ, а с другой – команда советских ученых. Чем закончилась эта битва и что происходит с системами распознавания документов сегодня, в эпоху нейросетей и искусственного интеллекта – читайте в материале.

Первые шаги на пути «OCRизации»

Сегодня технологии распознавания символов являются неотъемлемой частью нашей действительности. Фотографируете листок с текстом, чтобы перевести его на другой язык с помощью онлайн-переводчика? Это OCR. Сканируете номер телефона, чтобы расплатиться за покупку? Тоже OCR. Получаете штраф за превышение скорости? Тут, кстати, тоже виновата OCR. Именно она обнаружила и распознала номер вашего автомобиля. Благодаря OCR человеку не приходится перепечатывать сотни и тысячи строк вручную, это вместо него делает искусственный интеллект. Технологии распознавания помогают нам быстрее проходить паспортный контроль в аэропортах, быстрее покупать билеты на электрички и поезда, заселяться в гостиницы, проходить идентификацию в банках для открытия счета, получать сим-карты. И все это для нас – данность, не более того. А вот в прошлом столетии решение проблемы автоматического ввода данных выглядело настоящим испытанием. В 1932 году, то есть почти сто лет назад, отечественный инженер В.Е. Агапов предпринял первые шаги на пути создания алгоритмов распознавания. Он разработал и представил машину, которая предназначалась для ввода цифр в счетное устройство. Задача распознавания решалась простейшим методом – путем сравнения с набором “эталонов”. По сути, символу присваивалось значение той цифры, которую она визуально напоминала больше всего.

Ситуация изменилась только к концу 80-х–началу 90-х годов, и обусловлено это было двумя факторами. 

  1. Во-первых, появились персональные компьютеры, которые обладали достаточной вычислительной мощностью для решения по-настоящему сложных задач.
  2. И, во-вторых, появились сканеры, с помощью которых можно было с большой скоростью вводить в компьютер неограниченное количество изображений текстов. 

Тогда же в России принялись разрабатывать первые программы распознавания текста OCR (Optical Character Recognition). Причем одновременно решать эту задачу принялись в двух местах – в лаборатории искусственного интеллекта Института системного анализа Российской академии наук (ИСА РАН) и в общежитии Московского физико-технического института (МФТИ). 

Приключения шахматного короля, или история про укрощение тигра

Переместимся сперва в Институт системного анализа РАН. Там разработку первой коммерческой OCR в конце 80-х возглавил Владимир Арлазаров, доктор технических наук, пионер в области искусственного интеллекта и всемирно известный ученый. 

К тому моменту он уже имел колоссальный опыт в решении интеллектуальных задач, таких как разработка операционных и информационных систем, СУБД, создание шахматных программ. 

Так, именно Арлазаров вместе со своей командой создал шахматную программу «Каисса», получившую название в честь вымышленной богини шахмат и ставшую первым чемпионом мира по шахматам среди шахматных программ (1974). Он был одним из авторов теоремы «четырех русских». «Советский Microsoft» СУБД ИНЕС», которую в Советском Союзе использовали одновременно несколько тысяч предприятий – кстати, тоже достижение команды Владимира Львовича.

Владимир Львович Арлазаров (слева)
Владимир Львович Арлазаров (слева). Институт системного анализа РАН

На рубеже восьмого и девятого десятилетий прошлого века команда Арлазарова получила запрос от общества слепых – сделать технологию, которая позволяла бы оцифровывать книги, чтобы впоследствии переводить их на шрифт Брайля. Одновременно с этим поступил еще один заказ – от издательства «Художественная литература, занимавшегося в то время исключительно переизданием книг. Необходимо было создать OCR, с помощью которой можно было бы оцифровывать старые книги.  

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Неожиданное преимущество веганства для женщин Неожиданное преимущество веганства для женщин

Растительная диета полезна для поддержания здоровья в долгосрочной перспективе

ТехИнсайдер
О чем молчат желания О чем молчат желания

Что делать, если желания партнера не совпадают с нашими?

Psychologies
Обновления нарочно ломают наши телефоны и еще 9 мифов о гаджетах Обновления нарочно ломают наши телефоны и еще 9 мифов о гаджетах

10 самых распространенных мифов об электронных устройствах

Maxim
Гибкий график работы может «омолодить» сердце на 10 лет Гибкий график работы может «омолодить» сердце на 10 лет

Как график работы влияет на здоровье сердца?

ТехИнсайдер
Нация умных людей Нация умных людей

История израильского экономического чуда

kiozk originals
«Женщину хотят и презирают одновременно»: почему мужчины не переносят отказ в сексе «Женщину хотят и презирают одновременно»: почему мужчины не переносят отказ в сексе

Отрывок из книги «Секс в эпоху согласия»

Psychologies
В Британии нашли любовные письма, написанные в XVIII веке плененным французским морякам. Они похожи на современные переписки в WhatsApp В Британии нашли любовные письма, написанные в XVIII веке плененным французским морякам. Они похожи на современные переписки в WhatsApp

О чем писали люди XVIII века в любовных письмах?

Правила жизни
Какую цену вы платите, работая на токсичного босса: 4 серьезных последствия Какую цену вы платите, работая на токсичного босса: 4 серьезных последствия

Как токсичные начальники вредят отдельным сотрудникам и компаниям в целом

Psychologies
«Картинки в голове: И другие рассказы о моей жизни с аутизмом» «Картинки в голове: И другие рассказы о моей жизни с аутизмом»

Как лекарства облегчают жизнь людям с РАС

N+1
Улицы волшебных фонарей Улицы волшебных фонарей

«Волшебный участок»: милицейская сказка

Weekend
«Нас взяли в оборот ушлые рекламщики»: Энцо Феррари об экономике автомобильных гонок «Нас взяли в оборот ушлые рекламщики»: Энцо Феррари об экономике автомобильных гонок

Глава из автобиографии Энцо Феррари «Мои ужасные радости»

Forbes
Умный нос Умный нос

«Электронный нос» поможет избежать вредных примесей в упаковке

Наука
Отпусти и забудь Отпусти и забудь

5 советов, которые помогут восстановиться после развода

Лиза
Сахарские странники – аддаксы Сахарские странники – аддаксы

Аддаксы – одно из наиболее редких млекопитающих в мире

Знание – сила
«Пережитки большой войны» «Пережитки большой войны»

Как опыт XX века изменил восприятие вооруженных конфликтов

N+1
На полярном круге На полярном круге

Вы будете очарованы белоснежной зимой и северным сиянием Салехарда

Отдых в России
Правильный счет: можно ли доверять скидкам в «черную пятницу»? Правильный счет: можно ли доверять скидкам в «черную пятницу»?

Какие маркетинговые приемы работают в «черную пятницу»

Правила жизни
Наталия Сирадзе о Савелии Крамарове Наталия Сирадзе о Савелии Крамарове

Вдова Савелия Крамарова Наталия Сирадзе вспоминает о его жизни и творчестве

Коллекция. Караван историй
Немного о жизни звезд Немного о жизни звезд

Как ведется классификация звезд

Наука и техника
В одну черную, черную пятницу… В одну черную, черную пятницу…

Что такое синдром упущенной выгоды и как нас заставляют покупать ненужное

Лиза
Природное джакузи посреди снегов: термальные источники России Природное джакузи посреди снегов: термальные источники России

Курорты, где можно искупаться в теплой воде с лечебным минеральным составом

Караван историй
Рабочий вариант Рабочий вариант

Изначально Sollers Atlant – это китайский малотоннажник Sunray

Автопилот
Как выбрать и ухаживать за экошубой, чтобы она выглядела Как выбрать и ухаживать за экошубой, чтобы она выглядела

По каким критериям выбирать искусственную шубу и как потом за ней ухаживать?

VOICE
Всего две точки над «е»: приключения одной буквы Всего две точки над «е»: приключения одной буквы

Как и откуда взялась буква Ё?

Знание – сила
Интеллектуальная проходимость Интеллектуальная проходимость

Как электроника увеличивает внедорожные возможности машины

ТехИнсайдер
Мир сходит с ума от сериала «Удивительный цифровой цирк»: чем он покоряет зрителей Мир сходит с ума от сериала «Удивительный цифровой цирк»: чем он покоряет зрителей

В чем феномен моментального успеха «Удивительного цифрового цирка»

Psychologies
10 красивых пород кошек черно-белого окраса 10 красивых пород кошек черно-белого окраса

Хотите себе «смокинговую» кошку? Обратите внимание на эти породы

VOICE
6 вопросов, чтобы решиться на разрыв отношений с родственником 6 вопросов, чтобы решиться на разрыв отношений с родственником

Несколько подсказок тем, кто хочет прекратить отношения с близким

Psychologies
Плюсы и минусы 5 способов эпиляции, которые помогут вам сделать выбор Плюсы и минусы 5 способов эпиляции, которые помогут вам сделать выбор

Выбираете между несколькими видами избавления от нежелательных волос?

Psychologies
Развлечение из детства с жуткой историей: когда придумали телефон из стаканчиков и нити и как он работает Развлечение из детства с жуткой историей: когда придумали телефон из стаканчиков и нити и как он работает

Многих на протяжении детства волновал вопрос, как работают ниточные телефоны

ТехИнсайдер
Открыть в приложении