Как зародился машинный перевод?

ТехИнсайдерHi-Tech

Как компьютеры научились переводить: от «языкового ковчега» до «электронного мозга»

cf83aa84b5c239d0da74565337d0827e_ce_1200x800x0x0.jpg

Каждый из нас хоть раз пользовался онлайн-переводчиком. Возможность в любое время дня и ночи даром переводить тексты, даже не зная иностранных языков, больше не кажется нам чудом. Но всего 70 лет назад никакого машинного перевода не было, а саму идею многие восприняли в штыки. Все изменилось 7 января 1954 года, когда Джорджтаунский университет и компания IBM продемонстрировали компьютер, умеющий переводить. Вспоминаем, как зародился машинный перевод вместе с сотрудником факультета компьютерных наук НИУ ВШЭ Антоном Басовым.

Машинный перевод… до машин

Перевод появился тогда же, когда появился язык. А машинный перевод? Должно быть, не раньше, чем были созданы компьютеры? И да, и нет. Машинный перевод действительно появился только вместе с компьютерами, но его предыстория начинается намного раньше.

История машинного перевода восходит к девятому веку, когда арабский ученый и «отец арабской философии» Аль-Кинди предложил взламывать шифры с помощью частотного анализа текста, то есть сравнивать частоту употребления букв в обычном языке с частотой употребления символов в шифровке. Так Аль-Кинди заложил основы криптографии, которая, как мы увидим дальше, неразрывно связана с машинным переводом.

Другим истоком машинного перевода стали работы по созданию универсального языка. В таком языке каждому слову соответствовало бы только одно понятие. В отличие от естественных языков, универсальный язык был бы лишен двусмысленностей, а поэтому недопонимание между людьми, говорящими на нем, было бы невозможно. Впервые идею такого языка выдвинул великий Рене Декарт.

Усилия по созданию универсального языка ни к чему не привели — все языки оказывались слишком сложными и недостаточно точными. Однако некоторые ученые пошли дальше и стали создавать системы, позволяющие общаться носителям разных языков. Такую систему описал в 1663 году ученый-иезуит Афанасий Кирхер. Он придумал ее после разговора с императором Священной Римской империи Фердинандом III. В империю входило множество стран с разными языками, поэтому межъязыковое общение играло важную роль.

В системе Кирхера каждому понятию соответствовал номер. В словаре под этим номером можно было найти слова пяти языков (латинского, французского, немецкого, итальянского и испанского), соответствующие данному понятию. Зная только один из этих языков, человек мог, пользуясь пронумерованным списком понятий, переводить текст на любой другой язык.Физическим воплощением системы стал «языковой ковчег» (Arca Glottotactica), в котором многоязычный словарь размещался на отдельных дощечках, которые можно было располагать в нужном порядке. Впрочем, ни система Кирхера, ни системы его современников Кейва Бека и Иоганна Бехера не снискали успеха — они были слишком несовершенны и недостаточно помогали процессу перевода.

22c23f3330294985869eb7b2bc4d300e.png
Языковой ковчег Афанасия Кирхера. Журнал Isis

Механические переводчики

Идея упрощения перевода с помощью механических устройств оказалась забыта вместе с идеей универсального языка — переводчики справлялись сами. Однако к 1930-м годам поток информации на разных языках стал увеличиваться. Благодаря телеграфу, телефону и радио информация распространялась быстрее. Распространение грамотности и увеличение выпуска журналов и газет привело к тому, что ее потребителей стало больше. И хотя переводчики все еще могли справиться сами, уже возникла идея механизации перевода.

К 1930-м годам техника проделала большой путь от «языкового ковчега» Кирхера. Появилась электротехника и электроника. Машины научились управлять дорожным движением, зажигать прожектора на аэродроме при приближении самолета, поддерживать курс корабля, печь хлеб и собирать автомобили. В распоряжении изобретателей оказались реле, моторы, радиолампы и фотоэлементы. И к 1935 году два изобретателя независимо друг от друга запатентовали механизмы для перевода.

Георгий (он же Жорж) Арцруни родился в Армении в 1893 году. Он изучал инженерию в Петрограде, а в 1922 году эмигрировал во Францию. С 1929 года он работал над машиной, которую называл «механический мозг» (cerveau mécanique). Это устройство предназначалось для хранения и поиска информации — сегодня мы бы назвали его поисковиком. Среди возможных применений своей машины Арцруни перечислял составление телефонных справочников и железнодорожных расписаний, печать билетов, шифрование — и перевод.

1671911d0b55bda5f99a96e0ee44776a.png
«Механический мозг» Георгия Арцруни. CafeTran

Памятью машины служила бумажная лента, на которой, как в системе Кирхера, записывались слова на разных языках. На одной строке находились слова, соответствующие одному понятию. Параллельно первой ленте шла вторая, на которой каждому понятию соответствовала определенная группа отверстий. Искомое слово вводилось в машину с помощью клавиатуры и кодировалось набором штырьков. Затем запускался мотор, и машина сравнивала наборы отверстий на второй ленте с расположением штырьков. Когда обнаруживалось совпадение, машина останавливалась, показывая в окошках слова с первой ленты.

Арцруни запатентовал свою машину в 1935 году. В 1937 году на всемирной выставке в Париже машина была отмечена дипломом. Несколько государственных ведомств — почта, железные дороги, министерство обороны — заключили с Арцруни контракты на разработку машин, однако Вторая мировая война и оккупация Франции помешали им осуществиться. Появление электронных компьютеров поставило крест на работе Арцруни — «механический мозг» проигрывал «электронному».

В том же 1935 году советский патент на «машину для подбора и печатания слов при переводе с одного языка на другой» получил Петр Смирнов-Троянский. Его судьба очень похожа на судьбу Арцруни — он родился в 1894 году, учился в Санкт-Петербургском университете; историки даже предполагают, что Смирнов-Троянский и Арцруни могли знать друг друга (хотя подтверждений этого нет). После революции Троянский учился в Институте красной профессуры, участвовал в составлении Большой советской и Технической энциклопедий.

Машина Троянского представляла собой наклонный стол, на котором располагалась уже привычная нам бумажная лента с многоязычным словарем. Перед столом находился фотоаппарат и пишущая машинка. Ленту со словарем вручную протягивали до нужного слова и фотографировали его. Одновременно — и в этом самое важное отличие машины Троянского от механического словаря Арцруни — на пишущей машинке печатали особые знаки, описывающие морфологические признаки слова (число, род и так далее).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Восстание из пепла: публичные личности, которым удалось реабилитировать свою карьеру Восстание из пепла: публичные личности, которым удалось реабилитировать свою карьеру

Каким публичным личностям удавалось вернуть себе былой успех после провала?

ТехИнсайдер
«И вот она нарядная на праздник к нам пришла»: кто и как придумал украшать новогоднюю елку игрушками? «И вот она нарядная на праздник к нам пришла»: кто и как придумал украшать новогоднюю елку игрушками?

Откуда появилась такая традиция — вешать на ветви дерева украшения?

ТехИнсайдер
Что нужно помнить о DDoS-атаках и как от них защититься? Объясняет эксперт! Что нужно помнить о DDoS-атаках и как от них защититься? Объясняет эксперт!

DDoS-атаки — орудие самых злостных хакеров. Как защитить свои устройства?

ТехИнсайдер
Осторожно, опасное саморазвитие: как распознать некачественный тренинг личностного роста — 5 признаков Осторожно, опасное саморазвитие: как распознать некачественный тренинг личностного роста — 5 признаков

Какие подводные камни могут ожидать на пути самосовершенствования?

Psychologies
ИП или ООО — вот в чем вопрос: какую форму ведения деятельности выбрать МСП ИП или ООО — вот в чем вопрос: какую форму ведения деятельности выбрать МСП

ИП и ООО: чем отличаются и какая форма ведения бизнеса подойдет именно вам?

Inc.
Отдыхая отдыхай Отдыхая отдыхай

Почему так тяжело отпустить работу и погрузиться в сладкое ничегонеделание?

Новый очаг
Россия без мяса. Часть 2. Как вегетарианцы поругались из-за клопов и встретили революцию Россия без мяса. Часть 2. Как вегетарианцы поругались из-за клопов и встретили революцию

Как вегетарианцам удалось сделать свою кухню популярной в Российской империи

СНОБ
Почему человеку нравятся кошки Почему человеку нравятся кошки

Задумывались ли вы когда-нибудь, почему именно нам нравятся коты?

ТехИнсайдер
Болит спина от сидячей работы: что нужно сделать, чтобы почувствовать себя лучше уже завтра Болит спина от сидячей работы: что нужно сделать, чтобы почувствовать себя лучше уже завтра

Как помочь себе и своей спине, если весь день проводишь сидя?

VOICE
Как не сесть в лужу и выйти из сложной ситуации путем импровизации Как не сесть в лужу и выйти из сложной ситуации путем импровизации

Как во время выступления импровизация может помочь вам

Inc.
5 тайн «Моны Лизы», которые не раскрыты до сих пор 5 тайн «Моны Лизы», которые не раскрыты до сих пор

Ряд загадочных вопросов, ответы на которые «Мона Лиза» не готова раскрыть

ТехИнсайдер
Трезвый взгляд Трезвый взгляд

История девушки, которой удалось победить алкоголизм

VOICE
Его глаза: как найти и потерять мужа в отеле Его глаза: как найти и потерять мужа в отеле

Гостья отеля была уверена, что живет с бывшим мужем, но все оказалось иначе

Правила жизни
Как ученые воссоздают внешность древних людей: 10 невероятно реалистичных фотографий Как ученые воссоздают внешность древних людей: 10 невероятно реалистичных фотографий

Как выглядели наши предки?

ТехИнсайдер
Как привести в порядок пищевые привычки: советы диетолога Как привести в порядок пищевые привычки: советы диетолога

Как понять, что наш рацион изменился в худшую сторону?

Psychologies
Не дороже Lada Largus. Пять оригинальных моделей для большой семьи Не дороже Lada Largus. Пять оригинальных моделей для большой семьи

Toyota, Honda, Hyundai и другие — посмотрите на конкурентов Lada Largus

РБК
Работники-беспилотники: дроны на службе нефтегазовых компаний Работники-беспилотники: дроны на службе нефтегазовых компаний

Как БПЛА обеспечивают безопасность сотрудников и окружающей среды

ТехИнсайдер
Права эмбрионов: нужно ли защищать клетки в пробирке и как поступают в других странах Права эмбрионов: нужно ли защищать клетки в пробирке и как поступают в других странах

Зачем в 2022 году в России вдруг потребовалось защищать клетки в пробирке

Forbes
Невероятные факты об утконосах. Вы поразитесь! Невероятные факты об утконосах. Вы поразитесь!

Утконосы не только причудливо выглядят, но и живут не самую очевидную жизнь

ТехИнсайдер
5 умопомрачительных фильмов, которые мы отказываемся когда-либо пересматривать 5 умопомрачительных фильмов, которые мы отказываемся когда-либо пересматривать

Фильмы, которые ты захочешь посмотреть, но пересматривать — никогда

VOICE
Мексиканские маски смерти, полная Луна и гламурный Островский. Интервью с режиссером Данилом Чащиным Мексиканские маски смерти, полная Луна и гламурный Островский. Интервью с режиссером Данилом Чащиным

Режиссер Данил Чащин рассказал о том, могут ли спасти брак жестокие игры

СНОБ
Как перестать злиться на бывшего: 3 простых шага — следуйте нашей инструкции Как перестать злиться на бывшего: 3 простых шага — следуйте нашей инструкции

Как научиться контролировать эмоции?

Psychologies
15 вопросов, которые помогут подвести итоги года, — сделайте правильные выводы 15 вопросов, которые помогут подвести итоги года, — сделайте правильные выводы

Пятнадцать вопросов, которые помогают подвести итоги года

Psychologies
3 ошибки в поисках счастья, которые нельзя совершать 3 ошибки в поисках счастья, которые нельзя совершать

О же чем нужно помнить, пытаясь построить счастливую жизнь?

Psychologies
Избегайте этих 5 пассивно-агрессивных фраз, которые больше всего раздражают людей Избегайте этих 5 пассивно-агрессивных фраз, которые больше всего раздражают людей

Человек далеко не всегда выражает пассивную агрессию намерено

Inc.
Побеждать как Геракл: как читать мифы с пользой для психики Побеждать как Геракл: как читать мифы с пользой для психики

Древние мифы писались не для детей

Psychologies
Наташа Власова: «После развода я с наслаждением открыла для себя целый мир и себя в нём» Наташа Власова: «После развода я с наслаждением открыла для себя целый мир и себя в нём»

Наташа Власова откровенно рассказала о браке, потере себя и новой жизни

Здоровье
Лишняя деталь: можно ли отказаться от ремня ГРМ в двигателе? Лишняя деталь: можно ли отказаться от ремня ГРМ в двигателе?

Газораспределительный механизм — неотъемлемая часть любого поршневого двигателя

ТехИнсайдер
Пряное золото дураков: как подделывают специи на Рождество и Новый Год Пряное золото дураков: как подделывают специи на Рождество и Новый Год

А вы уверены, что купленные специи — настоящие?

ТехИнсайдер
Самые дорогие королевские роды: Меган Маркл потратила больше, чем Кейт Миддлтон Самые дорогие королевские роды: Меган Маркл потратила больше, чем Кейт Миддлтон

Стоимости родов Меган Маркл, Кейт Миддлтон и других монарших особ

VOICE
Открыть в приложении