Как зародился машинный перевод?

ТехИнсайдерHi-Tech

Как компьютеры научились переводить: от «языкового ковчега» до «электронного мозга»

cf83aa84b5c239d0da74565337d0827e_ce_1200x800x0x0.jpg

Каждый из нас хоть раз пользовался онлайн-переводчиком. Возможность в любое время дня и ночи даром переводить тексты, даже не зная иностранных языков, больше не кажется нам чудом. Но всего 70 лет назад никакого машинного перевода не было, а саму идею многие восприняли в штыки. Все изменилось 7 января 1954 года, когда Джорджтаунский университет и компания IBM продемонстрировали компьютер, умеющий переводить. Вспоминаем, как зародился машинный перевод вместе с сотрудником факультета компьютерных наук НИУ ВШЭ Антоном Басовым.

Машинный перевод… до машин

Перевод появился тогда же, когда появился язык. А машинный перевод? Должно быть, не раньше, чем были созданы компьютеры? И да, и нет. Машинный перевод действительно появился только вместе с компьютерами, но его предыстория начинается намного раньше.

История машинного перевода восходит к девятому веку, когда арабский ученый и «отец арабской философии» Аль-Кинди предложил взламывать шифры с помощью частотного анализа текста, то есть сравнивать частоту употребления букв в обычном языке с частотой употребления символов в шифровке. Так Аль-Кинди заложил основы криптографии, которая, как мы увидим дальше, неразрывно связана с машинным переводом.

Другим истоком машинного перевода стали работы по созданию универсального языка. В таком языке каждому слову соответствовало бы только одно понятие. В отличие от естественных языков, универсальный язык был бы лишен двусмысленностей, а поэтому недопонимание между людьми, говорящими на нем, было бы невозможно. Впервые идею такого языка выдвинул великий Рене Декарт.

Усилия по созданию универсального языка ни к чему не привели — все языки оказывались слишком сложными и недостаточно точными. Однако некоторые ученые пошли дальше и стали создавать системы, позволяющие общаться носителям разных языков. Такую систему описал в 1663 году ученый-иезуит Афанасий Кирхер. Он придумал ее после разговора с императором Священной Римской империи Фердинандом III. В империю входило множество стран с разными языками, поэтому межъязыковое общение играло важную роль.

В системе Кирхера каждому понятию соответствовал номер. В словаре под этим номером можно было найти слова пяти языков (латинского, французского, немецкого, итальянского и испанского), соответствующие данному понятию. Зная только один из этих языков, человек мог, пользуясь пронумерованным списком понятий, переводить текст на любой другой язык.Физическим воплощением системы стал «языковой ковчег» (Arca Glottotactica), в котором многоязычный словарь размещался на отдельных дощечках, которые можно было располагать в нужном порядке. Впрочем, ни система Кирхера, ни системы его современников Кейва Бека и Иоганна Бехера не снискали успеха — они были слишком несовершенны и недостаточно помогали процессу перевода.

22c23f3330294985869eb7b2bc4d300e.png
Языковой ковчег Афанасия Кирхера. Журнал Isis

Механические переводчики

Идея упрощения перевода с помощью механических устройств оказалась забыта вместе с идеей универсального языка — переводчики справлялись сами. Однако к 1930-м годам поток информации на разных языках стал увеличиваться. Благодаря телеграфу, телефону и радио информация распространялась быстрее. Распространение грамотности и увеличение выпуска журналов и газет привело к тому, что ее потребителей стало больше. И хотя переводчики все еще могли справиться сами, уже возникла идея механизации перевода.

К 1930-м годам техника проделала большой путь от «языкового ковчега» Кирхера. Появилась электротехника и электроника. Машины научились управлять дорожным движением, зажигать прожектора на аэродроме при приближении самолета, поддерживать курс корабля, печь хлеб и собирать автомобили. В распоряжении изобретателей оказались реле, моторы, радиолампы и фотоэлементы. И к 1935 году два изобретателя независимо друг от друга запатентовали механизмы для перевода.

Георгий (он же Жорж) Арцруни родился в Армении в 1893 году. Он изучал инженерию в Петрограде, а в 1922 году эмигрировал во Францию. С 1929 года он работал над машиной, которую называл «механический мозг» (cerveau mécanique). Это устройство предназначалось для хранения и поиска информации — сегодня мы бы назвали его поисковиком. Среди возможных применений своей машины Арцруни перечислял составление телефонных справочников и железнодорожных расписаний, печать билетов, шифрование — и перевод.

1671911d0b55bda5f99a96e0ee44776a.png
«Механический мозг» Георгия Арцруни. CafeTran

Памятью машины служила бумажная лента, на которой, как в системе Кирхера, записывались слова на разных языках. На одной строке находились слова, соответствующие одному понятию. Параллельно первой ленте шла вторая, на которой каждому понятию соответствовала определенная группа отверстий. Искомое слово вводилось в машину с помощью клавиатуры и кодировалось набором штырьков. Затем запускался мотор, и машина сравнивала наборы отверстий на второй ленте с расположением штырьков. Когда обнаруживалось совпадение, машина останавливалась, показывая в окошках слова с первой ленты.

Арцруни запатентовал свою машину в 1935 году. В 1937 году на всемирной выставке в Париже машина была отмечена дипломом. Несколько государственных ведомств — почта, железные дороги, министерство обороны — заключили с Арцруни контракты на разработку машин, однако Вторая мировая война и оккупация Франции помешали им осуществиться. Появление электронных компьютеров поставило крест на работе Арцруни — «механический мозг» проигрывал «электронному».

В том же 1935 году советский патент на «машину для подбора и печатания слов при переводе с одного языка на другой» получил Петр Смирнов-Троянский. Его судьба очень похожа на судьбу Арцруни — он родился в 1894 году, учился в Санкт-Петербургском университете; историки даже предполагают, что Смирнов-Троянский и Арцруни могли знать друг друга (хотя подтверждений этого нет). После революции Троянский учился в Институте красной профессуры, участвовал в составлении Большой советской и Технической энциклопедий.

Машина Троянского представляла собой наклонный стол, на котором располагалась уже привычная нам бумажная лента с многоязычным словарем. Перед столом находился фотоаппарат и пишущая машинка. Ленту со словарем вручную протягивали до нужного слова и фотографировали его. Одновременно — и в этом самое важное отличие машины Троянского от механического словаря Арцруни — на пишущей машинке печатали особые знаки, описывающие морфологические признаки слова (число, род и так далее).

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Впервые в лаборатории воссоздана нервная цепь человеческой боли Впервые в лаборатории воссоздана нервная цепь человеческой боли

Ученые воспроизвели важный нервный путь, из-за которого человек чувствует боль

ТехИнсайдер
Ольга Донцова: самая большая продолжительность жизни — у академиков Ольга Донцова: самая большая продолжительность жизни — у академиков

Академик Ольга Донцова — об антибиотиках и вирусах

Наука
LoveGPT: как искусственный интеллект меняет приложения для знакомств и сферу отношений LoveGPT: как искусственный интеллект меняет приложения для знакомств и сферу отношений

AI уже добрался до человеческих отношений, но пока не установил власть над ними

СНОБ
Макияж «скатывается»? Визажисты объяснили, как это предотвратить Макияж «скатывается»? Визажисты объяснили, как это предотвратить

Тебе надоело, что базовый макияж «скатывается» или просто выглядит тусклым?

VOICE
Нерусская водка: какие бренды популярнее всего за рубежом Нерусская водка: какие бренды популярнее всего за рубежом

О самых популярных брендах иностранной «беленькой»

Maxim
Прекрасные и опасные: главные женщины Гая Ричи Прекрасные и опасные: главные женщины Гая Ричи

Холодные и притягательные — женщины фильмов Гая Ричи

VOICE
Осознанное потребление Осознанное потребление

Осознанное потребление стало одним из триггеров быстрого развития общества

Bones
5 типов артрита 5 типов артрита

Какие бывают виды артрита и что важно о них знать

Лиза
Амосова Амосова

Коллекционер Анна Амосова показывает, как сделать арт плюс фэшн в интерьере

Собака.ru
Пусто так. Эти машины могли изменить все, но так и не были выпущены Пусто так. Эти машины могли изменить все, но так и не были выпущены

Что такое vaporware и почему таких проектов становится все больше

РБК
Лучшие фантастические и фэнтезийные книги 2022 года Лучшие фантастические и фэнтезийные книги 2022 года

Топ книг 2022 года: фантастика и фэнтези

Maxim
Rasa: «Музыка — единственная вещь в жизни, которая приносит нам колоссальное удовольствие» Rasa: «Музыка — единственная вещь в жизни, которая приносит нам колоссальное удовольствие»

Даша и Витя Rasa начали громко и продолжили не менее круто

ЖАРА Magazine
Почему женская грудь так сильно привлекает мужчин? Вы не поверите! Почему женская грудь так сильно привлекает мужчин? Вы не поверите!

Гетеросексуальные мужчины с раннего возраста вырабатывают тягу к женской груди

ТехИнсайдер
Как птица с копьем в горле решила парадокс, над которым ученые спорили тысячелетиями, от Аристотеля и до начала XIX века Как птица с копьем в горле решила парадокс, над которым ученые спорили тысячелетиями, от Аристотеля и до начала XIX века

Как один аист прояснил картину миграции птиц

ТехИнсайдер
Возвращение «черных лебедей» Возвращение «черных лебедей»

Угрозы мировой экономике и финансовой системе в 2023 году

Деньги
Сермяжная готика Сермяжная готика

«Уэнсдей»: как Тим Бёртон предал семейку Аддамс

Weekend
Как полюбить зиму: 4 совета для волшебного настроения Как полюбить зиму: 4 совета для волшебного настроения

Советы, которые помогут вам полюбить темный и морозный сезон

Psychologies
Почему черные кошки приносят неудачу: история суеверия Почему черные кошки приносят неудачу: история суеверия

Откуда появилось суеверие “черный кот — к неудачам”

ТехИнсайдер
«Слово фюрера в каждый дом» «Слово фюрера в каждый дом»

Главным орудием нацистской пропаганды в Третьем рейхе было радио

Дилетант
Мозг на ручном управлении: как российские ученые придумали экзокисть, которой можно управлять силой мысли Мозг на ручном управлении: как российские ученые придумали экзокисть, которой можно управлять силой мысли

Как уникальная технология помогает людям после инсульта и с ДЦП двигать руками

ТехИнсайдер
Рост под санкциями Рост под санкциями

2022 год стал крайне сложным для экономики, но агросектор будет в плюсе

Агроинвестор
Режиссер Режиссер

Наконец-то мы узнаем, почему Роуз не помогла Джеку после крушения "Титаника"

ТехИнсайдер
Заграничные штучки Заграничные штучки

Как в разных странах люди готовят свои дома к Новому году?

Лиза
Вот одна из главных причин, почему человечество не может справиться с климатическим кризисом Вот одна из главных причин, почему человечество не может справиться с климатическим кризисом

Общество не научилось уделять достаточно внимания составлению учебников

ТехИнсайдер
Выпечка: сочетания без правил Выпечка: сочетания без правил

Сладкая выпечка — это история, понятная для всех

Bones
Парень с нашего двора Парень с нашего двора

Сергей Марин о собственном взрослении и двойственности своей натуры

OK!
Когда закончились сказки: 5 книг для увлекательного чтения вместе с детьми Когда закончились сказки: 5 книг для увлекательного чтения вместе с детьми

Собрали «растущую» библиотеку полезных книг для детей

ТехИнсайдер
Мощный подъем мантии на Марсе вызвал трещины коры Мощный подъем мантии на Марсе вызвал трещины коры

Тектоническое тепло может помочь сохранению и развитию жизни на Марсе

ТехИнсайдер
Продолжение истории о том, кто живет в вашей комнате Продолжение истории о том, кто живет в вашей комнате

Как работает теория ближнего и дальнего круга и может ли она помочь семье

СНОБ
Лаборатория лицом к морю Лаборатория лицом к морю

Как создавалась и как теперь работает Беломорская биостанция

Наука
Открыть в приложении