Искусственный интеллект подключили к чтению рукописей Петра Первого

ОгонёкHi-Tech

Машина допетрит

Новый проект отечественных ученых — расшифровка рукописей Петра Первого с помощью искусственного интеллекта. За необычной инициативой — новый тренд, когда современные технологии помогают разгадывать тайны прошлого

Материал подготовил Кирилл Журенков

У Петра Первого довольно своеобразный почерк (см. фото), однако для «компьютера» это, по идее, не проблема

О проекте расшифровки рукописного наследия Петра Первого стало известно на круглом столе… по технологическому лидерству, состоявшемуся под эгидой Российского исторического общества. Как давняя история связана с новейшими технологиями? Вот контекст: Петр оставил после себя 200 млн рукописных страниц, исписанных «весьма своеобразным» почерком. Их пытаются издать уже более века, и всего насчитывается 13 томов, что составляет меньше половины от сохранившегося массива. Инициатор проекта — Сбербанк, его зампредседателя Александр Ведяхин пояснил: прочесть рукописи — задача отдельная и сложная, искусственный интеллект как раз может в этом помочь. Работы начнутся в нынешнем году, планируется даже организация хакатона (или конкурса для разработчиков). Словом, инициатива выглядит как завязка нового романа Дэна Брауна. Насколько искусственному интеллекту под силу такая задача?

Эксперты пока осторожно комментируют новость — слишком много неизвестных. Ну, к примеру, заведующий кафедрой Историко-архивного института РГГУ, известный специалист по источниковедению Евгений Пчелов лишь разводит руками: задача прочитать рукописи Петра — чисто палеографическая, с ней справится и человек.

— У Петра Первого действительно был своеобразный почерк, но я не могу сказать, что его невозможно прочесть. Сравните хотя бы с почерком Суворина или, скажем Крылова,— говорит эксперт.— Крылов сам иногда не мог прочитать то, что написал. А тексты Петра вполне читабельны. Вообще, любой профессиональный историк обязан знать палеографию (дисциплину, изучающую памятники древней письменности, особенности их прочтения.— «О»), уметь разбирать любые почерки любого века. Бывают сложные случаи? Бывают. Тут помогает консультация с коллегами. Но как в палеографическом деле может помочь «машина», мне пока неясно.

Ответ на наиболее интригующий вопрос, почему от Петра Первого остался такой значительный объем рукописей, тоже есть. По словам Евгения Пчелова, это особенность абсолютной монархии, когда все замыкается на государя. Записочки, письма… Столь же значительный объем рукописей остался, к примеру, от Екатерины Второй. Идея систематического издания рукописного наследия Петра родилась еще в XIX веке, само издание по разным причинам прерывалось, но все же продолжается и уже дошло до 1714 года.

— Тут надо понимать: историкам известны самые важные документы, относящиеся к Петру Первому,— говорит Евгений Пчелов.— Может ли найтись что-то еще? Возможно. Но вряд ли новые находки кардинально изменят наши представления о нем. Недавно ведущий специалист по петровской эпохе Евгений Анисимов опубликовал выдающуюся вещь — биохронику Петра. Анисимов расписал каждый день царя: что происходило, что тот делал. И это было сделано одним человеком, без применения искусственного интеллекта. При том что компьютеры полезны для историков, например, в определении вероятности авторства того или иного текста. Надо идти от задачи.

От задач, собственно, идут и зарубежные ученые, которые все чаще обращаются к искусственному интеллекту за помощью. Целую подборку таких примеров собрал европейский футуролог Ричард ван Хойдонк. Один из самых известных кейсов — проект «Пифия» по восстановлению поврежденных древних текстов с помощью так называемых алгоритмов машинного обучения. А вот достижение ученых из Массачусетского технологического института и лаборатории искусственного интеллекта Google: они разработали систему машинного обучения, способную переводить забытые языки. Эффективность системы продемонстрировали на примере линейного письма Б. Так называют форму критского письма, которая использовалась в эпоху микенской культуры; дешифровать найденные письмена удалось лишь в 1950–1953 годах. Так вот система машинного обучения смогла перевести эти письмена на греческий, да еще и довольно точно! Победа технологий над древними тайнами, правда, не окончательна. Оказывается, есть еще линейное письмо А, остающееся для историков загадкой, и вот до его дешифровки компьютер пока «не дорос». Специалистам вообще приходится признать, что новые технологии пока не всесильны. Вопрос времени?

— Необходимо разделять задачи, которые ставят перед искусственным интеллектом (ИИ),— считает директор по науке и технологиям Агентства искусственного интеллекта Роман Душкин.— Например, распознавание текста с помощью ИИ практикуется давно: нужно взять блок текста из рукописей, разметить его и показать так называемому ИИ-агенту как перевести его из отсканированного вида в машиночитаемый. Проще говоря, в символы. Когда ИИ-агент научится это делать, он сможет уже сам переводить страницы и помечать места, где встречается с затруднениями. Для современного состояния технологий задача простая. Но, к примеру, дешифровка древних текстов — это уже сложнее. Из образцов могу вспомнить попытку прочитать с помощью искусственного интеллекта знаменитый манускрипт Войнича, однако в целом такие случаи все еще редки.

Про манускрипт Войнича стоит рассказать отдельно. Сенсационное сообщение о том, что компьютерная программа, созданная в лаборатории искусственного интеллекта Университета Альберты (Канада), смогла дешифровать первое предложение этой загадочной рукописи, появилось несколько лет назад. По версии программы там сказано следующее: «Она дала рекомендации священнику, хозяину дома, мне и людям». Интригует? К сожалению, дальнейшего развития история не получила. Эксперты поясняют: искусственный интеллект пока не сравним с человеческим — отсюда и затруднения.

— Для тренировки ИИ-агента необходимо загрузить огромное количество образцов выполнения задачи,— объясняет Роман Душкин.— Есть генетические алгоритмы, способные помочь с зашифрованными текстами, для которых известен язык, но неизвестен метод шифрования. Есть символьные методы, они позволяют применять для дешифровки различные правила работы с текстом. Но в деле с манускриптом Войнича и другими похожими случаями у нас лишь один образец, про который мы ничего не знаем. К нему можно применять методы ИИ, основанные на обучении без учителя, чтобы, допустим, выявить скрытые закономерности. В идеале можно представить, как мы собрали десяток специалистов, узнали об их методах работы с древними текстами, формализовали все это в виде правил и загрузили свод этих правил в ИИ-агента… Тогда можно предположить, что он справится с дешифровкой. Но пока что это отдаленная перспектива.

А вот еще один удивительный поворот: ученые из Университета Ямагата и IBM (Япония) разработали алгоритм машинного обучения, способный выявлять скрытые… геоглифы. Этот алгоритм сразу доказал свою перспективность и смог обнаружить на знаменитом плато Наска новый геоглиф — пятиметровую фигуру человека, держащего трость или дубинку! Виртуальный Индиана Джонс? Такого поворота не смогли бы придумать даже в Голливуде.

Детали: Есть что почитать

Искусственный интеллект (ИИ) и новые технологии сегодня все чаще помогают историкам, археологам и архивистам. Но и загадок, которые можно решить с их помощью, все еще немало

Тексты-шифры, способные поставить в тупик искусственный интеллект

Манускрипт Войнича

Легендарный манускрипт, датируемый началом XV века, назван в честь антиквара Вильфрида Войнича, который купил его в 1912 году. Сам манускрипт представляет собой сборник загадочных рисунков и некий текст. Темы рисунков многообразны: выделяются ботанический, астрономический, биологический, космологический и другие разделы. Но, конечно, искусственный интеллект мог бы пригодиться для дешифровки текста: его язык не имеет аналогов, а всего, как подсчитали ученые, в манускрипте содержится 170 тысяч знаков.

Кодекс Серафини

В отличие от манускрипта Войнича происхождение этой книги хорошо известно. Ее написал и проиллюстрировал архитектор и промышленный дизайнер итальянец Луиджи Серафини в 1970-х годах. Причем говорят, что одним из источников вдохновения для Серафини стал… манускрипт Войнича. И так же, как в случае с Войничем, текст этой книги до сих пор не дешифрован: сам Луиджи утверждал, что никакого смысла там и не предполагалось.

Кодекс Рохонци

Кодекс Рохонци, имеющий 448 страниц, привлек к себе внимание еще в XIX веке в Венгрии. Кодекс написан с использованием неизвестного алфавита примерно из 200 символов, кто и где это сделал — неизвестно. Иллюстрирована книга разнообразно: встречаются изображения сражений и даже религиозной символики. Как и прочие столь же загадочные книги, Кодекс Рохонци доступен онлайн для любых попыток дешифровки.

Книга Сойги

Эта таинственная книга была найдена знаменитым оккультистом и математиком Джоном Ди в XVI веке, затем утеряна и обнаружена вновь лишь… в 1990-х годах. Почти 200 страниц содержат заклинания и различные магические инструкции, сам Ди одержимо пытался ее дешифровать, точнее, понять самую загадочную часть — 36 загадочных «квадратов» с буквами. С учетом устрашающих легенд (тот, кто прочтет эту книгу, согласно одной из них, скоро умрет) искусственный интеллект подошел бы для работы с ней как нельзя кстати.

Искусственный интеллект и древние тексты

Программа ИИ, получившая название «Пифия», от компании DeepMind и Оксфордского университета помогает восстанавливать утраченные элементы текстов, это первая такая программа в истории.

«Пифию» обучили на базе данных из 35 тысяч текстовых примеров (более 3 млн слов) Ее протестировали на 2949 поврежденных древнегреческих записях «Пифия» может восстанавливать «связки» с точностью до 70 процентов буквально за секунды (у человека этот показатель ниже — 43 процента, да и скорость гораздо ниже).

Новые технологии в библиотеках и архивах

Искусственный интеллект — недавний проект, запущенный в знаменитых архивах Ватикана,— должен помочь в распознавании текстов древних рукописей и в целом стать серьезным подспорьем для палеографов.

Блокчейн — он может помочь, например, в отслеживании авторских прав или объединении сетей библиотек и университетов.

Интернет вещей — возможности использования в библиотечном или архивном деле безграничны. Как насчет мониторинга уровня влажности в архивах? А вот уже имеющийся пример — так называемый букомат, установленный в одном из городов США, он представляет собой своего рода киоск самообслуживания, только вместо шоколадок — книги.

Дополненная реальность — примеров этой технологии в библиотечном деле множество. Вот один из стартапов (librARi) предлагает поиск конкретной книги на стеллажах с помощью этой технологии. Также с ее помощью можно подобрать книги, похожие по тематике, или, к примеру, узнать о новых поступлениях, причем увидеть их прямо на экране своего планшета.

Дроны — недавно о планах по доставке книг с помощью дронов объявил популярный австралийский сервис Zookal.

Искусственный интеллект и отношение к нему людей

Как лично вы относитесь к распространению технологий искусственного интеллекта? (закрытый вопрос, один ответ, в процентах от всех опрошенных россиян*)

Следует или нет использовать технологии искусственного интеллекта… (закрытый вопрос, один ответ по строке, процент от всех опрошенных россиян)

Источник: мультимедийный веб-портал Big Think, New Scientist, компания Princh (Дания), ВЦИОМ, Университет Огайо (США), соб. инф.

Хочешь стать одним из более 100 000 пользователей, кто регулярно использует kiozk для получения новых знаний?
Не упусти главного с нашим telegram-каналом: https://kiozk.ru/s/voyrl

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Не нашего ума дело? Не нашего ума дело?

Человек сохранит преимущества перед ИИ на ближайшие десятилетия

Огонёк
#профессия: кинолог LizaAlert — о работе четвероногих спасателей #профессия: кинолог LizaAlert — о работе четвероногих спасателей

Лето для поисково-спасательного отряда LizaAlert — во всех смыслах жаркий сезон

РБК
Кто является автором термина «Великая Отечественная война»? Кто является автором термина «Великая Отечественная война»?

Кем впервые было произнесено название войны, которую предстояло пройти СССР

Дилетант
Утвердили — и отказали: Гослинг, Сталлоне и другие актеры, уволенные со съемок Утвердили — и отказали: Гослинг, Сталлоне и другие актеры, уволенные со съемок

То, что актера утвердили на роль, еще не значит, что он ее сыграет

Cosmopolitan
Смерть бессильного вождя Смерть бессильного вождя

Это был лидер страны, у которого из средств общения осталась только мимика

Дилетант
Расстаться мирно: 20 лайфхаков для тех, кто разводится Расстаться мирно: 20 лайфхаков для тех, кто разводится

Расставание — нелегкое испытание для обоих супругов, особенно если есть дети

Psychologies
Резолюционное сознание Резолюционное сознание

Как Брежнев уклонялся от бюрократических головоломок

Огонёк
13 пасхалок, которые ты не заметил в «Дне независимости» 13 пасхалок, которые ты не заметил в «Дне независимости»

Английская поэзия XIX века, зашифрованные послания и еще уйма всего!

Maxim
Лучший иностранец России Лучший иностранец России

Фритьоф Нансен был убежден: «Благотворительность — это реальная политика»

Вокруг света
Наши ребята! Харди, Лоу, Шварценеггер, Кейдж и другие актеры в роли русских Наши ребята! Харди, Лоу, Шварценеггер, Кейдж и другие актеры в роли русских

Кто из знаменитых иностранцев играл русских - и как это у них получилось

Cosmopolitan
Катастрофа Superjet: испытатель за год предупреждал об аварии Катастрофа Superjet: испытатель за год предупреждал об аварии

«РР» нашел эксклюзивные документы

Русский репортер
Психологическое насилие: спасать отношения или себя? Психологическое насилие: спасать отношения или себя?

Абьюз: кто виноват и что делать

Psychologies
Физики собрали 128-кубитный чип на фотонной интегральной схеме Физики собрали 128-кубитный чип на фотонной интегральной схеме

Изготовлен 128-кубитный чип — наиболее крупное на сегодня устройство такого типа

N+1
Антивозрастной макияж: главные «омолаживающие» советы от визажистов Антивозрастной макияж: главные «омолаживающие» советы от визажистов

С помощью макияжа ты можешь менять свой возраст легко и безболезненно!

Cosmopolitan
Какой радар-детектор выбрать для города и путешествий? Какой радар-детектор выбрать для города и путешествий?

Чем отличаются радар-детекторы и как их правильно выбирать

CHIP
Автомобили и водители, которых боятся страховые. Секретный отчет Автомобили и водители, которых боятся страховые. Секретный отчет

Почему каршеринг чаще всего попадает в аварии и при чем здесь хип-хоп

РБК
Как администрация Путина сделала из Сергея Фургала русского Джорджа Флойда Как администрация Путина сделала из Сергея Фургала русского Джорджа Флойда

Российское общество меняется, а власть не знает, что с этим делать

СНОБ
Счастливый мезальянс: как отбить атаку родных и друзей? Счастливый мезальянс: как отбить атаку родных и друзей?

Как выстоять под натиском и спасти свой союз

Psychologies
Русского осетра скрестили с американским веслоносом Русского осетра скрестили с американским веслоносом

Венгерским ученым удалось получить жизнеспособные гибриды осетров и веслоносов

N+1
Кто стоит за Джессикой Рэббит: судьбы женщин, которые создали культовый образ Кто стоит за Джессикой Рэббит: судьбы женщин, которые создали культовый образ

Джессика — единственный вымышленный персонаж, появившийся на обложке Playboy

Cosmopolitan
Последнее слово останется за человеком Последнее слово останется за человеком

Сквозная цифровизация производства покажет, как повысить эффективность

Эксперт
«Я расту по дням или по часам?»: эксперты отвечают на детские вопросы об отпечатках пальцев, сигаретах, мужских сосках и многом другом «Я расту по дням или по часам?»: эксперты отвечают на детские вопросы об отпечатках пальцев, сигаретах, мужских сосках и многом другом

Умные взрослые отвечают на вопросы, заданные обычными детьми

Esquire
Что такое зависимость и кто становится зависим: с точки зрения науки Что такое зависимость и кто становится зависим: с точки зрения науки

Разбираемся в природе человеческих пристрастий

Популярная механика
Русские хакеры снова в деле Русские хакеры снова в деле

Группировка Cosmic Lynx использует удивительно сложные методы для цифровых атак

GQ
Польза и вред шоколада для здоровья мужчины: основные эффекты вкусного десерта Польза и вред шоколада для здоровья мужчины: основные эффекты вкусного десерта

Почему шоколад стоит добавить в стой рацион

Playboy
«Наша цель  — раздеть Лукашенко»: уехавший в Россию соперник белорусского президента о бегстве и стратегии оппозиции «Наша цель  — раздеть Лукашенко»: уехавший в Россию соперник белорусского президента о бегстве и стратегии оппозиции

Почему Валерий Цепкало не верит в честную победу Александра Лукашенко

Forbes
Слишком много любви: если сын для мамы — партнер Слишком много любви: если сын для мамы — партнер

Чрезмерная любовь-страсть матери к сыну может разрушить его жизнь

Psychologies
Отдых летом-2020: куда поехать и как подготовиться Отдых летом-2020: куда поехать и как подготовиться

Где отдохнуть на море, на озерах, куда съездить в горы и что с собой взять?

Cosmopolitan
Наши финансы в кризис: возможные стратегии Наши финансы в кризис: возможные стратегии

Кризис можно использовать как возможность «разобраться» с деньгами

Psychologies
5 советов по стилю от молодого Харрисона Форда 5 советов по стилю от молодого Харрисона Форда

Даже не пытайтесь соврать, что не хотите быть похожим на Хана Соло

GQ
Открыть в приложении