Что собой представляет проект Ayana и какие возможности он открывает

ФедералПрессHi-Tech

Разработчик приложения Ayana: «Языки и культуру малых народов спасет искусственный интеллект»

Станислав Казаченко

Современная жизнь считается угрозой для культур коренных малочисленных народов Севера. Например, из 37 тысяч живущих в России эвенков лишь 5 тысяч на достаточном уровне владеют родным языком. Однако технический прогресс может быть и помощником в сохранении традиционного уклада. Примером тому может служить Ayana — голосовой помощник на эвенкийском языке, аналог известных «Алисы» и «Маруси». О том, что собой представляет проект и какие возможности он открывает, рассказал разработчик Николай Апросимов.

Роботы говорят по-эвенкийски

С чего началась работа над вашим проектом?

Впервые такая идея появилась в 2019 году, а непосредственная работа началась год спустя, когда мы выиграли грант министерства по развитию Арктики РС(Я). На тот момент речь шла только о создании переводчика с русского на эвенкийский язык. Мы искали способы реализации, перебирали варианты и в ходе работы стали погружаться в особенности функционирования искусственного интеллекта. И когда в процессе мы услышали, как машина впервые в истории сказала «мэнду» (что по-эвенкийски значит «привет»), мы были шокированы. Поняли, что произошло нечто невообразимое. И главное, мы осознали, что появилась прямая надежда на сохранение нашего языка.

А дальше оказалось, что речь может идти больше чем об обычном переводчике в мобильном приложении. Создается как будто искусственное ядро родного языка, где можно собрать массив данных, включающий не только слова, но и культурный код. Так же, как у «Алисы», можно попросить включить музыку или можно будет сделать голосовой запрос об эвенкийской кухне, национальной одежде, о знаменитых эвенках. Конечно, проект вызвал эффект разорвавшейся бомбы, но в то же время мы получили достаточно много замечаний.

Для реализации подобного проекта нужен целый набор компетенций — от знания эвенкийского языка до навыков программирования. Как вы их получили и как формировалась команда?

Начну с того, что по профессии я не программист и не лингвист, а эколог. И больше того, хоть и принадлежу к эвенкийскому народу и являюсь потомком известного рода Апросимовых, долгое время нашим языком на должном уровне не владел. Впрочем, именно это и дало мне понимание, как важно сохранение национальной культуры и что для этого могут быть полезны современные технологии.

Все началось с просмотров тематических роликов на YouTube и изучения Google-переводчика. Дальше пришлось очень много учиться. Тем более что на первоначальном этапе у нас и не было ресурсов набрать широкую команду с разнообразными компетенциями. В том числе приходилось много консультироваться на сайте профессионалов в области ИТ — Habr, также в блог-канале «Теплица социальных технологий»*. Данные о языке брали с сайта Еvengus, который ведут лингвисты. Конечно, не всегда получалось успешно, была и своя череда неудач, в какой-то момент стало казаться, что на таком редком языке, как эвенкийский, вообще невозможно запустить работу с применением NLU («естественного распознавания языка». — Прим. ред.). NLU было необходимо для запуска именно голосового решения с последующим голосовым ответом пользователю.

* Министерством юстиции РФ внесен в реестр иностранных агентов.

Помощь пришла неожиданно — из Великобритании. Я много общался в профильных сообществах, и один собеседник из этой страны просто отправил видеосообщение и рассказал, что есть такой код, такая разметка, где можно кастомизировать речь, отправил мне репозитории. Мы начали работу и впервые смогли не только озвучить, но и провести кастомизацию по изучению эвенкийского языка. Именно тогда случился тот яркий момент, когда машина впервые сказала слова на эвенкийском языке. Мы стали применять разметку искусственного интеллекта (AIML), на основе которой созданы популярные языковые ассистенты по всему миру.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Основатель IT-компании: «Мы сами создаем смыслы» Основатель IT-компании: «Мы сами создаем смыслы»

В каком состоянии находится IT-отрасль сейчас и что поможет ей стать сильнее?

ФедералПресс
Всеобщий язык Всеобщий язык

Разговор о том, как сохранять внутреннюю свободу и находить опору

Seasons of life
Роботы и инвесторы Роботы и инвесторы

Минпромторг предлагает новый вид специальных инвестиционных контрактов

Монокль
Птичий нюх Птичий нюх

С обонянием птицам не повезло — во всяком случае, так очень долго думали

Наука и жизнь
Воспроизведение неслышанного Воспроизведение неслышанного

Как музыканты-аутентисты возвращаются в прошлое, но оказываются в настоящем

Weekend
Креативная Якутия: каких высот достигла республика в сфере IT Креативная Якутия: каких высот достигла республика в сфере IT

Как регион, прославившийся алмазами и мамонтами, стал ассоциироваться с IT?

ФедералПресс
Биоэнергетика жизни и смерти Биоэнергетика жизни и смерти

Как взять под контроль выработку активных форм кислорода и продлить жизнь?

Эксперт
Есть ли любовь с первого взгляда и как найти своего «принца» Есть ли любовь с первого взгляда и как найти своего «принца»

Возможна ли любовь с первого взгляда и как встретить свою судьбу?

Psychologies
Пограничное состояние Пограничное состояние

Как криптобиржи помогут обойти санкции

FP. BusinessReview
Смертельный челлендж: в США подросток умер от одного ломтика острых чипсов Смертельный челлендж: в США подросток умер от одного ломтика острых чипсов

Эти чипсы настолько острые, что могут привести к летальному исходу

ТехИнсайдер
Темные миры Темные миры

Таинственные тоннели, подземные водоемы, удивительной красоты сталактиты

Вокруг света
Андрей Коняев: «Наука теряет монополию на описание мира» Андрей Коняев: «Наука теряет монополию на описание мира»

Почему науку сравнивают с гаданием на картах таро

РБК
Итак, она была… брюнеткой Итак, она была… брюнеткой

Как отличаются героини эпохальных романов и актрисы, играющие их в экранизациях

Знание – сила
Гениальная экономия: 4 быстрых способа, как заточить одноразовую бритву Гениальная экономия: 4 быстрых способа, как заточить одноразовую бритву

Как заточить одноразовые бритвы 4 простыми методами

ТехИнсайдер
Меню оптимистки. 14 продуктов, которые помогают в  борьбе с апатией и депрессией Меню оптимистки. 14 продуктов, которые помогают в  борьбе с апатией и депрессией

Правильное питание поможет поднять настроение и выйти из депрессии

Лиза
Как связаны принцессы Диснея и самооценка детей: интересное исследование! Как связаны принцессы Диснея и самооценка детей: интересное исследование!

Как дети выбирают любимых принцесс и что это о них говорит?

ТехИнсайдер
Как понять, что мужчина не видит в вас любимую женщину: 5 тревожных сигналов Как понять, что мужчина не видит в вас любимую женщину: 5 тревожных сигналов

Как понять, что в ваших отношениях что-то идет не так?

Psychologies
«Солнечные космические лучи — моя любовь…» «Солнечные космические лучи — моя любовь…»

Галина Базилевская об исследованиях физики Солнца и космических лучей

Наука и жизнь
Что такое пранаяма и в чем ее польза Что такое пранаяма и в чем ее польза

Как пранаяма может улучшить ваше физическое и ментальное здоровье

РБК
Приемы в общении с лжецами: как узнать правду Приемы в общении с лжецами: как узнать правду

Как распознать лжеца и вывести его на чистую воду, чтобы все же узнать правду?

VOICE
«Любовь — это еще не все»: 3 горькие истины «Любовь — это еще не все»: 3 горькие истины

Любовь — не лекарство от всех болезней и не решение всех проблем

Psychologies
Уроки на удаленке Уроки на удаленке

Полезные приложения и лучшие интернет-ресурсы для домашнего образования

Лиза
Законное преступление: Как зарабатывают миллионы на фотографиях в интернете Законное преступление: Как зарабатывают миллионы на фотографиях в интернете

В России набирает обороты новая схема заработка на фотографиях в интернете

ФедералПресс
Новости медицины Новости медицины

Умный браслет-будильник, связь здоровья зубов с мозгом и укачивание в дороге

Лиза
Собирание земель русских Собирание земель русских

Кто поверит, что на месте Уральских гор когда-то плескался океан?

Вокруг света
Этот поезд уже не остановить Этот поезд уже не остановить

Запущенные на Дальнем Востоке мегапроекты продолжаются

Эксперт
Мобилизация-1914: эмоции россиян Мобилизация-1914: эмоции россиян

Кто определяет «национальные интересы»?

Дилетант
Один за всех? Один за всех?

Разбираемся, так ли безопасны и универсальны антибиотики, как кажется

Лиза
Два дня Владимира Ильича Два дня Владимира Ильича

Как Марк Захаров и Олег Ефремов вдыхали жизнь в лениниану

Weekend
Гастрит и гены Гастрит и гены

Что такое гастрит и почему он возникает у такого огромного количества людей?

Лиза
Открыть в приложении