Что собой представляет проект Ayana и какие возможности он открывает

ФедералПрессHi-Tech

Разработчик приложения Ayana: «Языки и культуру малых народов спасет искусственный интеллект»

Станислав Казаченко

Современная жизнь считается угрозой для культур коренных малочисленных народов Севера. Например, из 37 тысяч живущих в России эвенков лишь 5 тысяч на достаточном уровне владеют родным языком. Однако технический прогресс может быть и помощником в сохранении традиционного уклада. Примером тому может служить Ayana — голосовой помощник на эвенкийском языке, аналог известных «Алисы» и «Маруси». О том, что собой представляет проект и какие возможности он открывает, рассказал разработчик Николай Апросимов.

Роботы говорят по-эвенкийски

С чего началась работа над вашим проектом?

Впервые такая идея появилась в 2019 году, а непосредственная работа началась год спустя, когда мы выиграли грант министерства по развитию Арктики РС(Я). На тот момент речь шла только о создании переводчика с русского на эвенкийский язык. Мы искали способы реализации, перебирали варианты и в ходе работы стали погружаться в особенности функционирования искусственного интеллекта. И когда в процессе мы услышали, как машина впервые в истории сказала «мэнду» (что по-эвенкийски значит «привет»), мы были шокированы. Поняли, что произошло нечто невообразимое. И главное, мы осознали, что появилась прямая надежда на сохранение нашего языка.

А дальше оказалось, что речь может идти больше чем об обычном переводчике в мобильном приложении. Создается как будто искусственное ядро родного языка, где можно собрать массив данных, включающий не только слова, но и культурный код. Так же, как у «Алисы», можно попросить включить музыку или можно будет сделать голосовой запрос об эвенкийской кухне, национальной одежде, о знаменитых эвенках. Конечно, проект вызвал эффект разорвавшейся бомбы, но в то же время мы получили достаточно много замечаний.

Для реализации подобного проекта нужен целый набор компетенций — от знания эвенкийского языка до навыков программирования. Как вы их получили и как формировалась команда?

Начну с того, что по профессии я не программист и не лингвист, а эколог. И больше того, хоть и принадлежу к эвенкийскому народу и являюсь потомком известного рода Апросимовых, долгое время нашим языком на должном уровне не владел. Впрочем, именно это и дало мне понимание, как важно сохранение национальной культуры и что для этого могут быть полезны современные технологии.

Все началось с просмотров тематических роликов на YouTube и изучения Google-переводчика. Дальше пришлось очень много учиться. Тем более что на первоначальном этапе у нас и не было ресурсов набрать широкую команду с разнообразными компетенциями. В том числе приходилось много консультироваться на сайте профессионалов в области ИТ — Habr, также в блог-канале «Теплица социальных технологий»*. Данные о языке брали с сайта Еvengus, который ведут лингвисты. Конечно, не всегда получалось успешно, была и своя череда неудач, в какой-то момент стало казаться, что на таком редком языке, как эвенкийский, вообще невозможно запустить работу с применением NLU («естественного распознавания языка». — Прим. ред.). NLU было необходимо для запуска именно голосового решения с последующим голосовым ответом пользователю.

* Министерством юстиции РФ внесен в реестр иностранных агентов.

Помощь пришла неожиданно — из Великобритании. Я много общался в профильных сообществах, и один собеседник из этой страны просто отправил видеосообщение и рассказал, что есть такой код, такая разметка, где можно кастомизировать речь, отправил мне репозитории. Мы начали работу и впервые смогли не только озвучить, но и провести кастомизацию по изучению эвенкийского языка. Именно тогда случился тот яркий момент, когда машина впервые сказала слова на эвенкийском языке. Мы стали применять разметку искусственного интеллекта (AIML), на основе которой созданы популярные языковые ассистенты по всему миру.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему мигранты хамят, насилуют и убивают: объяснили психологи Почему мигранты хамят, насилуют и убивают: объяснили психологи

В последние годы в России участились нарушения закона со стороны мигрантов

ФедералПресс
Ловушка интеллекта: как IT-гиганты обучают ИИ Ловушка интеллекта: как IT-гиганты обучают ИИ

«Красные команды» по искусственному интеллекту — кто они и зачем нужны?

Forbes
ВСМ откроет дорогу в Арктику ВСМ откроет дорогу в Арктику

Скоростная магистраль простимулирует арктические перевозки в России

Монокль
8 правил, которые помогут сохранить счастливые отношения навсегда 8 правил, которые помогут сохранить счастливые отношения навсегда

Несложные правила, которые поддержат ваши отношения

VOICE
Рискованная защита Рискованная защита

Не все дети в СССР были одинаково равны...

Дилетант
Почему не стоит покупать дешевые кабели и адаптеры для зарядки Почему не стоит покупать дешевые кабели и адаптеры для зарядки

Какие подводные камни вас ждут при выборе кабеля и адаптера для зарядки телефона

CHIP
Гимназия Санкт-Петербургской Академии наук: создание и становление Гимназия Санкт-Петербургской Академии наук: создание и становление

История первой гимназии Санкт-Петербургской Академии наук

Знание – сила
Вокзал как искусство Вокзал как искусство

Вокзал Владивостока – не просто вокзал, а настоящий памятник русского зодчества

Отдых в России
О моделировании искусственного мозга: «Ученые столкнутся с этическими проблемами» О моделировании искусственного мозга: «Ученые столкнутся с этическими проблемами»

О чем думает искусственно выращенный «мозг»?

ФедералПресс
ЧВК «Рюрик» ЧВК «Рюрик»

Около 838 года в поле зрения Византии попали люди, называвших себя русами

Дилетант
«Во власти непережитых чувств»: чем чреваты семейные тайны «Во власти непережитых чувств»: чем чреваты семейные тайны

Отрывок из книги «Миф, в котором я живу»: к чему приводят семейные секреты?

Psychologies
Смертельные пронумерованные Смертельные пронумерованные

«Призрачная станция»: южнокорейский хоррор о призраках в метро

Weekend
Женщины смотрят: что такое «женский взгляд» в кино Женщины смотрят: что такое «женский взгляд» в кино

Female gaze: что это такое и какие фильмы могут нас с этим понятием познакомить?

Правила жизни
Деликатно о важном. Первые симптомы рака шейки матки Деликатно о важном. Первые симптомы рака шейки матки

Одна из проблем, связанных с раком шейки матки – вовремя распознать его симптомы

Лиза
Как разобраться в современном арт-рынке — краткая памятка Как разобраться в современном арт-рынке — краткая памятка

Памятка, которая поможет начинающему коллекционеру современного искусства

Правила жизни
Алла Юганова: «Со мной никому не бывает скучно» Алла Юганова: «Со мной никому не бывает скучно»

Алла Юганова — о том, за что любит профессию и как подчеркнуть женственность

Здоровье
Часы Часы

В списке трендов — зелёные циферблаты, титан и спецэффекты

Robb Report
Золото в жилах стынет Золото в жилах стынет

Как добывают самое северное в мире золото

ТехИнсайдер
«Граф» Пабло Ларраина: что будет, если диктатор окажется бессмертным вампиром «Граф» Пабло Ларраина: что будет, если диктатор окажется бессмертным вампиром

Как история о диктаторе-вампире оказывается менее интересной, чем ожидаешь

Forbes
Внедорожный Escape, или всё что вам нужно знать о Ford Bronco Sport Внедорожный Escape, или всё что вам нужно знать о Ford Bronco Sport

Внедорожник Ford Bronco Sport: икеевский интерьер и немалый ценник

4x4 Club
Как модель Оля Запивохина делает карьеру даже после перенесенной операции на мозге Как модель Оля Запивохина делает карьеру даже после перенесенной операции на мозге

Модель Оля Запивохина: почему не всегда нужно все планировать?

Forbes
Осторожно: псевдопсихолог! Осторожно: псевдопсихолог!

Выдуманные заболевания, которые могут тебе приписать

Лиза
3 способа ускорить ваш метаболизм 3 способа ускорить ваш метаболизм

Можем ли мы как-то повлиять на метаболизм?

ТехИнсайдер
«Интимная Русь. Жизнь без Домостроя, грех, любовь и колдовство» «Интимная Русь. Жизнь без Домостроя, грех, любовь и колдовство»

Как наши предки блудили на праздниках, говорили про секс и предлагали жениться

N+1
SEAT прекратит свое существование. Каких автомобилей нам будет не хватать SEAT прекратит свое существование. Каких автомобилей нам будет не хватать

Почему в России SEAT потерпел фиаско?

РБК
Домашний офис Домашний офис

Создаем интерьер для комфортной удаленки

Лиза
Что произойдет с телом, если забеременеть сразу после увеличения груди: хирург рассматривает случай Анастасии Костенко Что произойдет с телом, если забеременеть сразу после увеличения груди: хирург рассматривает случай Анастасии Костенко

Как беременность может сказаться на пластике груди? Случай Анастасии Костенко

VOICE
Так было или не было? Так было или не было?

7 самых известных мифов в истории человечества

Лиза
Старые песни о главном: что происходит с музыкальной индустрией и почему выходит так много каверов? Старые песни о главном: что происходит с музыкальной индустрией и почему выходит так много каверов?

Почему все так полюбили каверы и что это значит для индустрии?

Правила жизни
Близкий Дальний Восток, новая Анапа и поезд вместо ракет Близкий Дальний Восток, новая Анапа и поезд вместо ракет

Как мы будем путешествовать по России через 30 лет

РБК
Открыть в приложении