Что собой представляет проект Ayana и какие возможности он открывает

ФедералПрессHi-Tech

Разработчик приложения Ayana: «Языки и культуру малых народов спасет искусственный интеллект»

Станислав Казаченко

Современная жизнь считается угрозой для культур коренных малочисленных народов Севера. Например, из 37 тысяч живущих в России эвенков лишь 5 тысяч на достаточном уровне владеют родным языком. Однако технический прогресс может быть и помощником в сохранении традиционного уклада. Примером тому может служить Ayana — голосовой помощник на эвенкийском языке, аналог известных «Алисы» и «Маруси». О том, что собой представляет проект и какие возможности он открывает, рассказал разработчик Николай Апросимов.

Роботы говорят по-эвенкийски

С чего началась работа над вашим проектом?

Впервые такая идея появилась в 2019 году, а непосредственная работа началась год спустя, когда мы выиграли грант министерства по развитию Арктики РС(Я). На тот момент речь шла только о создании переводчика с русского на эвенкийский язык. Мы искали способы реализации, перебирали варианты и в ходе работы стали погружаться в особенности функционирования искусственного интеллекта. И когда в процессе мы услышали, как машина впервые в истории сказала «мэнду» (что по-эвенкийски значит «привет»), мы были шокированы. Поняли, что произошло нечто невообразимое. И главное, мы осознали, что появилась прямая надежда на сохранение нашего языка.

А дальше оказалось, что речь может идти больше чем об обычном переводчике в мобильном приложении. Создается как будто искусственное ядро родного языка, где можно собрать массив данных, включающий не только слова, но и культурный код. Так же, как у «Алисы», можно попросить включить музыку или можно будет сделать голосовой запрос об эвенкийской кухне, национальной одежде, о знаменитых эвенках. Конечно, проект вызвал эффект разорвавшейся бомбы, но в то же время мы получили достаточно много замечаний.

Для реализации подобного проекта нужен целый набор компетенций — от знания эвенкийского языка до навыков программирования. Как вы их получили и как формировалась команда?

Начну с того, что по профессии я не программист и не лингвист, а эколог. И больше того, хоть и принадлежу к эвенкийскому народу и являюсь потомком известного рода Апросимовых, долгое время нашим языком на должном уровне не владел. Впрочем, именно это и дало мне понимание, как важно сохранение национальной культуры и что для этого могут быть полезны современные технологии.

Все началось с просмотров тематических роликов на YouTube и изучения Google-переводчика. Дальше пришлось очень много учиться. Тем более что на первоначальном этапе у нас и не было ресурсов набрать широкую команду с разнообразными компетенциями. В том числе приходилось много консультироваться на сайте профессионалов в области ИТ — Habr, также в блог-канале «Теплица социальных технологий»*. Данные о языке брали с сайта Еvengus, который ведут лингвисты. Конечно, не всегда получалось успешно, была и своя череда неудач, в какой-то момент стало казаться, что на таком редком языке, как эвенкийский, вообще невозможно запустить работу с применением NLU («естественного распознавания языка». — Прим. ред.). NLU было необходимо для запуска именно голосового решения с последующим голосовым ответом пользователю.

* Министерством юстиции РФ внесен в реестр иностранных агентов.

Помощь пришла неожиданно — из Великобритании. Я много общался в профильных сообществах, и один собеседник из этой страны просто отправил видеосообщение и рассказал, что есть такой код, такая разметка, где можно кастомизировать речь, отправил мне репозитории. Мы начали работу и впервые смогли не только озвучить, но и провести кастомизацию по изучению эвенкийского языка. Именно тогда случился тот яркий момент, когда машина впервые сказала слова на эвенкийском языке. Мы стали применять разметку искусственного интеллекта (AIML), на основе которой созданы популярные языковые ассистенты по всему миру.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Председатель Сахалинской областной думы: «Словосочетание «Первый в России» для нас становится привычным» Председатель Сахалинской областной думы: «Словосочетание «Первый в России» для нас становится привычным»

Как выстроена работа депутатов в Сахалинской области?

ФедералПресс
Ученые впервые вырастили из стволовых клеток модель человеческого эмбриона возрастом две недели Ученые впервые вырастили из стволовых клеток модель человеческого эмбриона возрастом две недели

Ученые разработали этический способ заглянуть в первые недели беременности

ТехИнсайдер
Космический буксир: мирный атом или ненаучная фантастика? Космический буксир: мирный атом или ненаучная фантастика?

Чем интересна перспектива использования ядерного двигателя в космосе?

Наука и техника
Сибирский вайб: 5 перспективных молодых артистов из северного региона Сибирский вайб: 5 перспективных молодых артистов из северного региона

Фрэшмены из Сибири, имеющие все шансы стать звездами

Maxim
Сохранить и приумножить Сохранить и приумножить

Как музеи с гражданами спасали ее культурное наследие во время войны

Вокруг света
Охота на алгоритм Охота на алгоритм

Способна ли машина заменить человека в самых важных ему областях деятельности

Правила жизни
Ида Галич и Олег Горчанин Ида Галич и Олег Горчанин

Кажется, профсоюз Иды Галич и Олега Горчанина подарил нам эффектный мейковер

Собака.ru
«Я за то, чтобы жить настоящим» «Я за то, чтобы жить настоящим»

С Камилем Лариным мы поговорили о его новой роли, роботах и спорах с Siri

Лиза
Мужчина мечты Мужчина мечты

Станислав Магкеев приятно удивил нас своей добротой, честностью, даже упрямством

VOICE
Театр божественных действий Театр божественных действий

«Голда»: история первых дней войны Судного дня

Weekend
Искусственный разум и проблемы жизни Искусственный разум и проблемы жизни

Как должны складываться отношения искусственного разума и его создателя?

Правила жизни
Гениальная экономия: 4 быстрых способа, как заточить одноразовую бритву Гениальная экономия: 4 быстрых способа, как заточить одноразовую бритву

Как заточить одноразовые бритвы 4 простыми методами

ТехИнсайдер
Три идеологии как одна мечта о счастье Три идеологии как одна мечта о счастье

Как либерализм, коммунизм и фашизм вошли в состав новейших утопий

Weekend
Без паники! Откуда берутся неврозы и как с ними справиться Без паники! Откуда берутся неврозы и как с ними справиться

Исследований невроза много, но ответы на главные вопросы не найдены до сих пор

Лиза
Андрей Соколов: «О женщинах надо... молчать. Вот самая правильная позиция» Андрей Соколов: «О женщинах надо... молчать. Вот самая правильная позиция»

«От любви глупеют. Наступает эйфория! Но это опасно»

Караван историй
Законное преступление: Как зарабатывают миллионы на фотографиях в интернете Законное преступление: Как зарабатывают миллионы на фотографиях в интернете

В России набирает обороты новая схема заработка на фотографиях в интернете

ФедералПресс
Как выбрать устрицы и с чем их сочетать: объясняют эксперты Как выбрать устрицы и с чем их сочетать: объясняют эксперты

Чем хороши и полезны устрицы, как получить удовольствие от деликатеса?

РБК
Ядерные полигоны и могильники: где хранят радиоактивные отходы Ядерные полигоны и могильники: где хранят радиоактивные отходы

Какую опасность для окружающего мира представляют радиоактивные отходы?

ФедералПресс
По наклонной По наклонной

Аэротруба, в которой можно летать в вингсьюте и остаться живым

ТехИнсайдер
Повторится ли дефолт 1998 года: размышления экономиста Повторится ли дефолт 1998 года: размышления экономиста

Насколько справедливы исторические параллели и к чему готовиться россиянам

ФедералПресс
10 фактов про Древний Рим, которые кажутся невероятными 10 фактов про Древний Рим, которые кажутся невероятными

На тот случай, если на этой неделе вы еще ни разу не думали про Римскую империю

Maxim
Алло, мы ищем таланты! Алло, мы ищем таланты!

Что делать, когда вы не знаете, где искать свое призвание?

Добрые советы
Чувство дома Чувство дома

Как Feel Beit объединяет разные культуры

Seasons of life
«Одна ночь»: как память о насилии не отпускает жертву и свидетелей даже спустя 20 лет «Одна ночь»: как память о насилии не отпускает жертву и свидетелей даже спустя 20 лет

«Одна ночь»: история о том, что о насилии нельзя молчать

Forbes
Как не пожалеть о романе с иностранцем: 3 истории Как не пожалеть о романе с иностранцем: 3 истории

Как несмотря на все различия сделать отношения с иностранцем здоровыми?

Psychologies
Как разобраться в современном арт-рынке — краткая памятка Как разобраться в современном арт-рынке — краткая памятка

Памятка, которая поможет начинающему коллекционеру современного искусства

Правила жизни
Как понять, что мужчина не видит в вас любимую женщину: 5 тревожных сигналов Как понять, что мужчина не видит в вас любимую женщину: 5 тревожных сигналов

Как понять, что в ваших отношениях что-то идет не так?

Psychologies
Один за всех? Один за всех?

Разбираемся, так ли безопасны и универсальны антибиотики, как кажется

Лиза
Семь необычных причин головной боли Семь необычных причин головной боли

Как самим определить «нестандартные» причины возникновения головной боли?

Здоровье
Куклы романтизма Куклы романтизма

Есть ли в мире бездушной и безжалостной техники место для романтиков?

Правила жизни
Открыть в приложении