Что собой представляет проект Ayana и какие возможности он открывает

ФедералПрессHi-Tech

Разработчик приложения Ayana: «Языки и культуру малых народов спасет искусственный интеллект»

Станислав Казаченко

Современная жизнь считается угрозой для культур коренных малочисленных народов Севера. Например, из 37 тысяч живущих в России эвенков лишь 5 тысяч на достаточном уровне владеют родным языком. Однако технический прогресс может быть и помощником в сохранении традиционного уклада. Примером тому может служить Ayana — голосовой помощник на эвенкийском языке, аналог известных «Алисы» и «Маруси». О том, что собой представляет проект и какие возможности он открывает, рассказал разработчик Николай Апросимов.

Роботы говорят по-эвенкийски

С чего началась работа над вашим проектом?

Впервые такая идея появилась в 2019 году, а непосредственная работа началась год спустя, когда мы выиграли грант министерства по развитию Арктики РС(Я). На тот момент речь шла только о создании переводчика с русского на эвенкийский язык. Мы искали способы реализации, перебирали варианты и в ходе работы стали погружаться в особенности функционирования искусственного интеллекта. И когда в процессе мы услышали, как машина впервые в истории сказала «мэнду» (что по-эвенкийски значит «привет»), мы были шокированы. Поняли, что произошло нечто невообразимое. И главное, мы осознали, что появилась прямая надежда на сохранение нашего языка.

А дальше оказалось, что речь может идти больше чем об обычном переводчике в мобильном приложении. Создается как будто искусственное ядро родного языка, где можно собрать массив данных, включающий не только слова, но и культурный код. Так же, как у «Алисы», можно попросить включить музыку или можно будет сделать голосовой запрос об эвенкийской кухне, национальной одежде, о знаменитых эвенках. Конечно, проект вызвал эффект разорвавшейся бомбы, но в то же время мы получили достаточно много замечаний.

Для реализации подобного проекта нужен целый набор компетенций — от знания эвенкийского языка до навыков программирования. Как вы их получили и как формировалась команда?

Начну с того, что по профессии я не программист и не лингвист, а эколог. И больше того, хоть и принадлежу к эвенкийскому народу и являюсь потомком известного рода Апросимовых, долгое время нашим языком на должном уровне не владел. Впрочем, именно это и дало мне понимание, как важно сохранение национальной культуры и что для этого могут быть полезны современные технологии.

Все началось с просмотров тематических роликов на YouTube и изучения Google-переводчика. Дальше пришлось очень много учиться. Тем более что на первоначальном этапе у нас и не было ресурсов набрать широкую команду с разнообразными компетенциями. В том числе приходилось много консультироваться на сайте профессионалов в области ИТ — Habr, также в блог-канале «Теплица социальных технологий»*. Данные о языке брали с сайта Еvengus, который ведут лингвисты. Конечно, не всегда получалось успешно, была и своя череда неудач, в какой-то момент стало казаться, что на таком редком языке, как эвенкийский, вообще невозможно запустить работу с применением NLU («естественного распознавания языка». — Прим. ред.). NLU было необходимо для запуска именно голосового решения с последующим голосовым ответом пользователю.

* Министерством юстиции РФ внесен в реестр иностранных агентов.

Помощь пришла неожиданно — из Великобритании. Я много общался в профильных сообществах, и один собеседник из этой страны просто отправил видеосообщение и рассказал, что есть такой код, такая разметка, где можно кастомизировать речь, отправил мне репозитории. Мы начали работу и впервые смогли не только озвучить, но и провести кастомизацию по изучению эвенкийского языка. Именно тогда случился тот яркий момент, когда машина впервые сказала слова на эвенкийском языке. Мы стали применять разметку искусственного интеллекта (AIML), на основе которой созданы популярные языковые ассистенты по всему миру.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Условия победы в гонке за технологиями: инструменты и подходы Условия победы в гонке за технологиями: инструменты и подходы

Что необходимо для победы в технологической гонке? Отвечают эксперты и аналитики

ФедералПресс
Вы в порядке? Вы в порядке?

Что такого, если один в отношениях аккуратист, а другой грязнуля?

VOICE
Программа на перспективу Программа на перспективу

Как Индия стала одной из ведущих IT-стран мира и каковы ее планы на будущее

РБК
Котик на батарейках Котик на батарейках

Откуда в китайском спортседане столько немецкого?

Автопилот
Годовые кольца: 1689 Годовые кольца: 1689

Первый российско-китайский договор и свадьба Петра I: 1689 в событиях

Вокруг света
Как обидеть мужчину: запрещенные приемы Как обидеть мужчину: запрещенные приемы

Как растоптать уверенность мужчины в себе?

Лиза
Все будет гладко Все будет гладко

Целлюлит: генетика или лень? Мнение врачей

Лиза
Аскезы, диджитал-детокс и другое Аскезы, диджитал-детокс и другое

Какие из оздоровительных практик героини решили испытать на себе, и что вышло?

Здоровье
Просто бизнес Просто бизнес

Как продвигать национальные бренды и почему параллельный импорт — рискованно

FP. BusinessReview
10 фактов про Древний Рим, которые кажутся невероятными 10 фактов про Древний Рим, которые кажутся невероятными

На тот случай, если на этой неделе вы еще ни разу не думали про Римскую империю

Maxim
Французский парадокс Французский парадокс

Что едят француженки, чтобы оставаться стройными?

Лиза
Личные границы Личные границы

Каким должен быть забор между соседями в частном доме по закону

Лиза
«Наше кино является нашим лицом» «Наше кино является нашим лицом»

Режиссер Егор Кончаловский о советском кино, американской мечте и русских Рэмбо

FP. BusinessReview
Беспилотные машины и умные дороги: какие риски несет в себе транспорт будущего Беспилотные машины и умные дороги: какие риски несет в себе транспорт будущего

Что нужно регламентировать в законах о беспилотных машинах

Forbes
Только бот простит Только бот простит

Как мы меняем искусственный интеллект и как искусственный интеллект меняет нас

Правила жизни
Сейчас разберемся (в себе) Сейчас разберемся (в себе)

Трансформационные игры – просто забава или способ изменить жизнь?

VOICE
Мужчина мечты Мужчина мечты

Станислав Магкеев приятно удивил нас своей добротой, честностью, даже упрямством

VOICE
Сахарозаменители Сахарозаменители

Насколько безопасны искусственные подсластители?

Здоровье
Приданое, колдовство, ненависть: что такое фемицид и за что убивают женщин Приданое, колдовство, ненависть: что такое фемицид и за что убивают женщин

Фемицид: что это такое и как на убийства женщин реагирует общество?

Forbes
5 наклонностей, которые характеризируют социопатов 5 наклонностей, которые характеризируют социопатов

Как проявляется истинное лицо социопата?

Psychologies
Машины лечат людей: как нейросети используют в российской медицине Машины лечат людей: как нейросети используют в российской медицине

Россия начала активно разрабатывать нейросети в системе здравоохранения

ФедералПресс
Не такие, как мы Не такие, как мы

Странные привычки китайцев, которые тебя удивят

Лиза
5 самых распространенных проблем со стопами — почему они возникают и что с ними делать 5 самых распространенных проблем со стопами — почему они возникают и что с ними делать

Пять самых распространенных подологических патологий

VOICE
Перезагрузка Перезагрузка

Sollers: продолжение следует

Автопилот
Седой Адам Драйвер в гонке со смертью: каким получился «Феррари» Майкла Манна Седой Адам Драйвер в гонке со смертью: каким получился «Феррари» Майкла Манна

«Феррари»: каким получился фильм про роковую страсть к гонкам

Forbes
«Я думала, они жадные и не женятся»: как в 30 лет я вышла замуж за француза и ни разу об этом не пожалела «Я думала, они жадные и не женятся»: как в 30 лет я вышла замуж за француза и ни разу об этом не пожалела

История нашей героини, которая неожиданно вышла замуж за иностранца

VOICE
Утренний и вечерний фитнес Утренний и вечерний фитнес

Когда надо тренироваться – утром или вечером? Свои плюсы и минусы есть во всём

Здоровье
«Звучит незнаемая лира…» «Звучит незнаемая лира…»

Кто такой Антиох Кантемир?

Знание – сила
5 предметов, которые исчезли из школьной программы. Навсегда ли? 5 предметов, которые исчезли из школьной программы. Навсегда ли?

Возможно, школьные дисциплины времен СССР пригодились бы и сегодня?

Psychologies
Свидетельства неслучившегося Свидетельства неслучившегося

Песни Пахмутовой и Добронравова задали эмоциональный режим советского человека

Weekend
Открыть в приложении