Яндекс разработал языковую модель для генерации текстов

Григорий Копиев

Яндекс представил нейросетевой языковой алгоритм генерации текстов YaLM и сервис «Зелибоба» на его основе. Сервис умеет подбирать следующее слово в предложении и благодаря этому писать небольшие тексты на основе нескольких слов, введенных пользователем. Языковая модель, лежащая в основе «Зелибобы», была обучена на нескольких терабайтах русскоязычных текстов, в том числе статьях Википедии, новостных заметках и постах в социальных сетях.

В последние несколько лет в области алгоритмов обработки естественного языка произошел заметный прогресс, связанный с несколькими факторами. Во многом это связано с разработанной в 2017 году исследователями из Google архитектурой нейросетей, называемой Transformer. Наиболее известна архитектура Transformer по семейству нейросетевых моделей GPT, разработанных OpenAI. Начиная с модели GPT-2 качество создания текста стало настолько высоким, что разработчики, опасаясь использования его для недобросовестных целей, решили не выкладывать в общий доступ полную модель, ограничившись упрощенной.

Качество создаваемого текста в нейросетях этого типа зависит от разных факторов, во многом от количества используемых в сети параметров. В GPT-2 их было полтора миллиарда, а в GPT-3, представленной в прошлом году, уже 175 миллиардов, что позволило после обучения всего на нескольких примерах выполнять задачи по работе с текстом разного типа, в том числе писать стихи, отвечать

Яндекс разработал языковую модель для генерации текстов

Рекомендуемые статьи

Кит Харингтон: жизнь — «штука с закавыкой»

Полноценный сон — один из главных факторов здоровой и счастливой жизни

Подборка из пяти ретрофотографий, на которых происходит что-то странное

Книги, которые помогут трезво посмотреть на исторические события

Сыновья становятся любимыми детьми матерей, а дочери — отцов, так ли это?

Поэты и писатели подскажут, как пережить непростые времена

Музыкант Егор Крид известен своими романами с популярными красавицами

Контроль за сном может вызвать ортосомнию, или одержимость здоровым сном

На старой фотографии Свердловск, сирень и пальто как часть юности и целой эпохи

В плей-листе режиссера сериала Happy End — начинающие артисты и Алла Пугачева

Вашей пары больше нет — как примириться с новой реальностью и жить дальше?

Почему Шайа Лабаф стал если не великим актером, то королем непринужденного стиля

Что поможет меньше концентрироваться на успехах других людей?

Ученые разработали клетки, способствующие выработке пептида-1

Красная фата, цветочные венки, соленый кофе: традиции турецкой свадьбы

Как использовать оргструктуру на полную мощность

Как сейчас живут группы «Фабрики звезд»?

Почему мы влюбляемся в тех, с кем отношения точно не сложатся?

Каким запомнили 1941 год дети войны? Какие эмоции сопровождали их летом?

Похожие проблемы могут стать почвой для дружбы совершенно разных людей

Как сложилась судьба невесток Елизаветы II?

Эксперт: как правильно составить анкету в Tinder

Все чаще можно услышать, будто рост цен в США выходит из-под контроля

Группу курганов в Калмыкии оставили кочевники-скотоводы

Использование обоняния при поиске пищи зафиксировано у аистов впервые

Что нужно промышленникам для успешного экспорта своей продукции?

Отрывок из из автобиографии Дарьи Клишиной «Прыжок вверх»

Как маркетологи продают нам целебную «легкую» воду и пугают страшной «тяжелой»

Как ведут себя мужчины, не имеющие на девушку серьезных планов.

Откуда берутся в воде продукты фарминдустрии и как защититься от них?