Мы из будущего
Мы довольно часто в своих материалах упоминали людей новых профессий, таких как промт-дизайнеры или AI-тренеры, но никогда не видели их вживую и очень смутно представляли, чем же они занимаются. И вот наконец удовлетворили свое любопытство.
Виктория Гусева, AI-тренер
Люди этой профессии пишут идеальные тексты, которые вы никогда не прочитаете.
Я руководитель AI-тренеров. AI-тренер – профессия очень молодая, она появилась в «Яндексе» только полгода назад, в апреле, но сейчас в компании уже работают около 500 таких специалистов.
ГЕНЕРАТИВНЫЕ НЕЙРОСЕТИ УЧАТСЯ В ДВА ЭТАПА. На первом этапе обучения ИИ разработчики и аналитики «скармливают» нейросети огромное количество информации: книги, энциклопедии, сайты. От того, чем «накормили» модель, зависит ее грамотность и уровень эрудиции. Если перебрать с Достоевским, получим «хтонь», с Джойсом – «поток сознания». Поэтому «еда» должна быть разнообразной. На втором этапе подключается человек. Задачи тренеров ИИ разделяют на два типа: написание эталонных текстов, которыми потом «кормят» нейросеть, и ранжирование текстов, которые создал искусственный интеллект.
AI-тренер готовит ответы на инстракты, то есть запросы к нейросети. Грубо говоря, человек показывает, как нужно отвечать, а нейросеть на этих примерах учится. При оценке ответов нейросети мы сравниваем несколько ответов модели на один запрос и ранжируем их от лучших к худшим, опираясь на определенные критерии. Это абсолютно разные инстракты на разные темы. Я могу оценивать ответы модели про равнобедренный и равносторонний треугольники или про что-то из литературы – например, объяснение, о чем рассказ Платонова «В прекрасном и яростном мире».
ТРЕБОВАНИЯ К AI-ТРЕНЕРАМ НЕ ПРОСТЫЕ. Во-первых, требуется хороший русский язык, умение легко писать и быстро адаптироваться к разным жанрам: создавать и публицистику, и художественную прозу – рассказы, а порой и стихи. Во-вторых, необходимо перепроверять данные, а для этого нужны и широкий кругозор, и навык фактчекинга. У модели нет цели обмануть человека, просто она может считать, что все написанное ею – правда. А это не всегда так. Нормы выработки у редакторов нет: написание сложного технического текста может занять полдня, столько же требует и творческая работа, например написание рассказа. Бывают простые генерации, а бывают дни, когда тяжеловато. Например, мне как-то попалось задание написать логичный и осмысленный текст, в котором нужно было использовать несколько не связанных между собой слов: «конь», «стул», «28». Ранжирование тоже непростая и нетривиальная задача. Ответы нужно проверять на полезность, правдивость, этичность и безвредность. Рекорд нашей команды – 20 ранжирований в день.
ПРОФЕССИЯ AI-ТРЕНЕРА МОЛОДАЯ, И ТЕКУЧКИ КАДРОВ ПОЧТИ НЕТ. По описанию работа кажется рутинной, но это не так. У нас в команде очень эрудированные и остроумные люди. И мы каждый день над чем-то смеемся, потому что запросы поступают весьма причудливые. Да, есть рутина, но и творчества тоже много. Мы должны находить лучшие ответы и помогать нейросети строить оптимальные алгоритмы.