Интерфейс под алгоритмы: почему рекомендации TikTok такие затягивающие
Предприниматель Юджин Вей рассуждает, как слаженная работа механизмов китайской соцсети позволяет системе непрерывно учиться и удерживать более 800 млн пользователей.
Массивы данных и машинное обучение
Удивительно, насколько с недавнего времени улучшилось машинное обучение только за счёт тренировки на больших массивах данных, пусть даже новые алгоритмы не сильно отличаются от старых. Один из примеров — модель GPT-3. Она пишет поэмы и техническую документацию, генерирует табулатуры и решает математические задачи.
В некоторых областях данных для обучения много: корпусы текстов для языковых моделей, фотобанки для визуального ИИ. Но у TikTok поначалу не было ни базы с короткими видео (с мемами, танцующими детьми и рекламой брендов), ни данных о том, нравятся ли они пользователям. Сервису оставалось самому стать источником тренировочных массивов.
Интерфейс и алгоритмы рекомендаций
Когда речь заходит об алгоритмах китайской соцсети, многие представляют себе какой-то волшебный фрагмент кода. Но знатоки отрасли считают, что в целом TikTok подходит к решению задач машинного обучения сходно с остальными компаниями.
Для сервисов вроде TikTok успех во многом зависит от того, как работают алгоритмы машинного обучения. И чтобы они работали на вас, сначала нужно поработать над ними — помочь им «увидеть», замечает Веи.
Перед тем как видео попадёт в ленту рекомендаций пользователя, его посмотрит сотрудник отдела по контенту и расставит метки:
- Что на видео: танцы, пение под фонограмму, видеоигры, котёнок, еда.
- Кто на видео: мужчина или женщина, сколько их, какого они возраста.
- Где происходит действие.
- Какие фильтры и эффекты.
Видео также анализирует система ИИ, причём иногда даже во время съёмки: некоторые фильтры в TikTok фиксируют изменения мимики и движения тела.