Сервисы обязали раскрывать правила применения рекомендательных технологий — вот какие данные собирают некоторые из них
Например, Wildberries и Ozon, «ВКонтакте» и «Яндекс», а также разные онлайн-кинотеатры.
В июле 2023 года Владимир Путин подписал закон о регулировании рекомендательных алгоритмов — согласно ему, сайты должны публично рассказывать, как устроен их механизм рекомендаций. Тех, кто требование проигнорирует, сможет заблокировать Роскомнадздор (это касается и зарубежных сервисов).
С 1 октября, когда закон вступил в силу, российские компании начали публично раскрывать, что анализируют и зачем. Ниже собрали несколько примеров. Подробные справки можно изучить на сайтах самих сервисов.
Маркетплейсы
- Среди данных, которые использует Wildberries: любые действия и запросы на сайте; время посещения сайта и длительность сессии; источники перехода на маркетплейс; регион, страна, часовой пояс на устройстве и геопозиция пользователя; IP-адрес, интернет-провайдер, данные сетевого трафика, устройство и ОС, браузер и файлы cookies; параметры экрана — разрешение, глубина цвета, размещение страницы на экране; данные из личного кабинета и выбираемый ПВЗ.
- Ozon изучает, с какими товарами взаимодействовал покупатель — это около 300 характеристик, среди которых категория, бренд, цена, оценка, доступность экспресс-доставки. И вдобавок анализирует тип действия: покупка, просмотр карточки, добавление в корзину или в избранное. Учитывают также пол и возраст покупателя
- «Яндекс Маркет» анализирует историю поиска товаров и покупок; просмотр товарных страниц; добавления в корзину и избранное; размеры купленной ранее одежды, а также бренды, отмеченные как любимые. Если у товара есть возрастная маркировка, учтут, например, и возраст.
- «Сбермаркет» собирает данные о том, какие товары просматривал покупатель, что покупал и в каких количествах, как часто он выбирал товар со скидкой и когда без и «прочее».
- «Мегамаркет» основывает рекомендации на «поведении» покупателя: какие страницы просматривает, на какие элементы интерфейса нажимает, что за товары добавляет в корзину, когда делал предыдущие заказы и из чего они состояли, а также были ли на эти товары скидки.
Часть сервисов учитывает также агрегированные данные по другим клиентам со схожим поведением.
Видеосервисы
- «Кинопоиск» использует следующие данные: поисковые запросы; историю просмотров витрин и страниц контента; оценки; сохранение фильмов и сериалов в коллекции; продолжительность просмотра (закончил за день или неделю), досматриваемость и пересмотры. Во внимание принимают жанры, названия, сюжет, актёров, режиссеров, наличие у картины наград и премий.
- Start собирает данные о том, что пользователь смотрит, когда и в каком жанре; что добавляет в избранное и как оценивает; досматривает ли единицу контента и как часто к ней возвращается. Опираются также на дату регистрации и IP-адрес, а ещё — на популярность картин, мнения редакции сервиса и опрошенных экспертов.