Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Инвайт одобрения: какие социальные триггеры помогли Clubhouse набрать миллионы пользователей Инвайт одобрения: какие социальные триггеры помогли Clubhouse набрать миллионы пользователей

Clubhouse и забытые стратегии вирусного продвижения

Forbes
Выросла в нищете и рано потеряла отца: непростая судьба тиктокерши Вали Карнавал Выросла в нищете и рано потеряла отца: непростая судьба тиктокерши Вали Карнавал

2 года назад о девочке, открывающей рот под песни в TikTok, никто не знал

Cosmopolitan
Катя Валера Катя Валера

Организаторка фестиваля «Не виновата» и вокалистка фем-панк группы «Лоно»

Собака.ru
Новая книга Гузель Яхиной — это действительно плагиат? Комментарий юриста Новая книга Гузель Яхиной — это действительно плагиат? Комментарий юриста

Юрист Лев Семкин рассказал, нарушает ли книга Гузели Яхиной авторское право

СНОБ
Кормим по-новому Кормим по-новому

Вещи, которые изменились в отношении к грудному вскармливанию

Домашний Очаг
Чудеса на виражах: самые удивительные случаи со звездами на борту лайнеров Чудеса на виражах: самые удивительные случаи со звездами на борту лайнеров

Знаменитости рассказали истории, после которых можно поверить в чудо

Cosmopolitan
Бьюти-эволюция Дмитрия Нагиева: от прапорщика Задова до брутального альфа-самца Бьюти-эволюция Дмитрия Нагиева: от прапорщика Задова до брутального альфа-самца

Дмитрий Нагиев – один из самых харизматичных мужчин отечественного шоу-бизнеса

Cosmopolitan
Мороз и засуха едины Мороз и засуха едины

Голод с большим количеством смертей в Европейской России 1891 года

Дилетант
Не WhatsApp’ом единым: почему в мире столько мессенджеров и кто их использует Не WhatsApp’ом единым: почему в мире столько мессенджеров и кто их использует

Зачем нужно так много мессенджеров

Популярная механика
Долгожданная «Лига справедливости» Зака Снайдера: 4 супергеройских часа периода упадка Долгожданная «Лига справедливости» Зака Снайдера: 4 супергеройских часа периода упадка

Нужен ли супергероике такой хронометраж и можно ли привнести что-то новое в жанр

Esquire
Только между нами Только между нами

Гинеколог, маммолог и эндокринолог: как сохранить женское здоровье

Лиза
Почему мы принимаем насилие за заботу и как это исправить Почему мы принимаем насилие за заботу и как это исправить

Как распознать насилие в отношениях?

Psychologies
Как отключить Яндекс Плюс на смартфоне и компьютере Как отключить Яндекс Плюс на смартфоне и компьютере

Как отключить подписку Яндекс Плюс и отказаться от ее продления

CHIP
Тектоника собственных границ: зачем нам нужны общение и общность Тектоника собственных границ: зачем нам нужны общение и общность

Как мы ищем путь к другим, а на самом деле — к самим себе

РБК
15 советов от косметолога Дженнифер Лопес: гениально! 15 советов от косметолога Дженнифер Лопес: гениально!

Какие советы дает звездный косметолог Гарольд Лансер?

Cosmopolitan
Александр Паль — о дружбе, пранкерах и политической позиции Александр Паль — о дружбе, пранкерах и политической позиции

Александр Паль — о том, как выбирать роли, дружить и смеяться по-настоящему

РБК
Что такое дородовый патронаж беременной? Что такое дородовый патронаж беременной?

Зачем проводится дородовый патронаж

9 месяцев
Оказался он живой Оказался он живой

Эксперты — о способах гуманно тестировать косметику, не используя животных

Glamour
Технология ABS: как не забуксовать в продажах Технология ABS: как не забуксовать в продажах

Что такое account-based selling и как этот инструмент помогает в продажах

Forbes
Особенности подводной ловли нейтрино в зимний период Особенности подводной ловли нейтрино в зимний период

Зачем в толще байкальских вод построили самое высокое сооружение России

Эксперт
Василий Бархатов: «Московская публика – злее» Василий Бархатов: «Московская публика – злее»

Василий Бархатов и Павел Пригара – о выставках, зомби и Яне Фабре

GQ
С плеча и по плечу С плеча и по плечу

Как перепродажа вещей стала называться модным словом «ресейл»

Vogue
С мечтой о Мальте С мечтой о Мальте

Как российский император Павел I протянул руку помощи рыцарям-католикам

Дилетант
Филолог, психиатр и музыкальные критики — о новом альбоме Земфиры Филолог, психиатр и музыкальные критики — о новом альбоме Земфиры

Каким получился новый альбом Земфиры «бордерлайн»?

РБК
Бывшая узница скопинского маньяка: «Главное — никогда не мириться с обстоятельствами» Бывшая узница скопинского маньяка: «Главное — никогда не мириться с обстоятельствами»

Похищение, насилие, годы, проведенные в бункере всего в 90 километрах от дома

Psychologies
Facebook, ответьте: Почему Instagram на Android до сих пор сильно сжимает качество фото Facebook, ответьте: Почему Instagram на Android до сих пор сильно сжимает качество фото

Почему Instagram не решил проблему низкого качества публикуемых фото на Android

Популярная механика
Энциклопедия стиля Михаила Горбачева Энциклопедия стиля Михаила Горбачева

Как идеи перестройки и вкусы одной женщины повлияли на стиль президента СССР

GQ
Как спит Илон Маск и сколько отдыха нужно для здоровья и продуктивности Как спит Илон Маск и сколько отдыха нужно для здоровья и продуктивности

В чем секрет Илона Маска, может ли такой режим отдыха подойти обычному человеку

РБК
Баклер: кулачный щит Средневековья Баклер: кулачный щит Средневековья

История кулачного щита баклера: почему он завоевал такую популярность

Популярная механика
6 техник, которые помогут сказать настоящее «да» 6 техник, которые помогут сказать настоящее «да»

Упражнения, которые помогут нам научиться говорить «да» искренне и уверенно

Psychologies
Открыть в приложении