Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Игры, в которые играют люди Игры, в которые играют люди

Психология человеческих взаимоотношений

kiozk originals
Кинодельни России Кинодельни России

Места России, где снимали лучшие отечественные сериалы

GQ
Бодипозитив не заставляет нас переедать: мнение психолога Бодипозитив не заставляет нас переедать: мнение психолога

Влияние извне не заставит нас заедать проблемы, если мы умеем справляться с ними

Psychologies
Правила для чужих: почему растет вероятность блокировки YouTube и Facebook Правила для чужих: почему растет вероятность блокировки YouTube и Facebook

Какое будущее ждет иностранные интернет-сервисы в России?

Forbes
10 самых уродливых животных, находящихся на грани вымирания 10 самых уродливых животных, находящихся на грани вымирания

Эти странные животные находятся на грани вымирания и ждут помощи от человека

Популярная механика
«Русские коммунисты» и «секс-трон» отца: Vanity Fair рассказал о «сексе, деньгах, наркотиках и предательстве» в семье Арми Хаммера «Русские коммунисты» и «секс-трон» отца: Vanity Fair рассказал о «сексе, деньгах, наркотиках и предательстве» в семье Арми Хаммера

Большой профайл на актера Арми Хаммера

Esquire
«Не забывай свою Валюшу»: история одной бриллиантовой свадьбы «Не забывай свою Валюшу»: история одной бриллиантовой свадьбы

Когда люди вместе проживают многие годы, их связывает большее, чем просто любовь

Psychologies
Лампочка, зажгись! Лампочка, зажгись!

Свежие идеи и нестандартные решения – залог успеха. Но где их взять?

Лиза
Когда и стены помогают Когда и стены помогают

Идеальный интерьер для твоего типа личности

Лиза
Хуан Габриэль Васкес: Нетленный прах. Отрывок из романа Хуан Габриэль Васкес: Нетленный прах. Отрывок из романа

Отрывок из романа «Нетленный прах» Хуана Габриэля Васкеса

СНОБ
Как художник Ли Бауэри повлиял на моду: 5 знаковых моментов Как художник Ли Бауэри повлиял на моду: 5 знаковых моментов

Ли Бауэри — художник, звезда лондонской андерграундной сцены восьмидесятых

Esquire
10 фактов о культовом «Нагане» от концерна «Калашников» 10 фактов о культовом «Нагане» от концерна «Калашников»

«Наган» для русских — как салат оливье

Maxim
Секс на стороне: плюсы и минусы. Отрывок из книги секс-просветителя Маши Халеви «Полиамория. Свобода выбирать» Секс на стороне: плюсы и минусы. Отрывок из книги секс-просветителя Маши Халеви «Полиамория. Свобода выбирать»

Отрывок из книги Маши Халеви, в которой она рассуждает о полиамории

СНОБ
Право на восхождение Право на восхождение

Рождаемся мы личностью или становимся?

Psychologies
Лес дальше не поедет Лес дальше не поедет

Российское правительство ставит задачу увеличить объемы переработки древесины

Эксперт
Место действия Место действия

Самые колоритные места для съемок фильмов

Grazia
Сказка — ложь Сказка — ложь

Gucci и русский фольклор

Grazia
«Я подала на развод!» Асмус, Чехова и другие звездные россиянки, бросившие мужей «Я подала на развод!» Асмус, Чехова и другие звездные россиянки, бросившие мужей

Звезды. которые набрались смелости и сами выступили инициаторами разрыва

Cosmopolitan
Богатая фамилия Богатая фамилия

Топ-20 семейных итальянских бизнесов

Forbes
Защитники Защитники

Рассказываем, как дела у тюленя Крошика и Фонда друзей балтийской нерпы

Собака.ru
Альпийские рудокопы бронзового века полагались на доставку продуктов из соседних поселений Альпийские рудокопы бронзового века полагались на доставку продуктов из соседних поселений

Из каких растений состоял рацион древних альпийских горняков и металлургов

N+1
Космос, наш Космос, наш

Каким был Юрий Гагарин и из чего складывался стиль самого известного космонавта

GQ
Победитель Grammy Imanbek: «Рад, что не поехал на вручение премии» Победитель Grammy Imanbek: «Рад, что не поехал на вручение премии»

Imanbek — о том, как он шел к победе на Grammy и чем планирует заниматься дальше

Cosmopolitan
«Они утонули…»: чудо-танки союзников для высадки в Нормандии «Они утонули…»: чудо-танки союзников для высадки в Нормандии

Танки союзников, что США, что Великобритании, редко удостаивались похвалы

Maxim
Боль украла мою жизнь: как жить с мигренью Боль украла мою жизнь: как жить с мигренью

Это не просто головная боль, а серьезное неврологическое заболевание

Cosmopolitan
Составлен портрет российской предпринимательницы: ей под 40, она ИП, зарабатывает до 200 тыс. руб. в месяц Составлен портрет российской предпринимательницы: ей под 40, она ИП, зарабатывает до 200 тыс. руб. в месяц

Портрет женщины, которая руководит собственным бизнесом в России

Inc.
Моя красотка! Как выглядят мамы Риз Уизерспун, Шэрон Стоун и других звезд кино Моя красотка! Как выглядят мамы Риз Уизерспун, Шэрон Стоун и других звезд кино

Посмотрим на родственниц Мелани Гриффит, Шэрон Стоун и других знаменитостей

Cosmopolitan
Переменные величины Переменные величины

Как заработали состояние богатейшие селфмейдмены мира?

РБК
«Правда всегда где-то между двумя неправдами»: как картины Эдварда Мунка воплотили в себе дух времени «Правда всегда где-то между двумя неправдами»: как картины Эдварда Мунка воплотили в себе дух времени

Как художник Эдвард Мунк увлекает за собой зрителя

Forbes
IceCube увидел следы резонанса Глэшоу IceCube увидел следы резонанса Глэшоу

Это открытие поможет изучить источники астрофизических нейтрино

N+1
Открыть в приложении