Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему предприниматели-адреналинщики достигают успеха Почему предприниматели-адреналинщики достигают успеха

Почему бизнесмену важно уметь и любить рисковать

СНОБ
Ваш выход Ваш выход

Интервью с Еленой Север — соорганизатором и бессменной ведущей Премии BraVo

OK!
Круче королевы Елизаветы! Какие сокровища хранит российская монархия? Круче королевы Елизаветы! Какие сокровища хранит российская монархия?

Самые красивые и дорогие ювелирные изделия, которые хранит российская монархия

Cosmopolitan
10 самых уродливых животных, находящихся на грани вымирания 10 самых уродливых животных, находящихся на грани вымирания

Эти странные животные находятся на грани вымирания и ждут помощи от человека

Популярная механика
Глобальный сдвиг или глубочайший кризис: каким будет 2021 год Глобальный сдвиг или глубочайший кризис: каким будет 2021 год

Список главных трендов года

РБК
15 книг о психологии, которые стоит прочитать 15 книг о психологии, которые стоит прочитать

Список книг по психологии, которые помогут лучше общаться с окружающими

GQ
«Никогда не знаешь, когда тигр обратится против тебя»: опала Джека Ма напугала китайский бизнес «Никогда не знаешь, когда тигр обратится против тебя»: опала Джека Ма напугала китайский бизнес

Случай с Джеком Ма, впавшим в немилость властей, напугал предпринимателей

Forbes
Как принять себя и полюбить: руководство по заботе о классном парне по имени «ты» Как принять себя и полюбить: руководство по заботе о классном парне по имени «ты»

Чем вредно отсутствие любви к себе?

Playboy
Мазепа: гетман, меценат, изменник Мазепа: гетман, меценат, изменник

Иван Мазепа — гетман, интриган и политик, совершивший роковые ошибки

Дилетант
Искусственные сердечные клапаны выросли вместе с сердцами ягнят Искусственные сердечные клапаны выросли вместе с сердцами ягнят

Искусственные сердечные клапаны, которые могут расти вместе с сердцем

N+1
Как гены влияют на вкус еды и можно ли изменить пищевые пристрастия Как гены влияют на вкус еды и можно ли изменить пищевые пристрастия

Большую роль в формировании наших вкусов играют гены

РБК
Домой, в Европу Домой, в Европу

Квартира для супругов, которые много лет работали в европейских странах

SALON-Interior
«Юнона» построила карту распределения межпланетной пыли «Юнона» построила карту распределения межпланетной пыли

Источник пыли может быть связан с Марсом и его спутниками

N+1
«Валериан»: как Люк Бессон шел к главному фильму всей своей жизни «Валериан»: как Люк Бессон шел к главному фильму всей своей жизни

Из чего состоит мультивселенная самого амбициозного режиссера Европы

Esquire
Герой прошедшего времени Герой прошедшего времени

Кто виноват в закате карьеры Джонни Деппа и что с этим делать?

Glamour
Туда и дорога Туда и дорога

Портрет родной страны глазами фотографа и блогера Илии Воскресенского

GQ
Как пить «тот самый» апероль: подсказки для максимального наслаждения популярным аперитивом Как пить «тот самый» апероль: подсказки для максимального наслаждения популярным аперитивом

Советы, с чем можно смешать апероль, а также закуски к итальянскому аперитиву

Playboy
Как сельский учитель Дмитрий Давыдов за 11 дней снял фильм «Пугало» и стал звездой кинофестивалей Как сельский учитель Дмитрий Давыдов за 11 дней снял фильм «Пугало» и стал звездой кинофестивалей

Дмитрий Давыдов уверен — успех якутского кино кроется в характере его создателей

Forbes
20 лет спустя 20 лет спустя

Алексей Чадов — о том, каково ему на новом «фронте»

OK!
Лексика слабаков: как «бесхребетные» слова снижают эффективность Лексика слабаков: как «бесхребетные» слова снижают эффективность

Дэйв Эспри: от того, как вы излагаете мысли, зависит, какой будет ваша жизнь

Forbes
Живее всех живых. Цой на сцене и в плейлисте актеров театра «Современник» Живее всех живых. Цой на сцене и в плейлисте актеров театра «Современник»

Актеры театра «Современник» — о любимых песнях Виктора Цоя

СНОБ
«Никаких совещаний по средам». Как я спас своих сотрудников от Zoom-выгорания «Никаких совещаний по средам». Как я спас своих сотрудников от Zoom-выгорания

Постоянные чаты и совещания в онлайн привели к zoom-выгоранию

Inc.
Детство, отрочество, феминизм Детство, отрочество, феминизм

Анна Толстова о Юлии Цветковой как символе нового российского активизма

Weekend
Вылет из гнезда в утренние часы не повысил выживаемость птенцов лазоревок Вылет из гнезда в утренние часы не повысил выживаемость птенцов лазоревок

Склонность покидать гнездо утром связана с динамикой развития птенцов

N+1
Тайный роман с Челентано и ранние роды: 5 удивительных фактов об Орнелле Мути Тайный роман с Челентано и ранние роды: 5 удивительных фактов об Орнелле Мути

Итальянская актриса Орнелла Мути покорила сердца миллионов мужчин

Cosmopolitan
Яркий цвет, супердлина и блестки: маникюр российских звезд крупным планом Яркий цвет, супердлина и блестки: маникюр российских звезд крупным планом

Наши звезды всегда отличались оригинальным вкусом и чувством стиля

Cosmopolitan
Незаметное похудение: как мы сжигаем калории, не зная об этом Незаметное похудение: как мы сжигаем калории, не зная об этом

Человеческий организм — штука крайне сложная и умная

Cosmopolitan
Настя Ивлеева Настя Ивлеева

Настя Ивлеева: «Цифровая реальность – это в высшей степени сексуально!»

Playboy
Как заснуть снова, если проснулся среди ночи? Как заснуть снова, если проснулся среди ночи?

Работающая техника по засыпанию от американских психологов

Maxim
Миграция в виртуальную реальность и переселение на другие планеты произойдут быстрее, чем вы думаете Миграция в виртуальную реальность и переселение на другие планеты произойдут быстрее, чем вы думаете

Отрывок из книги «Будущее быстрее, чем вы думаете» Питера Диамандис

Inc.
Открыть в приложении