Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Вегунец»: Nestle начинает продажи веганского тунца «Вегунец»: Nestle начинает продажи веганского тунца

Продукт состоит из шести компонентов неживотного происхождения

National Geographic
Зеленый поворот: как ТМК борется за экологию Зеленый поворот: как ТМК борется за экологию

Экологические тренды в российской промышленности

Эксперт
История пари, которое парализовало Лондон и стало причиной первой пробки в истории городов История пари, которое парализовало Лондон и стало причиной первой пробки в истории городов

Как один британец поспорил, что сделает любой дом самым известным в столице

Maxim
Герои книг на приеме у психотерапевта: о чем рассказывает «Превращение» Франца Кафки Герои книг на приеме у психотерапевта: о чем рассказывает «Превращение» Франца Кафки

Что, если бы литературные герои обратились вовремя к психотерапевту?

Forbes
10 книг, которые нужно прочитать этой весной 10 книг, которые нужно прочитать этой весной

«Иерусалим» Алана Мура и другие книжные новинки, которые нельзя пропустить

Esquire
«Валериан»: как Люк Бессон шел к главному фильму всей своей жизни «Валериан»: как Люк Бессон шел к главному фильму всей своей жизни

Из чего состоит мультивселенная самого амбициозного режиссера Европы

Esquire
Как перестать заедать стресс? Как перестать заедать стресс?

Мало кто способен управлять своим состоянием во время переживаний

Худеем правильно
Пицца высокого полета Пицца высокого полета

Каким будет рацион первых колонизаторов Луны и Марса

GQ
«Ищите негативные отзывы, особенно от друзей»: правила Илона Маска «Ищите негативные отзывы, особенно от друзей»: правила Илона Маска

Правила бизнеса от Илона Маска

Forbes
Приложение без фильтров: станет ли Dispo новым Instagram для зумеров Приложение без фильтров: станет ли Dispo новым Instagram для зумеров

Как создали Dispo и что сделало его популярным среди молодежи?

Forbes
Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам

Две трети убитых женщин в 2018 году были жертвами домашнего насилия

Cosmopolitan
Искусство легких касаний Искусство легких касаний

«Супернова» — история любви и боли

СНОБ
Замечательный сосед: лучший кандидат на изучение атмосферы чужих миров Замечательный сосед: лучший кандидат на изучение атмосферы чужих миров

Экзопланета, находящаяся всего в 26 световых годах от нас

Популярная механика
Пляшущие человечки Пляшущие человечки

Как танцевальные движения придают тебе ловкости и укрепляют организм?

Playboy
Новая гипотеза происхождения Омуамуа объясняет все странности межзвездного Новая гипотеза происхождения Омуамуа объясняет все странности межзвездного

Ученые разработали гипотезу происхождения Омуамуа, объясняющую его поведение

Популярная механика
Марта Леман — о важности перемен в управлении и собственном образе Марта Леман — о важности перемен в управлении и собственном образе

Как стать успешным управленцем будущего?

РБК
Женщина, пытавшаяся забеременеть целый год, оказалась биологическим мужчиной Женщина, пытавшаяся забеременеть целый год, оказалась биологическим мужчиной

Женщина из Китая в 25 лет узнала, что биологически она является мужчиной

National Geographic
Александр Незлобин и Елена Новикова шутят о протестах, политике, женщинах и геях Александр Незлобин и Елена Новикова шутят о протестах, политике, женщинах и геях

Стендаперы — о том, как юмор в России превращается в последнее прибежище свободы

СНОБ
Соединение из китайской травы оказалось эффективным мужским контрацептивом Соединение из китайской травы оказалось эффективным мужским контрацептивом

Соединение триптонид обладает противозачаточными свойствами

National Geographic
Пикет нужен? Пикет нужен?

Феминистка и поэтесса Дарья Серенко о феминизме, активизме, травле и выгорании

Elle
Одна вокруг света: легенды Долины смерти и места славы U2 Одна вокруг света: легенды Долины смерти и места славы U2

113-ая серия о кругосветном путешествии Ирины Сидоренко и ее собаки Греты

Forbes
7 самых странных средств от похмелья 7 самых странных средств от похмелья

Человечество всегда искало и находило средства для лечения похмелья

Maxim
История студенческого театра МГУ История студенческого театра МГУ

Изучаем историю театра МГУ — от постановок XVIII столетия до театра МОСТ

Культура.РФ
Размер не имеет значения? Откровенные истории о больших и маленьких сюрпризах Размер не имеет значения? Откровенные истории о больших и маленьких сюрпризах

Наши героини поведали свои истории о нестандартных членах

Cosmopolitan
Что нужно знать о витамине E — самом противоречивом из всех Что нужно знать о витамине E — самом противоречивом из всех

Разбираемся, зачем нужен витамин E и кому стоит его принимать

РБК
В южноамериканских лесах отыскали новые виды визжащих сов В южноамериканских лесах отыскали новые виды визжащих сов

Новые виды визжащих сов находятся под угрозой исчезновения

National Geographic
Хотите стать успешнее? Нейробиолог назвал 4 самых важных навыка достижения целей — и как их развить Хотите стать успешнее? Нейробиолог назвал 4 самых важных навыка достижения целей — и как их развить

Как вы можете развить когнитивный контроль, чтобы достигать большего

Inc.
Эльбаз и его фабрика грез Эльбаз и его фабрика грез

Кутюрье Альбер Эльбаз триумфально возвращается в моду

Elle
Как приводили в исполнение смертные приговоры в 1990-х Как приводили в исполнение смертные приговоры в 1990-х

Отрывок из книги Евы Меркачёвой о быте и взаимоотношениях заключенных

СНОБ
Отсрочка до кризиса: как Джозеф Байден формирует внешнеполитический курс Отсрочка до кризиса: как Джозеф Байден формирует внешнеполитический курс

Белый дом пытается сохранить для себя свободу маневра во внешней политике

Forbes
Открыть в приложении