Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Виртуальный секс Виртуальный секс

«Популярная механика» протестировала первую в мире виртуальную любовницу

Популярная механика
Одна вокруг света: горы, леса и таблички «не входить» Одна вокруг света: горы, леса и таблички «не входить»

111 серия о кругосветном путешествии москвички Ирины Сидоренко и ее собаки Греты

Forbes
Специалист по смерти Специалист по смерти

Может быть, перед вами будущий ученый с мировым именем?

СНОБ
Трогательно до слез! Фильмы, в которых  любовь оказалась сильнее смерти Трогательно до слез! Фильмы, в которых  любовь оказалась сильнее смерти

Подборка фильмов, где любовь творит чудеса

Cosmopolitan
Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам

Две трети убитых женщин в 2018 году были жертвами домашнего насилия

Cosmopolitan
Детство, отрочество, феминизм Детство, отрочество, феминизм

Анна Толстова о Юлии Цветковой как символе нового российского активизма

Weekend
5 причин пересмотреть «50 оттенков серого» 5 причин пересмотреть «50 оттенков серого»

Пора вновь заглянуть в тайную комнату мистера Грея!

Cosmopolitan
На своём месте На своём месте

Функционально—современный интерьер для молодой семьи

SALON-Interior
Деньги, браки, а счастья нет: трагическая судьба Элизабет Тейлор Деньги, браки, а счастья нет: трагическая судьба Элизабет Тейлор

У Элизабет было все: роли, мужья, дети, состояние... Но была ли она счастлива?

Cosmopolitan
5 простых способов ускорить работу Windows 5 простых способов ускорить работу Windows

Сделай это — и тебе даже не придется покупать новый компьютер

Maxim
Русский чех: как строил бизнес самый богатый человек Чехии Петр Келлнер и при чем тут российская приватизация Русский чех: как строил бизнес самый богатый человек Чехии Петр Келлнер и при чем тут российская приватизация

Как Петр Келлнер строил свой бизнес и сотрудничал с российскими бизнесменами?

Forbes
Эротика со слезами: знаменитые кинопары, которые в жизни ненавидели друг друга Эротика со слезами: знаменитые кинопары, которые в жизни ненавидели друг друга

Съемки в откровенных сценах не всегда заканчиваются для актеров бурными романами

Cosmopolitan
Живее всех живых. Цой на сцене и в плейлисте актеров театра «Современник» Живее всех живых. Цой на сцене и в плейлисте актеров театра «Современник»

Актеры театра «Современник» — о любимых песнях Виктора Цоя

СНОБ
3 практики для борьбы с негативом 3 практики для борьбы с негативом

Практики осознанности поддерживают нас, когда тревога не дает дышать

Psychologies
«Равный доступ к счастью возможен»: чем занимаются эксперты по устойчивому развитию в больших компаниях «Равный доступ к счастью возможен»: чем занимаются эксперты по устойчивому развитию в больших компаниях

Ольга Лучина — о том, с чего начать изменение корпоративной культуры

Forbes
Союз нерушимый Союз нерушимый

Семейные союзы в дизайне, архитектуре и искусстве

AD
«Угроза невежеству»: кто такая Аманда Горман, которая читала свою поэму на инаугурации Байдена «Угроза невежеству»: кто такая Аманда Горман, которая читала свою поэму на инаугурации Байдена

Афроамериканка Аманда Горман — первый молодежный национальный поэт-лауреат США

Forbes
Мать пыталась ее убить? Тайна прошлого самой сильной женщины России Мать пыталась ее убить? Тайна прошлого самой сильной женщины России

История Оксаны Кошелевой — «женщины-скалы»

Cosmopolitan
Светящиеся утконосы и еще 8 внезапных фактов, чтобы блеснуть в разговоре Светящиеся утконосы и еще 8 внезапных фактов, чтобы блеснуть в разговоре

Сборник фактов на все случаи и разговоры в жизни!

Maxim
Бурные реки TikTok: как запустить рекламу в растущей соцсети и не наделать ошибок Бурные реки TikTok: как запустить рекламу в растущей соцсети и не наделать ошибок

Как не потерять деньги, запуская рекламу в TikTok

Forbes
Сменить колею: что не так с транспортной политикой в России Сменить колею: что не так с транспортной политикой в России

Почему транспортная политика в России не работает

Forbes
«Науку в России делают женщины». Трансплантолог о своей работе «Науку в России делают женщины». Трансплантолог о своей работе

Женщина-трансплантолог о науке, своей работе и биотехнологиях

СНОБ
Правильно ли вы ухаживаете за волосами? Правильно ли вы ухаживаете за волосами?

Вы недавно переболели и вдруг заметили, что волосы стали выпадать?

Худеем правильно
Не блести как блин! Как не испортить лицо хайлайтером расскажет наш визажист Не блести как блин! Как не испортить лицо хайлайтером расскажет наш визажист

Хайлайтер обладает поистине магической энергией!

Cosmopolitan
44 ребенка к 39 годам: история самой многодетной матери из ныне живущих 44 ребенка к 39 годам: история самой многодетной матери из ныне живущих

Как живет самая многодетная мать на планете?

Cosmopolitan
Женщина перестала заниматься домом, чтобы проучить ленивого мужа Женщина перестала заниматься домом, чтобы проучить ленивого мужа

Помогает ли вам по хозяйству партнер? Участвуют ли дети в домашних делах?

Psychologies
Полина Оганичева Полина Оганичева

модель Полина Оганичева начале ее карьеры, любимых съемках и отношении к моде

Grazia
История одной песни: «Macarena» Los del Rio, 1995 История одной песни: «Macarena» Los del Rio, 1995

33 года ушло у дуэта Los del Rio, чтобы родить свой единственный хит

Maxim
Дело не в деньгах: почему в России не получается создавать премиальные бьюти-бренды Дело не в деньгах: почему в России не получается создавать премиальные бьюти-бренды

Отсутствие инвестиций, внутренние проблемы рынка — проблемы бьюти-индустрии

Forbes
«Трудности перевода»: чешские лыжи, страшные волки и мой неудавшийся роман «Трудности перевода»: чешские лыжи, страшные волки и мой неудавшийся роман

Одна из таких трагикомичных историй про разницу менталитетов

Psychologies
Открыть в приложении