Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Начальные навыки пассивно-агрессивного общения в переписке Начальные навыки пассивно-агрессивного общения в переписке

Настало время использовать глубинные навыки в Интернет-общении

Maxim
Бактерии в офисе: где их больше всего? Бактерии в офисе: где их больше всего?

Разбираемся, где именно собирается больше всего бактерий в типичном офисе

CHIP
Как помириться с девушкой после сильной ссоры: 9 шагов к восстановлению мира межу вами Как помириться с девушкой после сильной ссоры: 9 шагов к восстановлению мира межу вами

Что делать после конфликта с возлюбленной?

Playboy
Ученые назвали 5 причин, по которым спать на работе полезно Ученые назвали 5 причин, по которым спать на работе полезно

Новые исследования рекомендуют работникам интеллектуального труда спать днем

Maxim
Космическая лихорадка: когда начнут майнить астероиды и на что пустят добытые ресурсы? Космическая лихорадка: когда начнут майнить астероиды и на что пустят добытые ресурсы?

Из каких драгоценных металлов могут состоять космические тела?

Esquire
Будь меркантильной: 9 проявлений его жадности, которые нельзя прощать Будь меркантильной: 9 проявлений его жадности, которые нельзя прощать

Проявления мужской жадности, которые прощать никак нельзя

Cosmopolitan
Одна вокруг света: морские слоны, пожары и генеральские секвойи Одна вокруг света: морские слоны, пожары и генеральские секвойи

112 серия о кругосветном путешествии москвички Ирины Сидоренко и ее собаки Греты

Forbes
Комбайн с искусственным интеллектом и экзоскелеты: как женщины создают роботов в России Комбайн с искусственным интеллектом и экзоскелеты: как женщины создают роботов в России

Женщины из России рассказали, как придумывают экзоскелеты и комбайны

Forbes
«Мы вложили в проект €5,5 млн»: как бизнесмен Андрей Щербинин открыл миру «русского Моне» «Мы вложили в проект €5,5 млн»: как бизнесмен Андрей Щербинин открыл миру «русского Моне»

Андрей Щербинин — о выставке забытого художника Константина Кузнецова

Forbes
«Бабуля, садись!»: позволим детям взрослеть «Бабуля, садись!»: позволим детям взрослеть

Хотите, чтобы дети выросли успешными и счастливыми?

Psychologies
Как превратить спальню в оазис сна: полный гайд для качественного отдыха Как превратить спальню в оазис сна: полный гайд для качественного отдыха

Пора начать высыпаться!

Playboy
На своём месте На своём месте

Функционально—современный интерьер для молодой семьи

SALON-Interior
Тайный роман с Челентано и ранние роды: 5 удивительных фактов об Орнелле Мути Тайный роман с Челентано и ранние роды: 5 удивительных фактов об Орнелле Мути

Итальянская актриса Орнелла Мути покорила сердца миллионов мужчин

Cosmopolitan
Женское дело Женское дело

Анджелина Джоли — об осознанности, воспитании детей и борьбе за права беженцев

Vogue
Как 20-летний железнодорожник-самоучка стал лауреатом Как 20-летний железнодорожник-самоучка стал лауреатом

Как музыкант-самоучка из Казахстана получил "Грэмми" за лучший ремикс

Esquire
Как продлить свою жизнь на 4-7 лет, приобретя маленькие полезные привычки и отказавшись от вредных Как продлить свою жизнь на 4-7 лет, приобретя маленькие полезные привычки и отказавшись от вредных

Больше хороших привычек!

Maxim
100 причин, почему я тебя люблю: оригинальный подарок девушке 100 причин, почему я тебя люблю: оригинальный подарок девушке

Подборка сладких фраз, которые можно сказать возлюбленной

Playboy
Правила жизни Гэри Олдмана Правила жизни Гэри Олдмана

Актер, Лондон, 63 года

Esquire
Виды на космос Виды на космос

Сложно сказать, когда человечество впервые захотело попасть в космос

Вокруг света
29 первых разов в жизни мужчины 29 первых разов в жизни мужчины

Мужская жизнь в цифрах, датах и прочей ерунде

Maxim
Как компания Louis Vuitton построила... вертолет Как компания Louis Vuitton построила... вертолет

Неужели под маркой Louis Vuitton создавались летательные аппараты?

Популярная механика
Баклер: кулачный щит Средневековья Баклер: кулачный щит Средневековья

История кулачного щита баклера: почему он завоевал такую популярность

Популярная механика
Хороший и плохой сахар: как работает сахароза, фруктоза и глюкоза Хороший и плохой сахар: как работает сахароза, фруктоза и глюкоза

Если вы давно мечтаете отказаться от сахара, то нужно понять, каким он бывает

Популярная механика
Комета Борисова оказалась реликтом экзопланетной системы Комета Борисова оказалась реликтом экзопланетной системы

До встречи с Солнцем комета оставалась нетронутой с момента своего образования

N+1
Вопросы урологу о самом главном Вопросы урологу о самом главном

Эксперт в области мужского здоровья отвечает на важные вопросы

Playboy
Загадка, сэр! Загадка, сэр!

«Кэмпденское чудо» Англии

Дилетант
Мать сына Илона Маска: кто такая Граймс и почему она крутая Мать сына Илона Маска: кто такая Граймс и почему она крутая

Объясняем, почему Граймс и без Маска супер и почему их союз закономерен

РБК
Как взять интервью и разговорить человека: 11 шагов для получения любой информации Как взять интервью и разговорить человека: 11 шагов для получения любой информации

Как брать интервью и от чего зависит успешный исход беседы?

Playboy
Новая деловая культура: как бизнес-клубы помогают расти предпринимателям и зачем в них вступать Новая деловая культура: как бизнес-клубы помогают расти предпринимателям и зачем в них вступать

Рынок сегодня предлагает множество вариантов объединения в деловые клубы

Inc.
Второй по популярности: что нужно знать о раке кишечника Второй по популярности: что нужно знать о раке кишечника

Рак кишечника – общее название онкологических заболеваний

Cosmopolitan
Открыть в приложении