Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Аналитики рассказали, что должны делать лидеры компаний, чтобы добиться успеха в 2021 году Аналитики рассказали, что должны делать лидеры компаний, чтобы добиться успеха в 2021 году

Что могут сделать компании, чтобы сотрудники чувствовали себя комфортно?

Inc.
Осколок зеркала Осколок зеркала

Новая концепция космоса слишком земная

Esquire
Спаржа Спаржа

Готовьтесь, в апреле начинается сезон спаржи

Здоровье
Топ сериалов Нетфликс по версии Playboy: 15 шоу, от которых невозможно оторваться Топ сериалов Нетфликс по версии Playboy: 15 шоу, от которых невозможно оторваться

Сериалы Нетфликс — от комедий до исторических драм

Playboy
Почему мы потакаем другим и как это прекратить Почему мы потакаем другим и как это прекратить

Иногда чрезмерная забота вредит и нашим близким, и нам самим

Psychologies
Первичный фосфор для первичной жизни Первичный фосфор для первичной жизни

Aосфор — один из важнейших химических элементов, из которых строятся организмы

Наука и жизнь
«Это событие для российской игровой индустрии»: основатели студии FIFTYTWO о приставках из детства и русской игре в Apple Arcade «Это событие для российской игровой индустрии»: основатели студии FIFTYTWO о приставках из детства и русской игре в Apple Arcade

В детстве они мечтали о приставке Dendy, а сегодня придумывают сложные механики

Esquire
Под колпаком: как нами управляют приложения для знакомств и родительского контроля Под колпаком: как нами управляют приложения для знакомств и родительского контроля

Не все полезные приложения безвредны

Forbes
Пять стадий Египта Пять стадий Египта

Пройдя все стадии принятия Египта, я был вознагражден

Вокруг света
Специалисты с синдромом самозванца работают лучше, чем уверенные в себе, показало исследование Специалисты с синдромом самозванца работают лучше, чем уверенные в себе, показало исследование

Синдром самозванца никак не влияет на производительность труда специалистов

Inc.
10 животных с самыми мощными укусами 10 животных с самыми мощными укусами

Тем, кто использует челюсти для убийства добычи, лучше не класть палец в рот

Популярная механика
В Исландии началось извержение из 500-метровой вулканической трещины В Исландии началось извержение из 500-метровой вулканической трещины

На исландском полуострове началось первое за 800 лет вулканическое извержение

N+1
С плеча и по плечу С плеча и по плечу

Как перепродажа вещей стала называться модным словом «ресейл»

Vogue
Красные пятна, зуд, морщины: 7 признаков рака груди, которые часто игнорируют Красные пятна, зуд, морщины: 7 признаков рака груди, которые часто игнорируют

Первые признаки рака молочной железы

Cosmopolitan
Что ели в Древнем Китае Что ели в Древнем Китае

Рецепты, по которым готовили в Древнем Китае

СНОБ
15 цепляющих фильмов о семейных ценностях 15 цепляющих фильмов о семейных ценностях

Фильмы о близких людях, семье и любви

Cosmopolitan
Станьте счастливее с помощью практики прощения и энергии благодарности. 9 способов от «отца» биохакинга Станьте счастливее с помощью практики прощения и энергии благодарности. 9 способов от «отца» биохакинга

46 правил, чтобы стать более умной, здоровой, счастливой и спокойной

Inc.
10 сериалов и фильмов Netflix, основанных на книгах 10 сериалов и фильмов Netflix, основанных на книгах

«Ход королевы», «Бриджертоны» и другие экранизации Netflix

Esquire
Линии передач Линии передач

Авангардный интерьер в доме напротив Шуховской башни

AD
Сколько мегапикселей нужно камере на самом деле? Сколько мегапикселей нужно камере на самом деле?

Cколько мегапикселей нужно, чтобы снимать хорошие фотографии?

CHIP
13 мифов о женщинах 13 мифов о женщинах

Думаешь, знаешь женщин так же хорошо, как знал таблицу умножения в пятом классе?

Maxim
Перспективы колонизации мира иного, или Для кого на Марсе будет что-нибудь цвести Перспективы колонизации мира иного, или Для кого на Марсе будет что-нибудь цвести

Зачем людям осваивать Марс?

СНОБ
Как перестать заедать стресс? Как перестать заедать стресс?

Мало кто способен управлять своим состоянием во время переживаний

Худеем правильно
«Сегодня на iPhone снимают даже обложки TIME»: фотограф Константин Чалабов о первых онлайн-съемках «Сегодня на iPhone снимают даже обложки TIME»: фотограф Константин Чалабов о первых онлайн-съемках

Фотограф Константин Чалабов о соединении творческого и технологического

Esquire
Винная карта Винная карта

Пора проехаться по лучшим российским винодельням

GQ
«Цифровой след оставляют все» «Цифровой след оставляют все»

Слияние данных из разных источников — технология и настоящего, и будущего

Forbes
Любовница императора, военный министр и владелец казино. Топ-3 коррупционеров Российской империи Любовница императора, военный министр и владелец казино. Топ-3 коррупционеров Российской империи

На чем зарабатывали самые известные коррупционеры накануне революции 1917 года

СНОБ
3D-моделирование помогло прочитать древнерусские надписи на стенах собора 3D-моделирование помогло прочитать древнерусские надписи на стенах собора

Ученые смогли восстановить текст древнейшего памятника письменности

Популярная механика
«Месмеризм и конец эпохи Просвещения во Франции» «Месмеризм и конец эпохи Просвещения во Франции»

Как представляли себе устройство мира ученые конца XVIII века

N+1
«Твиттер» обсуждает ужасные вещи, которые почему-то всем нравятся «Твиттер» обсуждает ужасные вещи, которые почему-то всем нравятся

Стыдные вещи, которые тем не менее всем нравятся

Maxim
Открыть в приложении