Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Четвертая промышленная революция Четвертая промышленная революция

Новая трансформация технологии и промышленности

kiozk originals
Автомобили на сжатом воздухе: плюсы и минусы Автомобили на сжатом воздухе: плюсы и минусы

Почему пневмокары внезапно вошли в моду?

Популярная механика
Секс-игрушки: максимально подробный гайд для новичков от Playboy Секс-игрушки: максимально подробный гайд для новичков от Playboy

Лучшие секс-игрушки для мастурбации и совместного использования в парах

Playboy
«Кричат и выгоняют»: почему нельзя осуждать за публичное кормление грудью «Кричат и выгоняют»: почему нельзя осуждать за публичное кормление грудью

Публичное кормление грудью — постоянный предмет дискуссии

Cosmopolitan
Неотложная психологическая помощь: как правильно утешать человека в беде Неотложная психологическая помощь: как правильно утешать человека в беде

Как оказать человеку срочную психологическую помощь правильно

Cosmopolitan
«Я забеременела!»: Бекхэм, Хэтэуэй и другие звезды, которые победили бесплодие «Я забеременела!»: Бекхэм, Хэтэуэй и другие звезды, которые победили бесплодие

Знаменитые артистки смогли стать мамами вопреки прогнозам врачей

Cosmopolitan
Звездные падчерицы: Алферова, Ардова и другие артистки, которых воспитали отчимы Звездные падчерицы: Алферова, Ардова и другие артистки, которых воспитали отчимы

Актрисы рассказали о том, как их воспитывали отчимы

Cosmopolitan
Криптовесна в искусстве: как художники из СНГ стали зарабатывать десятки тысяч долларов за счет бума NFT Криптовесна в искусстве: как художники из СНГ стали зарабатывать десятки тысяч долларов за счет бума NFT

Как русскоязычные художники нашли новый способ монетизировать свое искусство

Forbes
Вырезали по ошибке прямую кишку: как делали нелегальные аборты в СССР Вырезали по ошибке прямую кишку: как делали нелегальные аборты в СССР

Истории нелегальных абортов в СССР, которые закончились плачевно

Cosmopolitan
Кто вы, Бриджертоны? Кто вы, Бриджертоны?

С недавних пор новым секс-символом Голливуда стал Реге-Жан Пейдж

Караван историй
Искусственные клетки с минимальным геномом смогли нормально поделиться Искусственные клетки с минимальным геномом смогли нормально поделиться

Биологи дополнили минимальный геном так, чтобы клетки смогли нормально делиться

N+1
Уставшие и ушедшие: почему предприниматели покидают посты гендиректоров основанных ими компаний Уставшие и ушедшие: почему предприниматели покидают посты гендиректоров основанных ими компаний

Почему основатели отходят от операционного управления бизнесом на пике карьеры

Forbes
Катя Валера Катя Валера

Организаторка фестиваля «Не виновата» и вокалистка фем-панк группы «Лоно»

Собака.ru
«Я не такая»: каким женщинам и почему не нужен феминизм «Я не такая»: каким женщинам и почему не нужен феминизм

Почему женщины поддерживают патриархальные ценности?

Psychologies
Будь джентльменом: 6 способов порадовать женщин в своем окружении Будь джентльменом: 6 способов порадовать женщин в своем окружении

Радовать женщин можно не только 8 Марта, но и в другие дни

Playboy
Как сохранить и улучшить зрение при помощи практик цигун Как сохранить и улучшить зрение при помощи практик цигун

Всегда ли с возрастом снижается острота зрения?

Psychologies
Чужие страдания и тьма непознаваемого: фрагмент сборника эссе «Мужчины учат меня жить» американской писательницы и активистки Ребекки Солнит Чужие страдания и тьма непознаваемого: фрагмент сборника эссе «Мужчины учат меня жить» американской писательницы и активистки Ребекки Солнит

Фрагмент эссе Ребекки Солнит, посвященный Вирджинии Вульф

Esquire
Хороший и плохой сахар: как работает сахароза, фруктоза и глюкоза Хороший и плохой сахар: как работает сахароза, фруктоза и глюкоза

Если вы давно мечтаете отказаться от сахара, то нужно понять, каким он бывает

Популярная механика
Туда и дорога Туда и дорога

Портрет родной страны глазами фотографа и блогера Илии Воскресенского

GQ
Боль украла мою жизнь: как жить с мигренью Боль украла мою жизнь: как жить с мигренью

Это не просто головная боль, а серьезное неврологическое заболевание

Cosmopolitan
Начало родов: важные советы тем, кто рожает первый раз Начало родов: важные советы тем, кто рожает первый раз

Что делать, если начались роды

9 месяцев
Страна отверженных художников: как россияне создали глобального игрока на рынке цифрового искусства Страна отверженных художников: как россияне создали глобального игрока на рынке цифрового искусства

Rarible — одна из крупнейших площадок на рынке NFT

Forbes
5 невероятных, но правдивых исторических фактов 5 невероятных, но правдивых исторических фактов

Порой фантазия и реальность меняются местами

Maxim
Из утенка в принца: удивительные преображения звездных парней Из утенка в принца: удивительные преображения звездных парней

Звездные парни, которые однажды славно потрудились над собой

Cosmopolitan
Какая технология унесла больше всех жизней: отвечают историки и социологи Какая технология унесла больше всех жизней: отвечают историки и социологи

Какая инновация убила больше всего людей?

Популярная механика
О, дивный новый мир: что поражает менеджера после ухода из корпорации в стартап О, дивный новый мир: что поражает менеджера после ухода из корпорации в стартап

Как можно сменить дорогой офис на комнату в подвале рынка

Forbes
Slava Marlow: «Идолами занимаются лейблы» Slava Marlow: «Идолами занимаются лейблы»

Юный фанат взял интервью у Slava Marlow

ЖАРА Magazine
История и традиции кавказской кухни История и традиции кавказской кухни

Подборка рецептов традиционных кавказских блюд, которые можно приготовить дома

Культура.РФ
На своём месте На своём месте

Функционально—современный интерьер для молодой семьи

SALON-Interior
44 ребенка к 39 годам: история самой многодетной матери из ныне живущих 44 ребенка к 39 годам: история самой многодетной матери из ныне живущих

Как живет самая многодетная мать на планете?

Cosmopolitan
Открыть в приложении