Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Важность детства Важность детства

Что дошкольникам по-настоящему нужно от взрослых

kiozk originals
Одна вокруг света: от тропических лесов до лавандовой столицы Северной Америки Одна вокруг света: от тропических лесов до лавандовой столицы Северной Америки

110 серия о кругосветном путешествии москвички Ирины Сидоренко и ее собаки Греты

Forbes
Ирина Кооп-Шароватова Ирина Кооп-Шароватова

Участница легендарной арт-поп-группы «Колибри»

Собака.ru
Главный тренер молодежной сборной России Михаил Галактионов: «Цель на Евро – побеждать в каждом матче» Главный тренер молодежной сборной России Михаил Галактионов: «Цель на Евро – побеждать в каждом матче»

Главный тренер молодежной сборной России — о Евро-2021 и воспитании звезд РПЛ

GQ
В чем разница между любовью и дружбой? В чем разница между любовью и дружбой?

Как понять, что мы испытываем к другому — любовь или дружбу?

Psychologies
12 апостолов: режиссер Александр Молочников — о трагическом значении тиктока, низком уровне театральной критики и театре, который ему нравится 12 апостолов: режиссер Александр Молочников — о трагическом значении тиктока, низком уровне театральной критики и театре, который ему нравится

Режиссер Александр Молочников о желании сделать балет жанром, интересным каждому

Esquire
Сам себе доктор Фрейд Сам себе доктор Фрейд

Обязательно ли ложиться на кушетку, чтобы расшифровать свое бессознательное?

Psychologies
Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам Пришел на работу и 10 раз ударил ножом: как в России мужья мстят бывшим женам

Две трети убитых женщин в 2018 году были жертвами домашнего насилия

Cosmopolitan
В отцы годятся В отцы годятся

Известные мужчины о том, как им удается находить общий язык со своими детьми

GQ
Tesla vs Apple: что общего между двумя компаниями и почему они разные Tesla vs Apple: что общего между двумя компаниями и почему они разные

Почему Tesla и Apple часто сравнивают

Forbes
Вырезали по ошибке прямую кишку: как делали нелегальные аборты в СССР Вырезали по ошибке прямую кишку: как делали нелегальные аборты в СССР

Истории нелегальных абортов в СССР, которые закончились плачевно

Cosmopolitan
«Единорог» с рук: зачем убыточная платформа для продажи секонд-хенда ThredUp проводит IPO «Единорог» с рук: зачем убыточная платформа для продажи секонд-хенда ThredUp проводит IPO

Рынок подержанной одежды в ближайшие годы будет стремительно расти

Forbes

На Apple TV вышел аудиосериал "Звонки". Аудитория в восторге, интернет спорит

Esquire
12 успешных людей, которые увлекаются живописью 12 успешных людей, которые увлекаются живописью

После этого материала вы захотите взяться за кисть – как Уинстон Черчилль

GQ
Самые первые автомобили известных компаний Самые первые автомобили известных компаний

Первые модели крупнейших современных автомобилестроителей

Популярная механика
Разработчики из Google научили смартфон распознавать постукивание по разным частям корпуса Разработчики из Google научили смартфон распознавать постукивание по разным частям корпуса

Алгоритм для смартфонов, распознающий прикосновения к корпусу

N+1
IPO с нулевой суммой IPO с нулевой суммой

Кто платит за праздник доходностей на рынке первичных размещений

Forbes
Что наша кожа говорит о здоровье Что наша кожа говорит о здоровье

Кожа – своего рода зеркало, которое отражает состояние организма

Домашний Очаг
8 женских романов, которые ты прочтешь на одном дыхании 8 женских романов, которые ты прочтешь на одном дыхании

Восемь книг, которые должны тебе понравиться

Cosmopolitan
Ученые смоделировали работу шестерней Антикитерского механизма Ученые смоделировали работу шестерней Антикитерского механизма

Антикитерский механизм — античный прибор для расчета движения небесных тел

N+1
Составлен портрет российской предпринимательницы: ей под 40, она ИП, зарабатывает до 200 тыс. руб. в месяц Составлен портрет российской предпринимательницы: ей под 40, она ИП, зарабатывает до 200 тыс. руб. в месяц

Портрет женщины, которая руководит собственным бизнесом в России

Inc.
Почему жертва не «сама виновата»: объясняем в картинках Почему жертва не «сама виновата»: объясняем в картинках

Объясняем на примере сериалов и фильмов, почему «сама виновата» — полная чушь

Cosmopolitan
Как на самом деле создают видеоигры? Как на самом деле создают видеоигры?

Отрывок из русского романа про игры «Игрожур»

GQ
Как сохранить и улучшить зрение при помощи практик цигун Как сохранить и улучшить зрение при помощи практик цигун

Всегда ли с возрастом снижается острота зрения?

Psychologies
Новое платье короля Новое платье короля

Отчего наших политиков разглядывать не хочется и как это поправить?

Vogue
«Управление одним днем — самое сложное»: как гастропроект Матильды Шнуровой пережил пандемию «Управление одним днем — самое сложное»: как гастропроект Матильды Шнуровой пережил пандемию

Матильда Шнурова о гастрорынке Петербурга и о том, что помогает выйти из кризиса

Forbes
Мария Евневич Мария Евневич

Совладелица первого «Максидом» ведет экспансию петербургского бренда по России

Собака.ru
Застенчивая невинная девушка: как принцесса Диана повлияла на знаменитых женщин Застенчивая невинная девушка: как принцесса Диана повлияла на знаменитых женщин

Мать Уильяма и Гарри вошла в историю как законодательница трендов

Cosmopolitan
«Вальхен» Ольги Громовой. Фрагмент романа о жизни девочки-подростка в немецком лагере для военнопленных «Вальхен» Ольги Громовой. Фрагмент романа о жизни девочки-подростка в немецком лагере для военнопленных

Отрывок из романа Ольги Громовой «Вальхен» об остарбайтерах

Esquire
Конфликт Меган Маркл и Британии: за что все не любят жену принца Гарри Конфликт Меган Маркл и Британии: за что все не любят жену принца Гарри

По каким причинам Меган Маркл вызвала всеобщую ненависть?

Cosmopolitan
Открыть в приложении