Как ИИ пришёл в сервисы Mail.ru Group и чего ждать от ИИ в будущем

Inc.Hi-Tech

Как искусственный интеллект изменил продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России ещё в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний — профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришёл в сервисы группы компаний ещё 15 с лишним лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это уже давно обыденность и мало кто именно так воспринимает подобные решения. Когда программист не пишет код, а обучает компьютер, — это уже машинное обучение. В разных проектах машинное обучение появляется в разное время. Так, поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Ещё одно давнее применение ИИ — это Почта Mail.ru и её система антиспама. Сначала его делали вручную, на правилах и подборках подозрительных слов, потом стали собирать статистику, с каких IP-адресов приходят сомнительные письма, и блокировать их, далее научили компьютер анализировать тексты и самостоятельно искать подозрительные слова и словосочетания. Обучать ИИ помогали пользователи, отмечая нежелательные письма как спам. Более сложные и современные примеры машинного обучения — это рекламные технологии и умные ленты социальных сетей. Всё это есть в Mail.ru Group. К технологиям машинного обучения предъявляются новые и более сложные требования: по качеству, скорости реакции на изменившиеся условия работы (новый тип спама, тренды в соцсетях), анализируемому контенту (текст, картинки, видео).

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить рост российского рынка ИИ.

Звучит сложно, но на практике это означает партнёрство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий, и совместное развитие рынка решений на основе ИИ. Ожидается, что объём российского рынка увеличится с 198,1 млрд руб. до 907,4 млрд руб. к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы разметки данных для обучения искусственного интеллекта.

Датасет создаётся с полным доступом к содержимому. Для этого в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют задания разной степени сложности. Так, для улучшения работы поиска асессоры оценивают, насколько документы релевантны запросам пользователей. Или помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. Например, на основе этой работы алгоритм компьютерного зрения Mail.ru Group научился расшифровывать номерные знаки автомобилей и определять, сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях, например «ВКонтакте» и «Одноклассниках». В том числе они обучали голосового ассистента Марусю включать музыку.

Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский, в Mail.ru Group создали подборку из плейлистов и попросили бета-тестеров озвучить все названия.

Сбор датасета даёт разработчикам полный контроль над разметкой данных, но работа асессоров — это долго и дорого. Кроме того, иногда разметка данных невозможна, поскольку нельзя изучить содержание объектов, например в случае с почтой и письмами пользователей. Тогда используют информацию не о содержании объектов, а о реакции пользователей на него. При таком обучении ИИ весь процесс происходит скрыто от создателей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ, фильтруются, чтобы исключать из них отвлекающий контент, например треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», и для отслеживания реакции на систему рекомендаций соцсетей. Фактически, ИИ видит реакцию пользователей на него и учится её предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Инвайт одобрения: какие социальные триггеры помогли Clubhouse набрать миллионы пользователей Инвайт одобрения: какие социальные триггеры помогли Clubhouse набрать миллионы пользователей

Clubhouse и забытые стратегии вирусного продвижения

Forbes
Был ли прототип у Воланда из «Мастера и Маргариты»? Был ли прототип у Воланда из «Мастера и Маргариты»?

Правда ли, что протатип Воланда из «Мастера и Маргариты» — Мефистофель?

Культура.РФ
Женское дело Женское дело

Анджелина Джоли — об осознанности, воспитании детей и борьбе за права беженцев

Vogue
Насиловал и истязал 4 года: сегодня скопинский маньяк выходит на свободу Насиловал и истязал 4 года: сегодня скопинский маньяк выходит на свободу

На свободу выходит Виктор Мохов, известный как скопинский маньяк

Cosmopolitan
Попробуй что-то новенькое! Попробуй что-то новенькое!

Почему в разных отношениях мы повторяем одни и те же негативные сценарии

Лиза
Бьюти-гид для ленивых: 10 секретов быстрого ухода за собой Бьюти-гид для ленивых: 10 секретов быстрого ухода за собой

Быстрее, проще, эффективнее — стань красивее, пока играет любимая песня!

Cosmopolitan
Человекоподобных роботов выдали слишком простые движения кожи лица Человекоподобных роботов выдали слишком простые движения кожи лица

Мимика даже реалистичных роботов линейна и проще, чем у человека

N+1
6 секретов правильной похвалы 6 секретов правильной похвалы

Как хвалить детей правильно и мотивировать на дальнейшие достижения

Psychologies
Телескоп TESS нашел более двух тысяч экзопланет за два года Телескоп TESS нашел более двух тысяч экзопланет за два года

Астрономы подвели итоги основной научной программы обсерватории

N+1
Zendaya Zendaya

Зендая и её интервью Тимоти Шаламэ

Elle
Уверенность и сила Уверенность и сила

Мэй Маск поделилась своим мнением о том, как воспитать детей успешными людьми

OK!
Отказ отказу рознь: каким бывает наше «нет» Отказ отказу рознь: каким бывает наше «нет»

Что мы имеем в виду, когда говорим «нет»?

Psychologies
Как женщины начали шутить и почему никак не могут остановиться? Как женщины начали шутить и почему никак не могут остановиться?

Откуда растут ноги женского стендапа в России, почему женский юмор такой смешной

Cosmopolitan
«Держать город Кронштадт под обстрелом и день, и ночь» «Держать город Кронштадт под обстрелом и день, и ночь»

100 лет назад был подавлен крупнейший очаг сопротивления монополии на власть

Дилетант
Купил новую машину и сразу же разбил. Топ-9 курьезных аварий Купил новую машину и сразу же разбил. Топ-9 курьезных аварий

Яркие ДТП, который произошли сразу после выезда из автосалона

РБК
Планетологи заподозрили существование течений в подледном океане Энцелада Планетологи заподозрили существование течений в подледном океане Энцелада

Внутри океана спутника Сатурна Энцелада могут действовать процессы циркуляции

N+1
Как найти баланс в стремлении к саморазвитию? Отвечает психотерапевт Как найти баланс в стремлении к саморазвитию? Отвечает психотерапевт

Владислав Лето — о психологических рисках погони за совершенством

Reminder
Голодные нормы Голодные нормы

Как зимой 1930 коммунисты собирались принимать раскулаченных в Северном крае

Дилетант
Интересные факты о Меган Маркл: какой своей роли стыдится и при чем тут Меркель Интересные факты о Меган Маркл: какой своей роли стыдится и при чем тут Меркель

Малоизвестные факты о супруге принца Гарри Меган Маркл

Cosmopolitan
Мария Евневич Мария Евневич

Совладелица первого «Максидом» ведет экспансию петербургского бренда по России

Собака.ru
Как сказать настоящее «нет»: 6 упражнений для уверенности в себе Как сказать настоящее «нет»: 6 упражнений для уверенности в себе

Чтобы осмелиться сказать «нет», нужно быть уверенным в себе и своем решении

Psychologies
Минута релакса: 11 легких способов уменьшить напряжение в шее и плечах, вызванное стрессом Минута релакса: 11 легких способов уменьшить напряжение в шее и плечах, вызванное стрессом

Пора немного размяться

Playboy
Снежана Самохина сыграет сексуальную волейболистку в сериале «Дылды» на СТС Снежана Самохина сыграет сексуальную волейболистку в сериале «Дылды» на СТС

Интервью с Снежаной Самохиной

Cosmopolitan
«Мы не увидели маньяка»: что не так с фильмом Ксении Собчак о Викторе Мохове «Мы не увидели маньяка»: что не так с фильмом Ксении Собчак о Викторе Мохове

Разрешать ли преступникам выступать на публике?

Psychologies
10 самых странных и страшных растений 10 самых странных и страшных растений

Представляем хит-парад самых одиозных представителей мира флоры

Maxim
Индийские женщины в знак протеста фотографируются в рваных джинсах Индийские женщины в знак протеста фотографируются в рваных джинсах

Протестная инициатива индийских женщин — флешмоб #RippedJeansTwitter

Psychologies
Что делать, если тянет на духовные практики, и почему тебе не нужны «инстагуру» Что делать, если тянет на духовные практики, и почему тебе не нужны «инстагуру»

Можешь ли ты оформить свой интерес к духовным практикам самостоятельно?

Cosmopolitan
Хорошо, что нет России, хорошо, что нет царя. Как реагировали на отречение Николая II от престола Хорошо, что нет России, хорошо, что нет царя. Как реагировали на отречение Николая II от престола

Русский император Николай II подписал отречение от престола

Esquire
Конфликт Меган Маркл и Британии: за что все не любят жену принца Гарри Конфликт Меган Маркл и Британии: за что все не любят жену принца Гарри

По каким причинам Меган Маркл вызвала всеобщую ненависть?

Cosmopolitan
Как советские люди умирали за жвачку Как советские люди умирали за жвачку

10 марта 1975 года произошла смертельная давка в «Сокольниках»

Maxim
Открыть в приложении