Как ИИ пришел в сервисы Mail.ru Group еще более чем 15 лет назад

Inc.Бизнес

Как ИИ незаметно для пользователей проник в продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает государству, корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России еще в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний-профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришел в сервисы группы компаний еще более чем 15 лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это было очень давно. Когда программист не пишет код, а обучает компьютер — это уже машинное обучение. Кроме того поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Еще одно давнее применение ИИ — это Почта Mail.ru и ее система антиспама. Сначала его делали вручную, потом стали собирать статистику с каких IP-адресов приходят сомнительные письма и блокировать их, потом научили компьютер анализировать текст, и если в нем несколько раз встречались условные слова «бесплатно» и «без смс», то в система включала тревожный сигнал. Кроме этого помогали пользователи отмечая, нежелательные письма как спам.Более сложные примеры — это рекламные технологии, умные ленты социальных сетей и все это есть в Mail.ru Group.

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала Альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить роста российского рынка ИИ.

Звучит сложно, но на практике, это означает партнерство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий и совместное создание продуктов на основе ИИ, которые увеличат объем российского рынка с 198,1 миллиардов рублей рублей до 907,4 миллиардов к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы обучения искусственного интеллекта. Это можно делать с помощью размеченных данных — то есть тех, содержание которых известно. Для разметки данных в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют простые задания. Так для улучшения работы поиска асессоры оценивают насколько документы релевантны запросам пользователей. Также асессоры помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. На основе этой работы алгоритм компьютерного зрения Mail.ru Group научился определяться сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях (например, ВКонтакте и Одноклассниках). В том числе они обучали голосового ассистента Марусю включать музыку. Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский в Mail.ru Group создали подюорку из плейлистов бетатестеров и попросили озвучить все названия.

Сбор датасета с помощью реальных людей долгий и дорогой, поэтому кроме него часто используют обучение ИИ на действиях пользователей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ фильтруются, чтобы исключать из них треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», для отслеживания реакции на контент системе рекомендаций соцсетей. При этом ИИ ничего не знает о содержании контента, но видит реакцию пользователей на него и учится ее предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как советские люди умирали за жвачку Как советские люди умирали за жвачку

10 марта 1975 года произошла смертельная давка в «Сокольниках»

Maxim
Космос, наш Космос, наш

Каким был Юрий Гагарин и из чего складывался стиль самого известного космонавта

GQ
«Науку в России делают женщины». Трансплантолог о своей работе «Науку в России делают женщины». Трансплантолог о своей работе

Женщина-трансплантолог о науке, своей работе и биотехнологиях

СНОБ
Актеры Юрий Колокольников и Агата Муцениеце — о сериале «Крюк», хоккее и Путине Актеры Юрий Колокольников и Агата Муцениеце — о сериале «Крюк», хоккее и Путине

Юрий Колокольников, Агата Муцениеце и продюсер Георгий Малков о сериале «Крюк»

СНОБ
Играть не вредно: как компьютерные игры помогают учиться не только детям Играть не вредно: как компьютерные игры помогают учиться не только детям

Как использовать скрытый потенциал компьютерных игр?

Популярная механика
Дома никого. Эстетика заброшенных особняков в объективе Томаса Джориона Дома никого. Эстетика заброшенных особняков в объективе Томаса Джориона

Фотограф Томас Джорион превратил свое мальчишеское увлечение в профессию

Seasons of life
Замечательный сосед: лучший кандидат на изучение атмосферы чужих миров Замечательный сосед: лучший кандидат на изучение атмосферы чужих миров

Экзопланета, находящаяся всего в 26 световых годах от нас

Популярная механика
От подражания кумирам до моды на естественность: почему эра лайков скоро пройдет От подражания кумирам до моды на естественность: почему эра лайков скоро пройдет

Почему зумеры перестали пользоваться фильтрами, изменяющими внешность?

Forbes
Кладбище домашних животных в руинах античного порта указало на заботу о питомцах Кладбище домашних животных в руинах античного порта указало на заботу о питомцах

Жители города ухаживали за больными животными и хоронили умерших питомцев

N+1
Квантовый ключ преодолел расстояние в 511 километров Квантовый ключ преодолел расстояние в 511 километров

Квантовая криптография пока все еще далека от массового распространения

N+1
Разборчивые самки поддержали репродуктивную изоляцию молодого вида просяночников Разборчивые самки поддержали репродуктивную изоляцию молодого вида просяночников

Несмотря на слабые генетические отличия, эти два вида не скрещиваются

N+1
Топ-10 самых ядовитых животных на нашей планете Топ-10 самых ядовитых животных на нашей планете

Животные, которые могут убивать лишь одним укусом

Популярная механика
Физики сделали металинзу с четким переменным фокусом Физики сделали металинзу с четким переменным фокусом

Фокусное расстояние зависит от аморфного или кристаллического состояния вещества

N+1
Как защититься от собаки Как защититься от собаки

Инструкция от нападения собаки

Maxim
Раз – и готово! Раз – и готово!

Можно выглядеть стильно, используя минимум косметики

Лиза
Прощай, второй подбородок и носогубные складки! Экономим на уколах и подтяжке Прощай, второй подбородок и носогубные складки! Экономим на уколах и подтяжке

Что такое миофасциальный массаж лица и чем он полезен?

Cosmopolitan
Кинжалы, вешалки, пауки, помады — что еще коллекционируют звездные красавицы? Кинжалы, вешалки, пауки, помады — что еще коллекционируют звездные красавицы?

Подборка из самых неожиданных знаменитых звездных коллекций

Cosmopolitan
Ешь побольше: что такое объемная диета и как на ней похудеть Ешь побольше: что такое объемная диета и как на ней похудеть

Американский диетолог придумала специальную диету с огромными порциями

Cosmopolitan
Основал Y Combinator, программировал, написал сотни эссе и картин и продолжил искать себя: история Пола Грэма Основал Y Combinator, программировал, написал сотни эссе и картин и продолжил искать себя: история Пола Грэма

Пересказ эссе Пола Грэма «Над чем я работал»

VC.RU
Женщина перестала заниматься домом, чтобы проучить ленивого мужа Женщина перестала заниматься домом, чтобы проучить ленивого мужа

Помогает ли вам по хозяйству партнер? Участвуют ли дети в домашних делах?

Psychologies
Городские неразлучники в жару охладились у вентиляционных отверстий зданий Городские неразлучники в жару охладились у вентиляционных отверстий зданий

Поведенческая адаптация помогает неразлучникам выживать в экстремальном климате

N+1
10 самых опасных предметов твоего гардероба 10 самых опасных предметов твоего гардероба

Список опасных предметов одежды

Cosmopolitan
Сериал, который вы пропустили (а зря): почему стоит посмотреть израильскую драму «Теряя Элис» Сериал, который вы пропустили (а зря): почему стоит посмотреть израильскую драму «Теряя Элис»

Сокровище для тех, кому не хватает рассказов о проблемах взрослых людей

Esquire
Роботы отмечают столетие Роботы отмечают столетие

Слово «робот» придумал чешский художник и литератор Йосеф Чапек

Наука и жизнь
Facebook показал революционный интерфейс для виртуальной реальности Facebook показал революционный интерфейс для виртуальной реальности

Facebook Reality Labs сделали интерфейс для VR, основанный на электромиографии

Популярная механика
Трагедия ошибок: как полиция помогает оппозиции, а либерал Гозман — властям Трагедия ошибок: как полиция помогает оппозиции, а либерал Гозман — властям

Российская полиция успешно пропиарила оппозиционный Форум муниципальных депутато

СНОБ
Завезенные на Фолкленды лисицы частично заменили истребленных волков Завезенные на Фолкленды лисицы частично заменили истребленных волков

Южноамериканские лисицы частично заняли нишу фолклендских волков

N+1
Рожден убивать: гены серийных убийц есть у каждого пятого Рожден убивать: гены серийных убийц есть у каждого пятого

В 2010 году итальянский суд принял неожиданное решение насчет серийного убийцы

Cosmopolitan
Константин Хабенский: «Смыслы спектакля не в сказанных героями словах. Они заложены между строк» Константин Хабенский: «Смыслы спектакля не в сказанных героями словах. Они заложены между строк»

Константин Хабенский – о спектакле «Ходжа Насреддин» Театра наций

Grazia
Близкий человек часто обижается: как найти общий язык Близкий человек часто обижается: как найти общий язык

Обида может разрушить самые крепкие отношения

Psychologies
Открыть в приложении