Как ИИ пришел в сервисы Mail.ru Group еще более чем 15 лет назад

Inc.Бизнес

Как ИИ незаметно для пользователей проник в продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает государству, корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России еще в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний-профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришел в сервисы группы компаний еще более чем 15 лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это было очень давно. Когда программист не пишет код, а обучает компьютер — это уже машинное обучение. Кроме того поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Еще одно давнее применение ИИ — это Почта Mail.ru и ее система антиспама. Сначала его делали вручную, потом стали собирать статистику с каких IP-адресов приходят сомнительные письма и блокировать их, потом научили компьютер анализировать текст, и если в нем несколько раз встречались условные слова «бесплатно» и «без смс», то в система включала тревожный сигнал. Кроме этого помогали пользователи отмечая, нежелательные письма как спам.Более сложные примеры — это рекламные технологии, умные ленты социальных сетей и все это есть в Mail.ru Group.

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала Альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить роста российского рынка ИИ.

Звучит сложно, но на практике, это означает партнерство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий и совместное создание продуктов на основе ИИ, которые увеличат объем российского рынка с 198,1 миллиардов рублей рублей до 907,4 миллиардов к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы обучения искусственного интеллекта. Это можно делать с помощью размеченных данных — то есть тех, содержание которых известно. Для разметки данных в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют простые задания. Так для улучшения работы поиска асессоры оценивают насколько документы релевантны запросам пользователей. Также асессоры помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. На основе этой работы алгоритм компьютерного зрения Mail.ru Group научился определяться сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях (например, ВКонтакте и Одноклассниках). В том числе они обучали голосового ассистента Марусю включать музыку. Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский в Mail.ru Group создали подюорку из плейлистов бетатестеров и попросили озвучить все названия.

Сбор датасета с помощью реальных людей долгий и дорогой, поэтому кроме него часто используют обучение ИИ на действиях пользователей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ фильтруются, чтобы исключать из них треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», для отслеживания реакции на контент системе рекомендаций соцсетей. При этом ИИ ничего не знает о содержании контента, но видит реакцию пользователей на него и учится ее предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

«Без везения не обошлось. Но должно быть что-то больше, чем везение»: Юрий Мильнер о принципах, инвестициях и космосе «Без везения не обошлось. Но должно быть что-то больше, чем везение»: Юрий Мильнер о принципах, инвестициях и космосе

Главное из большого интервью Юрия Мильнера проекту «Русские норм»

VC.RU
Государственный человек: чем известен задержанный владелец компании «Биотэк» Борис Шпигель Государственный человек: чем известен задержанный владелец компании «Биотэк» Борис Шпигель

Высказывания Бориса Шпигеля по поводу бизнеса и власти

Forbes
Как заснуть снова, если проснулся среди ночи? Как заснуть снова, если проснулся среди ночи?

Работающая техника по засыпанию от американских психологов

Maxim
Как заниматься спортом весной, чтобы похудеть к лету? Как заниматься спортом весной, чтобы похудеть к лету?

Спланируем фитнес так, чтобы к лету быть в лучшей для себя форме

Худеем правильно
«Слушать» не значит «слышать»: почему важно быть хорошим собеседником «Слушать» не значит «слышать»: почему важно быть хорошим собеседником

Как вернуть утраченный навык слушать собеседника?

Psychologies
Она была эталоном! Как одевалась Елизавета II в молодости — стиль королевы Она была эталоном! Как одевалась Елизавета II в молодости — стиль королевы

Каким был стиль Елизаветы II в первой половине правления

Cosmopolitan
Переменные величины Переменные величины

Как заработали состояние богатейшие селфмейдмены мира?

РБК
Хороший и плохой сахар: как работает сахароза, фруктоза и глюкоза Хороший и плохой сахар: как работает сахароза, фруктоза и глюкоза

Если вы давно мечтаете отказаться от сахара, то нужно понять, каким он бывает

Популярная механика
В молекулярном облаке Тельца обнаружили цианонафталины В молекулярном облаке Тельца обнаружили цианонафталины

Ученые нашли полициклические ароматические углеводороды в молекулярном облаке

N+1
Внеземная красота: 12 топ-моделей с необычными физическими данными Внеземная красота: 12 топ-моделей с необычными физическими данными

Cтранная и нестандартная красота этих моделей притягивает как магнит

Cosmopolitan
Хотите стать счастливее? Каждый день отвечайте себе на 2 простых вопроса Хотите стать счастливее? Каждый день отвечайте себе на 2 простых вопроса

Благодаря этой практике жизнь вскоре изменится к лучшему

Psychologies
10 фактов о культовом «Нагане» от концерна «Калашников» 10 фактов о культовом «Нагане» от концерна «Калашников»

«Наган» для русских — как салат оливье

Maxim
3 великолепных романа об экспедициях на Марс 3 великолепных романа об экспедициях на Марс

Подборку остросюжетных произведений, посвященных экспедициям человека на Марс

Популярная механика
Лексика слабаков: как «бесхребетные» слова снижают эффективность Лексика слабаков: как «бесхребетные» слова снижают эффективность

Дэйв Эспри: от того, как вы излагаете мысли, зависит, какой будет ваша жизнь

Forbes
Светлая сторона силы Светлая сторона силы

Елена Горенштейн оформила квартиру в светлой гамме

AD
Haval H9. Внедорожник с кровавой подсветкой Haval H9. Внедорожник с кровавой подсветкой

Тест-драйв внедорожника Haval H9

4x4 Club
Вакцина против гендерных стереотипов: как работает женское менторство в России и мире Вакцина против гендерных стереотипов: как работает женское менторство в России и мире

Как менторство помогает справиться с неуверенностью и преодолеть стереотипы

Forbes
Сказка — ложь Сказка — ложь

Gucci и русский фольклор

Grazia
История одной песни: «One Way Ticket» История одной песни: «One Way Ticket»

Запутанная история песни «One Way Ticket»

Maxim
13,5 задорных биографий писателей 13,5 задорных биографий писателей

Самые залихватские биографии известных писателей

Maxim
Приручившие скорость Приручившие скорость

Лучшие школы контраварийного вождения и их руководители

Robb Report
Две твердыни Две твердыни

Близнецы леди Амелия и Элайза Спенсер дали первое в жизни интервью

Tatler
Любовь, море, восток: 10 прекраснейших турецких сериалов Любовь, море, восток: 10 прекраснейших турецких сериалов

Топ лучших турецких сериалов

Cosmopolitan
Неидеальная форма пупка: как девочки-подростки относятся к своей внешности Неидеальная форма пупка: как девочки-подростки относятся к своей внешности

Почему подростки недовольны своей внешностью и на кого хотят быть похожими

Forbes
Tesla vs Apple: что общего между двумя компаниями и почему они разные Tesla vs Apple: что общего между двумя компаниями и почему они разные

Почему Tesla и Apple часто сравнивают

Forbes
10 самых опасных предметов твоего гардероба 10 самых опасных предметов твоего гардероба

Список опасных предметов одежды

Cosmopolitan
Начало родов: важные советы тем, кто рожает первый раз Начало родов: важные советы тем, кто рожает первый раз

Что делать, если начались роды

9 месяцев
Вопрос психологу: что делать, если поставленные цели никогда не воплощаются в жизнь? Вопрос психологу: что делать, если поставленные цели никогда не воплощаются в жизнь?

Психолог объясняет механику правильной постановки целей

Esquire
15 знаменитых фильмов, запрещенных в самых неожиданных странах 15 знаменитых фильмов, запрещенных в самых неожиданных странах

Китайцам чем-то не угодил фильм «Назад в будущее»

Maxim
Что такое NFT-токены, о которых все сейчас говорят, и не пропускаешь ли ты зарождение нового биткоина? Что такое NFT-токены, о которых все сейчас говорят, и не пропускаешь ли ты зарождение нового биткоина?

Не нужно ли бежать покупать новую криптовалюту на последние?

Maxim
Открыть в приложении