Как ИИ пришел в сервисы Mail.ru Group еще более чем 15 лет назад

Inc.Бизнес

Как ИИ незаметно для пользователей проник в продукты Mail.ru Group

Система искусственного интеллекта появляется, когда возникает задача, которую нельзя решить обычными способами. ИИ помогает государству, корпорациям и стартапам анализировать большие данные, выявлять мошенничество, создавать беспилотные устройства, голосовые помощники, системы компьютерного зрения, а также автоматизировать маркетинг, логистику, управление бизнес-процессами и персоналом. Но хотя про ИИ уже давно все слышали, а разработки на его базе начали появляться в России еще в нулевых, комплексно внедрять его в продукты на нескольких уровнях может только малый круг компаний-профучастников рынка. Узнали у директора по технологиям искусственного интеллекта Mail.ru Group Андрея Калинина, как ИИ пришел в сервисы группы компаний еще более чем 15 лет назад и чего ждать от ИИ в будущем.

Как давно Mail.ru Group дружит с ИИ и зачем ей это нужно

Определимся с тем, что считать искусственным интеллектом. Автоматизирование — это уже зачатки ИИ, но это было очень давно. Когда программист не пишет код, а обучает компьютер — это уже машинное обучение. Кроме того поисковая система Mail.ru, которая работает с 2004 года, с самого появления использовала ИИ для ранжирования результатов поиска.

Еще одно давнее применение ИИ — это Почта Mail.ru и ее система антиспама. Сначала его делали вручную, потом стали собирать статистику с каких IP-адресов приходят сомнительные письма и блокировать их, потом научили компьютер анализировать текст, и если в нем несколько раз встречались условные слова «бесплатно» и «без смс», то в система включала тревожный сигнал. Кроме этого помогали пользователи отмечая, нежелательные письма как спам.Более сложные примеры — это рекламные технологии, умные ленты социальных сетей и все это есть в Mail.ru Group.

В 2019 году Mail.ru Group вместе с другими крупнейшими российскими компаниями создала Альянс в сфере искусственного интеллекта (AI-Russia Alliance). Его участники планируют объединить усилия в отдельных проектах, чтобы ускорить роста российского рынка ИИ.

Звучит сложно, но на практике, это означает партнерство крупнейших компаний из разных сфер — IT, финансов, коммуникаций и промышленности. Как результат — создание образовательных программ в области ИИ, упрощение нормативных барьеров, которые замедляют внедрение новых технологий и совместное создание продуктов на основе ИИ, которые увеличат объем российского рынка с 198,1 миллиардов рублей рублей до 907,4 миллиардов к 2024 году.

Откуда берутся данные для обучения ИИ

Есть разные способы обучения искусственного интеллекта. Это можно делать с помощью размеченных данных — то есть тех, содержание которых известно. Для разметки данных в Mail.ru Group есть служба асессоров. Это несколько сотен человек, которые по инструкции выполняют простые задания. Так для улучшения работы поиска асессоры оценивают насколько документы релевантны запросам пользователей. Также асессоры помогают обучать технологии компьютерного зрения, размечая на данных информацию о содержании текста, наличии объектов и их количестве. На основе этой работы алгоритм компьютерного зрения Mail.ru Group научился определяться сколько человек прямо сейчас стоит в очереди.

Кроме асессоров, в разметке данных помогают группы из тысяч бета-тестеров и модераторов в социальных сетях (например, ВКонтакте и Одноклассниках). В том числе они обучали голосового ассистента Марусю включать музыку. Главная загвоздка была в том, что российские пользователи произносили названия зарубежных исполнителей не так, как носители языка. Чтобы научить Марусю разбирать русский английский в Mail.ru Group создали подюорку из плейлистов бетатестеров и попросили озвучить все названия.

Сбор датасета с помощью реальных людей долгий и дорогой, поэтому кроме него часто используют обучение ИИ на действиях пользователей. Например, для улучшения поиска собирают данные о том, на какие материалы кликают пользователи, и на основе этого предполагают, что эти документы лучше. Естественно, это не дает точный результат, поэтому финальные данные, прежде чем попасть к ИИ фильтруются, чтобы исключать из них треш-контент и эротику. Кликстрим используют и для анализа нажатий на кнопку «Это спам», для отслеживания реакции на контент системе рекомендаций соцсетей. При этом ИИ ничего не знает о содержании контента, но видит реакцию пользователей на него и учится ее предсказывать.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как построить успешную карьеру в крупной федеральной компании. «Свежие перспективы» «Пятёрочки» Как построить успешную карьеру в крупной федеральной компании. «Свежие перспективы» «Пятёрочки»

Интервью с директором по управлению персонала «Пятёрочки» Ларисой Бодягиной

Inc.
Основал Y Combinator, программировал, написал сотни эссе и картин и продолжил искать себя: история Пола Грэма Основал Y Combinator, программировал, написал сотни эссе и картин и продолжил искать себя: история Пола Грэма

Пересказ эссе Пола Грэма «Над чем я работал»

VC.RU
«Жаль, что я не знал этого раньше»: 20 важных фактов о жизни и людях «Жаль, что я не знал этого раньше»: 20 важных фактов о жизни и людях

Жизнь — это путешествие

Psychologies
Посмертный перегрев: почему некоторые тела сильно нагреваются после смерти Посмертный перегрев: почему некоторые тела сильно нагреваются после смерти

После смерти некоторые тела внезапно разогреваются до высоких температур

Популярная механика
Правила жизни Глеба Павловского Правила жизни Глеба Павловского

Правила жизни политтехнолога Глеба Павловского

Esquire
Новый антибиотик избавил мышей от гонореи Новый антибиотик избавил мышей от гонореи

Описанное соединение имеет шанс перейти к клиническим испытаниям

N+1
Крах среди ясного неба Крах среди ясного неба

Игорь Гулин об «Июльском дожде» как прощании с оттепелью

Weekend
В чем разница между любовью и дружбой? В чем разница между любовью и дружбой?

Как понять, что мы испытываем к другому — любовь или дружбу?

Psychologies
Прилетит вдруг мошенник Прилетит вдруг мошенник

Режиссер Питер Джексон был властелином старинных самолетов в Новой Зеландии

GQ
Королева водорослей Королева водорослей

Как превратить природный мусор на пляже в искусные и долговечные предметы?

Вокруг света
Весеннее обновление: как перекрасить стены, если вы никогда этого не делали, — 5 простых шагов Весеннее обновление: как перекрасить стены, если вы никогда этого не делали, — 5 простых шагов

Как самостоятельно перекрасить стены

Esquire
Доказательство от спортивного Доказательство от спортивного

Александр Добровинский играет в игры с людьми, которые играют в гольф

Tatler
Бактерии на бумажной подложке выполнили логические операции Бактерии на бумажной подложке выполнили логические операции

Бактериальные вычислители в будущем могут стать биосенсорами

N+1
Волшебник-неудачник: что осталось от политического наследия Михаила Горбачева Волшебник-неудачник: что осталось от политического наследия Михаила Горбачева

Закончив заведомо проигранную войну, Горбачев добился выигрыша для всех

Forbes
Письмо на бумаге помогает лучше запоминать информацию, чем заметки на смартфоне, доказали нейробиологи Письмо на бумаге помогает лучше запоминать информацию, чем заметки на смартфоне, доказали нейробиологи

Письмо на бумаге лучше активизирует мозг и помогает эффективнее запоминать

Inc.
Новая мясная диета? Всё, что нужно знать о модном карниворе (и это не кето!) Новая мясная диета? Всё, что нужно знать о модном карниворе (и это не кето!)

Почему биохакеры помешались на животной диете?

Cosmopolitan
«Я тебя люблю… или просто жалею?» «Я тебя люблю… или просто жалею?»

Искренне ли мы любим человека или попросту его жалеем?

Psychologies
Драма 1921 года Драма 1921 года

Страшные подробности царь-голода в Советской России 1921 года

Дилетант
5 способов освободить память смартфона 5 способов освободить память смартфона

Топ-5 способов освободить память в смартфоне и удалить ненужные данные

Популярная механика
Упражнения для красивой попы — как накачать ягодицы без помощи тренера Упражнения для красивой попы — как накачать ягодицы без помощи тренера

Несложный комплекс упражнений для красивой попы

Cosmopolitan
10 театральных художников Серебряного века. Часть 1 10 театральных художников Серебряного века. Часть 1

Десять живописцев, которые были художниками-постановщиками. Часть 1

Культура.РФ
Черная акула оказалась самым крупным светящимся позвоночным Черная акула оказалась самым крупным светящимся позвоночным

Вероятно, она использует биолюминесценцию, чтобы незаметно подкрасться к жертве

N+1
Лучше мельче, да лучше Лучше мельче, да лучше

Российская компания осваивает новую технологию обогащения руд цветных металлов

Эксперт
Бьюти-эволюция Дмитрия Нагиева: от прапорщика Задова до брутального альфа-самца Бьюти-эволюция Дмитрия Нагиева: от прапорщика Задова до брутального альфа-самца

Дмитрий Нагиев – один из самых харизматичных мужчин отечественного шоу-бизнеса

Cosmopolitan
«Бедное искусство» за сотни тысяч евро: зачем покупать поролоновые скульптуры и арт-объекты из пепла «Бедное искусство» за сотни тысяч евро: зачем покупать поролоновые скульптуры и арт-объекты из пепла

Зачем художники создают скульптуры из хлеба и поролона?

Forbes
Почему весной так хочется любви? Почему весной так хочется любви?

Почему после долгой зимы мы мечтаем о большой любви?

Psychologies
Из 90-х с любовью Из 90-х с любовью

Анастасия Пальчикова о том, почему она поменяла имя в своем инстаграме

OK!
Старшему 50, младшей 28, шестеро умерли: история самой многодетной семьи России Старшему 50, младшей 28, шестеро умерли: история самой многодетной семьи России

Семья Хромых стала самой многодетной в стране и вошла в Книгу рекордов России

Cosmopolitan
Что ели в Древнем Китае Что ели в Древнем Китае

Рецепты, по которым готовили в Древнем Китае

СНОБ
Кормим по-новому Кормим по-новому

Вещи, которые изменились в отношении к грудному вскармливанию

Домашний Очаг
Открыть в приложении