Может ли машинное обучение предсказать свое будущее?

N+1Hi-Tech

Гадание на датасетах

Может ли машинное обучение предсказать свое будущее?

Богдан Сиротич

Вы каждый день сталкиваетесь с машинным обучением и его работой. Вас удивляет, как быстро его учат новым навыкам и совершенствуют в старых. Но что если мы скажем, что все это достигнуто с помощью всего половины процента от имеющихся у человечества данных? Вместе с экспертами Яндекса рассказываем, как в ближайшие годы машинное обучение изменит мир вокруг нас.

N + 1 совместно с экспертами Яндекса, а также членами жюри и лауреатами научной премии им. Ильи Сегаловича представляет материал о ближайших и более дальних перспективах машинного обучения. В 2019 году Яндекс учредил премию имени Ильи Сегаловича в память о создателе первой версии поисковика «Яндекс» и популяризатора компьютерных наук. Это ежегодная премия для молодых исследователей в области машинного обучения, компьютерного зрения, информационного поиска и анализа данных, а также обработки естественного языка.

Если вы студент, аспирант или научный руководитель из России, Беларуси или Казахстана и работаете над подобными задачами, вам стоит рассказать о своих успехах и подать заявку на соискание премии. В этом году они будут приниматься до 1 марта включительно.

Здесь нет заголовка, но машинное обучение может его придумать

Машинное обучение есть почти в каждом гаджете, который нас окружает. С его помощью работают поисковики, агрегаторы такси, камеры, отслеживающие нарушения ПДД. Сейчас этим никого не удивишь. Но в последние годы машинное обучение стало важной частью медицинских и даже гуманитарных исследований.

В январе разработчики из OpenAI представили нейросеть DALL-E, способную создавать изображения по текстовому описанию. Это не первая подобная разработка, но очень интересная и разносторонняя. Пока рано говорить, что у нейросетей появилось воображение, но DALL-E способен рисовать предметы, руководствуясь даже очень абстрактным описанием, — например, «кресло в форме авокадо». Нейросеть также способна дорисовывать существующему изображению прямоугольную область с любой стороны, создавать реалистичные изображения по наброску и разбирается в том, как менялись вещи со временем. К примеру, DALL-E отличает деревянный телефон 1920-х годов от не таких старых домашних барабанных телефонов.

Подобная технология помогает создавать сцену по имеющемуся сценарию — то есть рисовать примерное изображение того действа, которое задумал сценарист. И этим использование машинного обучения в кино не ограничивается. По словам Игоря Куралёнка, члена жюри научной премии им. Ильи Сегаловича, руководителя подразделения AI & ML Yandex.Cloud, можно выполнять дубляж зарубежных фильмов, не используя голоса российских актеров, а при помощи машинного обучения «заставляя» иностранных исполнителей говорить по-русски.

Беспилотные автомобили, которые мы раньше могли видеть только в качестве первых прототипов на специальных полигонах, уже разъезжают по Москве, пока в тестовом режиме. И пускай эта технология еще не достигла полного развития, от нее можно ждать большого прогресса в ближайшем будущем. Другая интересная технология, в которой широко применяется машинное зрение, — магазины без продавцов. Несколько торговых сетей уже запустили пилотные проекты в Москве.

«Технологии глубокого обучения необходимы для обработки данных после сканирования трехмерного пространства — с помощью лидаров, сканеров структурированного света и других инструментов. Результаты применяются и при создании беспилотных авто, и в разработке приложений для мобильных устройств». Евгений Бурнаев, доцент Сколтеха, стал обладателем научной премии им. Ильи Сегаловича среди научных руководителей в 2020 году

Гораздо необычнее то, что сейчас машинное обучение помогает расшифровывать забытую письменность. До начала предыдущего столетия в Японии использовалась письменная система, называемая кузусидзи. Сейчас — спустя более века после реформы системы образования — почти не осталось людей, способных ее понимать. Чтобы решить проблему расшифровки древних текстов Национальный институт японской литературы опубликовал датасет кузусидзи, содержащий более 4 тысяч классов символов и миллион их разнообразных изображений. Чтобы извлечь максимум из имеющихся данных, на платформе Kaggle открыли соревнование, победитель которого достиг F1 = 0,950. Суть соревнования заключалась в распознавании письменности и ее переводе на современную японскую письменность.

Постепенно машинное обучение проникает и в медицину. Как утверждает Александр Крайнов, член совета научной премии им. Ильи Сегаловича и руководитель Лаборатории машинного интеллекта Яндекса, медицина — самое интересное место для внедрения машинного обучения, начиная от распознавания медицинских снимков и заканчивая постановкой диагноза, пусть не в качестве конечного вердикта, но в виде весомого совета для докторов.

Пока машинное обучение помогает врачам иначе. Например, в американском госпитале алгоритм на основе машинного обучения предсказывает заполняемость больницы, распределяет время врачей и медсестер и заказывает расходники.

«Машинное обучение применяется в медицине и в сложных задачах — таких, как модель AlphaFold2, предсказывающая структуру белков. И в более приземленных и доступных — например, при создании элайнеров (ортодонтических капп на зубы)». Лариса Маркеева, лауреат научной премии им. Ильи Сегаловича в 2020 году

Предупрежден, значит вооружен

Может показаться, что машинное обучение всесильно и сможет вскоре заменить человека в любой области. Это не так. Не во всех задачах сейчас можно прибегнуть к помощи машинного обучения. Порой собранных данных просто недостаточно для создания качественного алгоритма. Но, как подсказывает Игорь Куралёнок, возглавляющий подразделения AI & ML Yandex.Cloud, иногда выход все же есть — применение трансферного обучения (transfer learning).

Эта методика позволяет экстраполировать имеющиеся алгоритмы на более узкие проблемы. Подходящим примером является переобучение готовой языковой модели на перевод специфической малоизученной литературы. Возможны ли в этом случае ошибки? Скорее всего, да. Но не стоит забывать, что ошибки, человеческие они или машинные, — это естественная часть совершенствования технологии. И чем больше мы о них знаем, тем проще их обнаружить и исправить.

Но использование даже самых современных методик пока что не позволяет доверить машинному обучению задачи, сопряженные с высоким риском. Дэвид Талбот, руководитель отдела NLP Яндекса и член жюри научной премии им. Ильи Сегаловича, считает, что полностью доверить машинам такие задачи, как, например, операции на сердце или даже управление автомобилем, еще нельзя.

«Очевидно, что приход transfer learning в NLP (от англ. natural language processing — "обработка естественного языка") — очень важный прорыв, который чуть раньше произошел и в компьютерном зрении. Отдельно стоит отметить модели (например, DeBERTa — Decoding-enhanced BERT with Disentangled Attention), которые смогли превзойти человека в задачах понимания текста (на SuperGLUE benchmark). Но стоит обратить внимание и на другие важные работы в области. Использование баз и графов знаний (knowledge bases и knowledge graphs) совместно с языковыми моделями становится популярным и используется, например, в диалоговых системах или для генерации текста». Анастасия Янина, лауреат научной премии им. Ильи Сегаловича в 2020 году

Александр Крайнов из Лаборатории машинного интеллекта Яндекса считает, что нейросети технически несовершенны в сравнении с мозгом. Мозг способен выполнять самые разнообразные задачи, затрачивая несравнимо меньше энергии, чем нейросети. В том числе поэтому не стоит ждать, что в скором времени машина сможет воспроизвести работу человеческого мозга. В ближайшее время нейросети будут эффективны лишь в решении узких конкретных задач.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

РНК нейрональных предшественников в гиппокампе указала на нейрогенез у взрослых РНК нейрональных предшественников в гиппокампе указала на нейрогенез у взрослых

Как ученые подтвердили нейрогенез у взрослых

N+1
Почему одним женщинам дарят подарки, а другим нет? Знает Михаил Лабковский Почему одним женщинам дарят подарки, а другим нет? Знает Михаил Лабковский

Михаил Лабковский: понять, почему вам не дарят подарки, очень просто

Cosmopolitan
Горе от интеллекта: как хайп вокруг ИИ вредит IT-продуктам Горе от интеллекта: как хайп вокруг ИИ вредит IT-продуктам

В каких случаях ИИ навредит продукту, а в каких — поможет

Forbes
Новый робот борозды не испортит Новый робот борозды не испортит

В сельском хозяйстве хозяйничают роботы и все самые фантастические технологии!

Maxim
Лекарство от уныния: как философия помогает бороться с тревогой и внутренней пустотой Лекарство от уныния: как философия помогает бороться с тревогой и внутренней пустотой

Почему в мире бесконечных возможностей мы все чаще чувствуем тревогу, пустоту?

Forbes
Гимнастика для глаз: 10 полезных упражнений для улучшения зрения Гимнастика для глаз: 10 полезных упражнений для улучшения зрения

Специальная зрительная гимнастика

РБК
Мы уйдем из зоопарка Мы уйдем из зоопарка

Татьяна Алешичева о Берлине 70-х в сериале «Мы дети станции „Зоо“»

Weekend
Живу чужую жизнь: какие трудности тебя ждут, если ты не на своем месте в семье Живу чужую жизнь: какие трудности тебя ждут, если ты не на своем месте в семье

Посещают ли тебя мысли, что ты живешь неправильно?

Cosmopolitan
Лучи поддержки Лучи поддержки

Зачем над растениями вешают фиолетовые лампы

N+1
Чем пахнет эпоха? Она пахнет кофе Чем пахнет эпоха? Она пахнет кофе

Как кофе вызывал споры между поэтами и провоцировал насилие

GQ
Не только баскетбол и кроссовки: посмотрите, как Майкл Джордан играл в гольф и превосходно одевался для этого Не только баскетбол и кроссовки: посмотрите, как Майкл Джордан играл в гольф и превосходно одевался для этого

Как хобби может идти рука об руку с безупречным стилем

Esquire
Пауки с острова Кокос научились плести разные сети для охоты у воды и высоко над землей Пауки с острова Кокос научились плести разные сети для охоты у воды и высоко над землей

Пауки освоили множество способов охоты с использованием паутины

N+1
Прощайте, роботы: за что мы любим Daft Punk Прощайте, роботы: за что мы любим Daft Punk

Чем запомнится дуэт Daft Punk

Esquire
Цианобактерии выжили на марсианских ресурсах Цианобактерии выжили на марсианских ресурсах

Цианобактерии наработали биомассу в условиях низкого давления

N+1
Пять бытовых мифов, которые оказались правдой или имели реальные основания Пять бытовых мифов, которые оказались правдой или имели реальные основания

Легенды, в которые до сих пор наивно верят

Maxim
Моя семья и другие звери Моя семья и другие звери

История любви Николая и Татьяны Дроздовых длиной в сорок четыре года

Tatler
“Нам нравится щекотать друг другу мозг” “Нам нравится щекотать друг другу мозг”

Конфликтолог Андрей Кёниг помогает снизить накал страстей в паре

Psychologies
Эффектный конский хвост: 10 крутых идей для самой удобной прически Эффектный конский хвост: 10 крутых идей для самой удобной прически

Если обычный конский хвост — это слишком скучно, то попробуй наши варианты

Cosmopolitan
Самобытная Россия: нивхи Самобытная Россия: нивхи

Как нивхи пешком пришли на Сахалин с Большой земли

Культура.РФ
Отрывок из книги Ирины Левонтиной «Честное слово» Отрывок из книги Ирины Левонтиной «Честное слово»

Книга с рассказами и эссе об отдельных словах и выражениях русского языка

СНОБ
Чего не хватает российским учёным, чтобы делать прорывные проекты, и почему они вынуждены уходить в коммерцию Чего не хватает российским учёным, чтобы делать прорывные проекты, и почему они вынуждены уходить в коммерцию

Почему в России трудно продавать наукоёмкий продукт

Inc.
Клуб первых жен: к истории фотосессии с Юлией Навальной Клуб первых жен: к истории фотосессии с Юлией Навальной

Жены оппозиционеров — это сила, с которой придется считаться

СНОБ
Летающий танк или летающий гроб? 6 железных фактов о штурмовике Ил-2 Летающий танк или летающий гроб? 6 железных фактов о штурмовике Ил-2

Каким был штурмовик Ил-2?

Maxim
Что делать днем, чтобы уснуть ночью, и как быть, если уснуть не получается. Советы от эксперта по тревоге Что делать днем, чтобы уснуть ночью, и как быть, если уснуть не получается. Советы от эксперта по тревоге

Проблемы, которые лишают нас сна и инструменты для борьбы с ними

Inc.
Как никуда не торопиться и все успевать: совет начинающим мамам Как никуда не торопиться и все успевать: совет начинающим мамам

Мама должна быть рядом, мама должна кормить, мама должна... А должна ли?

Psychologies
«Съел боул с ростками — закрыл гештальт». Создатель «здорового попкорна» и вегетарианский шеф-повар — о мифах об авокадо, правильном питании, модной годжи и немодной брюкве «Съел боул с ростками — закрыл гештальт». Создатель «здорового попкорна» и вегетарианский шеф-повар — о мифах об авокадо, правильном питании, модной годжи и немодной брюкве

Как найти баланс между пользой и эмоциями от еды?

Inc.
Что посмотреть и попробовать в Туве. Гид «РБК Стиль» Что посмотреть и попробовать в Туве. Гид «РБК Стиль»

Гид по самой загадочной республике России, где есть ларьки и нет супермаркетов

РБК
Мощные ледниковые щиты за последние 150 тысяч лет дважды опреснили Северный Ледовитый океан Мощные ледниковые щиты за последние 150 тысяч лет дважды опреснили Северный Ледовитый океан

Арктика превращается в изолированный пресноводный резервуар

N+1
Nissan Qashqai заходит на третий круг Nissan Qashqai заходит на третий круг

Твоя будущая бывшая машина уже здесь

Maxim
Современные антипапы: игра святых престолов Современные антипапы: игра святых престолов

Идея папства как залога церковного единства

Weekend
Открыть в приложении