Может ли машинное обучение предсказать свое будущее?

N+1Hi-Tech

Гадание на датасетах

Может ли машинное обучение предсказать свое будущее?

Богдан Сиротич

Вы каждый день сталкиваетесь с машинным обучением и его работой. Вас удивляет, как быстро его учат новым навыкам и совершенствуют в старых. Но что если мы скажем, что все это достигнуто с помощью всего половины процента от имеющихся у человечества данных? Вместе с экспертами Яндекса рассказываем, как в ближайшие годы машинное обучение изменит мир вокруг нас.

N + 1 совместно с экспертами Яндекса, а также членами жюри и лауреатами научной премии им. Ильи Сегаловича представляет материал о ближайших и более дальних перспективах машинного обучения. В 2019 году Яндекс учредил премию имени Ильи Сегаловича в память о создателе первой версии поисковика «Яндекс» и популяризатора компьютерных наук. Это ежегодная премия для молодых исследователей в области машинного обучения, компьютерного зрения, информационного поиска и анализа данных, а также обработки естественного языка.

Если вы студент, аспирант или научный руководитель из России, Беларуси или Казахстана и работаете над подобными задачами, вам стоит рассказать о своих успехах и подать заявку на соискание премии. В этом году они будут приниматься до 1 марта включительно.

Здесь нет заголовка, но машинное обучение может его придумать

Машинное обучение есть почти в каждом гаджете, который нас окружает. С его помощью работают поисковики, агрегаторы такси, камеры, отслеживающие нарушения ПДД. Сейчас этим никого не удивишь. Но в последние годы машинное обучение стало важной частью медицинских и даже гуманитарных исследований.

В январе разработчики из OpenAI представили нейросеть DALL-E, способную создавать изображения по текстовому описанию. Это не первая подобная разработка, но очень интересная и разносторонняя. Пока рано говорить, что у нейросетей появилось воображение, но DALL-E способен рисовать предметы, руководствуясь даже очень абстрактным описанием, — например, «кресло в форме авокадо». Нейросеть также способна дорисовывать существующему изображению прямоугольную область с любой стороны, создавать реалистичные изображения по наброску и разбирается в том, как менялись вещи со временем. К примеру, DALL-E отличает деревянный телефон 1920-х годов от не таких старых домашних барабанных телефонов.

Подобная технология помогает создавать сцену по имеющемуся сценарию — то есть рисовать примерное изображение того действа, которое задумал сценарист. И этим использование машинного обучения в кино не ограничивается. По словам Игоря Куралёнка, члена жюри научной премии им. Ильи Сегаловича, руководителя подразделения AI & ML Yandex.Cloud, можно выполнять дубляж зарубежных фильмов, не используя голоса российских актеров, а при помощи машинного обучения «заставляя» иностранных исполнителей говорить по-русски.

Беспилотные автомобили, которые мы раньше могли видеть только в качестве первых прототипов на специальных полигонах, уже разъезжают по Москве, пока в тестовом режиме. И пускай эта технология еще не достигла полного развития, от нее можно ждать большого прогресса в ближайшем будущем. Другая интересная технология, в которой широко применяется машинное зрение, — магазины без продавцов. Несколько торговых сетей уже запустили пилотные проекты в Москве.

«Технологии глубокого обучения необходимы для обработки данных после сканирования трехмерного пространства — с помощью лидаров, сканеров структурированного света и других инструментов. Результаты применяются и при создании беспилотных авто, и в разработке приложений для мобильных устройств». Евгений Бурнаев, доцент Сколтеха, стал обладателем научной премии им. Ильи Сегаловича среди научных руководителей в 2020 году

Гораздо необычнее то, что сейчас машинное обучение помогает расшифровывать забытую письменность. До начала предыдущего столетия в Японии использовалась письменная система, называемая кузусидзи. Сейчас — спустя более века после реформы системы образования — почти не осталось людей, способных ее понимать. Чтобы решить проблему расшифровки древних текстов Национальный институт японской литературы опубликовал датасет кузусидзи, содержащий более 4 тысяч классов символов и миллион их разнообразных изображений. Чтобы извлечь максимум из имеющихся данных, на платформе Kaggle открыли соревнование, победитель которого достиг F1 = 0,950. Суть соревнования заключалась в распознавании письменности и ее переводе на современную японскую письменность.

Постепенно машинное обучение проникает и в медицину. Как утверждает Александр Крайнов, член совета научной премии им. Ильи Сегаловича и руководитель Лаборатории машинного интеллекта Яндекса, медицина — самое интересное место для внедрения машинного обучения, начиная от распознавания медицинских снимков и заканчивая постановкой диагноза, пусть не в качестве конечного вердикта, но в виде весомого совета для докторов.

Пока машинное обучение помогает врачам иначе. Например, в американском госпитале алгоритм на основе машинного обучения предсказывает заполняемость больницы, распределяет время врачей и медсестер и заказывает расходники.

«Машинное обучение применяется в медицине и в сложных задачах — таких, как модель AlphaFold2, предсказывающая структуру белков. И в более приземленных и доступных — например, при создании элайнеров (ортодонтических капп на зубы)». Лариса Маркеева, лауреат научной премии им. Ильи Сегаловича в 2020 году

Предупрежден, значит вооружен

Может показаться, что машинное обучение всесильно и сможет вскоре заменить человека в любой области. Это не так. Не во всех задачах сейчас можно прибегнуть к помощи машинного обучения. Порой собранных данных просто недостаточно для создания качественного алгоритма. Но, как подсказывает Игорь Куралёнок, возглавляющий подразделения AI & ML Yandex.Cloud, иногда выход все же есть — применение трансферного обучения (transfer learning).

Эта методика позволяет экстраполировать имеющиеся алгоритмы на более узкие проблемы. Подходящим примером является переобучение готовой языковой модели на перевод специфической малоизученной литературы. Возможны ли в этом случае ошибки? Скорее всего, да. Но не стоит забывать, что ошибки, человеческие они или машинные, — это естественная часть совершенствования технологии. И чем больше мы о них знаем, тем проще их обнаружить и исправить.

Но использование даже самых современных методик пока что не позволяет доверить машинному обучению задачи, сопряженные с высоким риском. Дэвид Талбот, руководитель отдела NLP Яндекса и член жюри научной премии им. Ильи Сегаловича, считает, что полностью доверить машинам такие задачи, как, например, операции на сердце или даже управление автомобилем, еще нельзя.

«Очевидно, что приход transfer learning в NLP (от англ. natural language processing — "обработка естественного языка") — очень важный прорыв, который чуть раньше произошел и в компьютерном зрении. Отдельно стоит отметить модели (например, DeBERTa — Decoding-enhanced BERT with Disentangled Attention), которые смогли превзойти человека в задачах понимания текста (на SuperGLUE benchmark). Но стоит обратить внимание и на другие важные работы в области. Использование баз и графов знаний (knowledge bases и knowledge graphs) совместно с языковыми моделями становится популярным и используется, например, в диалоговых системах или для генерации текста». Анастасия Янина, лауреат научной премии им. Ильи Сегаловича в 2020 году

Александр Крайнов из Лаборатории машинного интеллекта Яндекса считает, что нейросети технически несовершенны в сравнении с мозгом. Мозг способен выполнять самые разнообразные задачи, затрачивая несравнимо меньше энергии, чем нейросети. В том числе поэтому не стоит ждать, что в скором времени машина сможет воспроизвести работу человеческого мозга. В ближайшее время нейросети будут эффективны лишь в решении узких конкретных задач.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Считай по головам Считай по головам

Как математические модели помогают экологам прогнозировать будущее видов

N+1
Ты 2.0: тотальный апгрейд секса, доходов и здоровья! Ты 2.0: тотальный апгрейд секса, доходов и здоровья!

Займись тотальным апгрейдом себя!

Maxim
Обзор проектора Anker Nebula Capsule II: карманный кинотеатр Обзор проектора Anker Nebula Capsule II: карманный кинотеатр

Обзор необычного проектора Anker Nebula Capsule II с Android TV

CHIP
Физики провели химическую реакцию с одним атомом резерфордия Физики провели химическую реакцию с одним атомом резерфордия

Физики экспериментально доказали плохую растворимость гидроксида резерфордия

N+1
Игры безо всего для компании: топ-10 классных идей, для которых не нужен реквизит Игры безо всего для компании: топ-10 классных идей, для которых не нужен реквизит

Подборка интересных, увлекательных и не требующих реквизита игр для взрослых

Playboy
В Антарктиде снег «зацвел» зеленым и малиновым цветом В Антарктиде снег «зацвел» зеленым и малиновым цветом

Это произошло возле научно-исследовательской станции «Академик Вернадский»

National Geographic
Первая глава романа «Братство» Ингара Йонсруда Первая глава романа «Братство» Ингара Йонсруда

Отрывок из дебютного детективного романа «Братство» Ингара Йонсруда

СНОБ
Веселая вдова: лучшая роль Мишель Пфайффер — женщина, которая неудачно спланировала свою смерть Веселая вдова: лучшая роль Мишель Пфайффер — женщина, которая неудачно спланировала свою смерть

Почему фильм «Уйти не прощаясь» может принести «Оскар» Мишель Пфайффер

Forbes
Женщины эмансипированы, а равенства нет: социолог — о гендерной повестке в России Женщины эмансипированы, а равенства нет: социолог — о гендерной повестке в России

Социолог Анна Темкина — о том, что мешает женщинам делать карьеру

Forbes
Элена Ферранте: Любовь в тягость Элена Ферранте: Любовь в тягость

Первая глава романа Элены Ферранте

СНОБ
Клатч у груди и вибратор в сумочке: что скрывала леди Диана — 6 тайн принцессы Клатч у груди и вибратор в сумочке: что скрывала леди Диана — 6 тайн принцессы

Вспоминаем самые странные привычки принцессы Дианы и раскрываем их тайный смысл

Cosmopolitan
Как отпраздновать 23 февраля в компании друзей Как отпраздновать 23 февраля в компании друзей

23 февраля – отличный повод, чтобы провести день в мужской компании

GQ
Как Конан Дойл стал Шерлоком Холмсом, расследовал загадочное убийство и исправил одну из крупнейших судебных ошибок XX века Как Конан Дойл стал Шерлоком Холмсом, расследовал загадочное убийство и исправил одну из крупнейших судебных ошибок XX века

Шерлок им бы гордился

Maxim
Старшие и младшие Старшие и младшие

Как правильно воспитывать двух детей с большой разницей в возрасте?

Лиза
Яйцеклетка — что нужно знать? Яйцеклетка — что нужно знать?

Яйцеклетка — самая крупная клетка твоего организма

Cosmopolitan
Правила жизни Милоша Формана Правила жизни Милоша Формана

Режиссер, умер 13 апреля 2018 года в возрасте 86 лет

Esquire
Ацетат-ионы помогли получить аморфные пленки перовскита в нормальных условиях Ацетат-ионы помогли получить аморфные пленки перовскита в нормальных условиях

Химики смогли получить аморфные и смешанные пленки перовскита

N+1
Сонливость днем: причины и способы перестать быть Спящим красавцем Сонливость днем: причины и способы перестать быть Спящим красавцем

Список факторов, провоцирующих дневную сонливость

Playboy
MAXIM рецензирует триллер «Аферистка» с Розамунд Пайк и Тирионом Ланнистером MAXIM рецензирует триллер «Аферистка» с Розамунд Пайк и Тирионом Ланнистером

Настал год пандемии. Количество бреда на экранах увеличилось вдвое

Maxim
Ботокс: что нужно знать, прежде чем принимать решение Ботокс: что нужно знать, прежде чем принимать решение

Что лучше знать до инъекций ботокса и как он влияет на красоту и здоровье

РБК
«Полет» на автопилоте: чего ждать от нового сериала Петра Тодоровского «Полет» на автопилоте: чего ждать от нового сериала Петра Тодоровского

Какие сюрпризы принес зрителям новый сериал «Полет»?

Psychologies
На австралийском острове начался «экологический ренессанс». Для этого пришлось истребить 300 тысяч грызунов На австралийском острове начался «экологический ренессанс». Для этого пришлось истребить 300 тысяч грызунов

Как грызуны нанесли огромный ущерб фауне и флоре австралийского острова

National Geographic
Как тиктокер Костя Киевский попал под статью за хулиганство на протестах и набрал 800 000 подписчиков Как тиктокер Костя Киевский попал под статью за хулиганство на протестах и набрал 800 000 подписчиков

Что грозит Косте Киевскому после ареста и как складывалась карьера тиктокера?

Forbes
Внутренние революционеры с благими намерениями: почему протесты подтолкнули людей переходить на госслужбу Внутренние революционеры с благими намерениями: почему протесты подтолкнули людей переходить на госслужбу

Что за люди потянулись к госслужбе и чего они хотят на самом деле?

Forbes
Джентльмен в деталях: почему Кларк Гейбл безупречно выглядел — в костюме и не только Джентльмен в деталях: почему Кларк Гейбл безупречно выглядел — в костюме и не только

Кларк Гейбл одевался как образцовый джентльмен, а секрет его стиля был в деталях

Esquire
Для фанатов «Бумажного дома» и «Элиты»: новые испанские сериалы Для фанатов «Бумажного дома» и «Элиты»: новые испанские сериалы

Самые интересные испанские сериалы

Cosmopolitan
«Черт с ним, с закрытым рестораном, мне было жалко людей»: ресторатор Евгений Ничипурук о лубочной русской кухне и выживании в кризис «Черт с ним, с закрытым рестораном, мне было жалко людей»: ресторатор Евгений Ничипурук о лубочной русской кухне и выживании в кризис

Интервью с ресторатором Евгением Ничипуруком о том, как бизнес пережил кризис

Forbes
Змея, которую пригрела Диана: как выглядела та, которая увела мужа у леди Ди Змея, которую пригрела Диана: как выглядела та, которая увела мужа у леди Ди

Сравниваем стиль Камиллы Паркер-Боулз и принцессы Дианы

Cosmopolitan
Прощайте, роботы: за что мы любим Daft Punk Прощайте, роботы: за что мы любим Daft Punk

Чем запомнится дуэт Daft Punk

Esquire
Стилист назвала 5 главных ошибок с оверсайз-пиджаками — никогда так не делай! Стилист назвала 5 главных ошибок с оверсайз-пиджаками — никогда так не делай!

Вещи оверсайз сегодня на пике популярности

Cosmopolitan
Открыть в приложении