Может ли машинное обучение предсказать свое будущее?

N+1Hi-Tech

Гадание на датасетах

Может ли машинное обучение предсказать свое будущее?

Богдан Сиротич

Вы каждый день сталкиваетесь с машинным обучением и его работой. Вас удивляет, как быстро его учат новым навыкам и совершенствуют в старых. Но что если мы скажем, что все это достигнуто с помощью всего половины процента от имеющихся у человечества данных? Вместе с экспертами Яндекса рассказываем, как в ближайшие годы машинное обучение изменит мир вокруг нас.

N + 1 совместно с экспертами Яндекса, а также членами жюри и лауреатами научной премии им. Ильи Сегаловича представляет материал о ближайших и более дальних перспективах машинного обучения. В 2019 году Яндекс учредил премию имени Ильи Сегаловича в память о создателе первой версии поисковика «Яндекс» и популяризатора компьютерных наук. Это ежегодная премия для молодых исследователей в области машинного обучения, компьютерного зрения, информационного поиска и анализа данных, а также обработки естественного языка.

Если вы студент, аспирант или научный руководитель из России, Беларуси или Казахстана и работаете над подобными задачами, вам стоит рассказать о своих успехах и подать заявку на соискание премии. В этом году они будут приниматься до 1 марта включительно.

Здесь нет заголовка, но машинное обучение может его придумать

Машинное обучение есть почти в каждом гаджете, который нас окружает. С его помощью работают поисковики, агрегаторы такси, камеры, отслеживающие нарушения ПДД. Сейчас этим никого не удивишь. Но в последние годы машинное обучение стало важной частью медицинских и даже гуманитарных исследований.

В январе разработчики из OpenAI представили нейросеть DALL-E, способную создавать изображения по текстовому описанию. Это не первая подобная разработка, но очень интересная и разносторонняя. Пока рано говорить, что у нейросетей появилось воображение, но DALL-E способен рисовать предметы, руководствуясь даже очень абстрактным описанием, — например, «кресло в форме авокадо». Нейросеть также способна дорисовывать существующему изображению прямоугольную область с любой стороны, создавать реалистичные изображения по наброску и разбирается в том, как менялись вещи со временем. К примеру, DALL-E отличает деревянный телефон 1920-х годов от не таких старых домашних барабанных телефонов.

Подобная технология помогает создавать сцену по имеющемуся сценарию — то есть рисовать примерное изображение того действа, которое задумал сценарист. И этим использование машинного обучения в кино не ограничивается. По словам Игоря Куралёнка, члена жюри научной премии им. Ильи Сегаловича, руководителя подразделения AI & ML Yandex.Cloud, можно выполнять дубляж зарубежных фильмов, не используя голоса российских актеров, а при помощи машинного обучения «заставляя» иностранных исполнителей говорить по-русски.

Беспилотные автомобили, которые мы раньше могли видеть только в качестве первых прототипов на специальных полигонах, уже разъезжают по Москве, пока в тестовом режиме. И пускай эта технология еще не достигла полного развития, от нее можно ждать большого прогресса в ближайшем будущем. Другая интересная технология, в которой широко применяется машинное зрение, — магазины без продавцов. Несколько торговых сетей уже запустили пилотные проекты в Москве.

«Технологии глубокого обучения необходимы для обработки данных после сканирования трехмерного пространства — с помощью лидаров, сканеров структурированного света и других инструментов. Результаты применяются и при создании беспилотных авто, и в разработке приложений для мобильных устройств». Евгений Бурнаев, доцент Сколтеха, стал обладателем научной премии им. Ильи Сегаловича среди научных руководителей в 2020 году

Гораздо необычнее то, что сейчас машинное обучение помогает расшифровывать забытую письменность. До начала предыдущего столетия в Японии использовалась письменная система, называемая кузусидзи. Сейчас — спустя более века после реформы системы образования — почти не осталось людей, способных ее понимать. Чтобы решить проблему расшифровки древних текстов Национальный институт японской литературы опубликовал датасет кузусидзи, содержащий более 4 тысяч классов символов и миллион их разнообразных изображений. Чтобы извлечь максимум из имеющихся данных, на платформе Kaggle открыли соревнование, победитель которого достиг F1 = 0,950. Суть соревнования заключалась в распознавании письменности и ее переводе на современную японскую письменность.

Постепенно машинное обучение проникает и в медицину. Как утверждает Александр Крайнов, член совета научной премии им. Ильи Сегаловича и руководитель Лаборатории машинного интеллекта Яндекса, медицина — самое интересное место для внедрения машинного обучения, начиная от распознавания медицинских снимков и заканчивая постановкой диагноза, пусть не в качестве конечного вердикта, но в виде весомого совета для докторов.

Пока машинное обучение помогает врачам иначе. Например, в американском госпитале алгоритм на основе машинного обучения предсказывает заполняемость больницы, распределяет время врачей и медсестер и заказывает расходники.

«Машинное обучение применяется в медицине и в сложных задачах — таких, как модель AlphaFold2, предсказывающая структуру белков. И в более приземленных и доступных — например, при создании элайнеров (ортодонтических капп на зубы)». Лариса Маркеева, лауреат научной премии им. Ильи Сегаловича в 2020 году

Предупрежден, значит вооружен

Может показаться, что машинное обучение всесильно и сможет вскоре заменить человека в любой области. Это не так. Не во всех задачах сейчас можно прибегнуть к помощи машинного обучения. Порой собранных данных просто недостаточно для создания качественного алгоритма. Но, как подсказывает Игорь Куралёнок, возглавляющий подразделения AI & ML Yandex.Cloud, иногда выход все же есть — применение трансферного обучения (transfer learning).

Эта методика позволяет экстраполировать имеющиеся алгоритмы на более узкие проблемы. Подходящим примером является переобучение готовой языковой модели на перевод специфической малоизученной литературы. Возможны ли в этом случае ошибки? Скорее всего, да. Но не стоит забывать, что ошибки, человеческие они или машинные, — это естественная часть совершенствования технологии. И чем больше мы о них знаем, тем проще их обнаружить и исправить.

Но использование даже самых современных методик пока что не позволяет доверить машинному обучению задачи, сопряженные с высоким риском. Дэвид Талбот, руководитель отдела NLP Яндекса и член жюри научной премии им. Ильи Сегаловича, считает, что полностью доверить машинам такие задачи, как, например, операции на сердце или даже управление автомобилем, еще нельзя.

«Очевидно, что приход transfer learning в NLP (от англ. natural language processing — "обработка естественного языка") — очень важный прорыв, который чуть раньше произошел и в компьютерном зрении. Отдельно стоит отметить модели (например, DeBERTa — Decoding-enhanced BERT with Disentangled Attention), которые смогли превзойти человека в задачах понимания текста (на SuperGLUE benchmark). Но стоит обратить внимание и на другие важные работы в области. Использование баз и графов знаний (knowledge bases и knowledge graphs) совместно с языковыми моделями становится популярным и используется, например, в диалоговых системах или для генерации текста». Анастасия Янина, лауреат научной премии им. Ильи Сегаловича в 2020 году

Александр Крайнов из Лаборатории машинного интеллекта Яндекса считает, что нейросети технически несовершенны в сравнении с мозгом. Мозг способен выполнять самые разнообразные задачи, затрачивая несравнимо меньше энергии, чем нейросети. В том числе поэтому не стоит ждать, что в скором времени машина сможет воспроизвести работу человеческого мозга. В ближайшее время нейросети будут эффективны лишь в решении узких конкретных задач.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Астрономы отыскали удивительно развитую перемычку у спиральной галактики в ранней Вселенной Астрономы отыскали удивительно развитую перемычку у спиральной галактики в ранней Вселенной

Астрономы обнаружили у галактики J0107a необычно развитую центральную перемычку

N+1
Рядом со Стоунхенджем нашли неолитические могилы и мастерскую бронзового века Рядом со Стоунхенджем нашли неолитические могилы и мастерскую бронзового века

В коллекцию находок вошли предмет неизвестного назначения и разная керамика

N+1
Дорого и сложно: что тормозит внедрение ИИ в медицину Дорого и сложно: что тормозит внедрение ИИ в медицину

Почему внедрение инноваций в медицине происходит так медленно?

Forbes
6 сигналов того, что ваш партнер ведет себя незрело 6 сигналов того, что ваш партнер ведет себя незрело

Определить эмоциональную незрелость другого человека не так-то просто

Psychologies
Сквирт или не сквирт: вопросы, советы, подводные камни Сквирт или не сквирт: вопросы, советы, подводные камни

Рассказываем, откуда берется струйный оргазм и на что он похож

Cosmopolitan
Испанские страсти Испанские страсти

Певица Розалия готовит новый альбом, а в перерыве — выбирает наряды и пластинки

Vogue
Александра Ребенок: «Профессия сделала меня сильной» Александра Ребенок: «Профессия сделала меня сильной»

Александра Ребенок — о сильном характере, умении совмещать материнство и карьеру

Здоровье
Возрожденная британская популяция журавлей преодолела рубеж в двести особей Возрожденная британская популяция журавлей преодолела рубеж в двести особей

Как в Великобритании восстанавливают популяцию журавлей

N+1
Роман Балаян: «Не знаю, мое ли это призвание — режиссура, но мне она стала судьбой» Роман Балаян: «Не знаю, мое ли это призвание — режиссура, но мне она стала судьбой»

Режиссер Роман Балаян о съемках Алексея Германа и работе с Олегом Янковским

Караван историй
Джентльмен в деталях: почему Кларк Гейбл безупречно выглядел — в костюме и не только Джентльмен в деталях: почему Кларк Гейбл безупречно выглядел — в костюме и не только

Кларк Гейбл одевался как образцовый джентльмен, а секрет его стиля был в деталях

Esquire
Как менялось отношение к делу Вуди Аллена и Миа Фэрроу Как менялось отношение к делу Вуди Аллена и Миа Фэрроу

История отношения общества и прессы к Вуди Аллену и его семье с Миа Фэрроу

Weekend
«Не смотри на них!» 5 практик бодипозитива, от которых может стать только хуже «Не смотри на них!» 5 практик бодипозитива, от которых может стать только хуже

Бодипозитивные советы, которые не помогут тебе принять собственное тело

Cosmopolitan
Крупным планом: выясняем, за что любить, а за что ненавидеть новую Lada Niva Travel Крупным планом: выясняем, за что любить, а за что ненавидеть новую Lada Niva Travel

Теперь вместо “Шнивы” у нас Lada Niva Travel: уже не пирожок, но все еще Niva

Популярная механика
Правила жизни Бенисио Дель Торо Правила жизни Бенисио Дель Торо

Правила жизни актера Бенисио Дель Торо

Esquire
О чём поведала астролябия VP-856 и как цифровые карты помогли заглянуть в прошлое О чём поведала астролябия VP-856 и как цифровые карты помогли заглянуть в прошлое

Как ученые и путешественники делали первые карты и измеряли расстояния

Наука и жизнь
Бег убивает колени: разбираемся в самой безумной беговой теории заговора Бег убивает колени: разбираемся в самой безумной беговой теории заговора

Как подойти к лету в хорошей форме и на своих двоих

GQ
Нас не сломаешь! Нас не сломаешь!

Как избежать остеопороза

Лиза
«Пропагандисты мракобесия тоже не спят»: популяризатор науки Александр Соколов — о будущем человека и научном юморе «Пропагандисты мракобесия тоже не спят»: популяризатор науки Александр Соколов — о будущем человека и научном юморе

Интервью с финалистом премии «Просветитель» Александр Соколов

Forbes
В главных ролях В главных ролях

Московская квартира с авангардными принтами для художницы по костюмам

AD
Жизнь на полной мощности Жизнь на полной мощности

Управление энергией – ключ к высокой эффективности, здоровью и счастью

kiozk originals
Сила Сибири Сила Сибири

Пять городов Сибири, где можно насладиться настоящей зимой

Лиза
Пять пороков команды Пять пороков команды

Притчи о лидерстве

kiozk originals
Даниэль Лозакович: Со Страдивари налегке Даниэль Лозакович: Со Страдивари налегке

Блиц-интервью звезды классической музыки, скрипача Даниэля Лозаковича

СНОБ
«Рыцари справедливости» – фильм-притча, который притворяется боевиком «Рыцари справедливости» – фильм-притча, который притворяется боевиком

«Рыцари справедливости» доказывают, что жизнь – это хаос

GQ
Будущее в прошлом: почему доклад академиков-экономистов можно считать предостережением бизнесу и гражданам Будущее в прошлом: почему доклад академиков-экономистов можно считать предостережением бизнесу и гражданам

Появился новый рецепт ускорения российской экономики

Forbes
Дамы одевают кавалеров Дамы одевают кавалеров

Ключевые имена в мужской моде сегодня — женские

Robb Report
Не только родинки: 7 признаков меланомы, которые просто не замечают Не только родинки: 7 признаков меланомы, которые просто не замечают

Меланома – одно из самых опасных онкологических заболеваний

Cosmopolitan
Зеленое будущее: как цианобактерии помогут человечеству выживать на Марсе Зеленое будущее: как цианобактерии помогут человечеству выживать на Марсе

Цианобактерии могут успешно расти в условиях марсианской атмосферы

Популярная механика
Что такое устойчивая архитектура, и почему «зеленые» здания не всегда покрыты растениями Что такое устойчивая архитектура, и почему «зеленые» здания не всегда покрыты растениями

Изменение климата заставляет многие сферы жизни человека «зеленеть»

Популярная механика
«Я верила вруну»: автор книги «Твоя идеальная семья» разводится со вторым мужем «Я верила вруну»: автор книги «Твоя идеальная семья» разводится со вторым мужем

Писательница и коуч Олеся Малинская по отношениям потерпела крах в личной жизни

Cosmopolitan
Открыть в приложении