Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Почему в России такой дешевый интернет? Простой ответ Почему в России такой дешевый интернет? Простой ответ

Интернет в России один из самых дешевых и быстрых — как это возможно?

ТехИнсайдер
6 мифов о космосе, в которые вы до сих пор верите 6 мифов о космосе, в которые вы до сих пор верите

По количеству существующих мифов космос может соперничать разве что с медициной

ТехИнсайдер
6 способов защиты от болезни Альцгеймера 6 способов защиты от болезни Альцгеймера

Есть полезные привычки, которые помогут сохранить ясность ума

Psychologies
Население древнего карфагенского города оказалось генетически разнообразным Население древнего карфагенского города оказалось генетически разнообразным

Палеогенетики исследовали геномы жителей Средиземноморья железного века

N+1

Страхи в постели часто вообще никак не связаны с реальным положением дел

VOICE
Правила жизни Роберта Де Ниро Правила жизни Роберта Де Ниро

Правила жизни актера Роберта Де Ниро

Правила жизни
Как полировать фары автомобиля: три способа и советы эксперта Как полировать фары автомобиля: три способа и советы эксперта

Вернуть фарам изначальный вид можно при помощи полировки

РБК
Имеют ли право судебные власти Имеют ли право судебные власти

Юрист анализирует право человека на частную жизнь его мозга

ТехИнсайдер
Развенчиваем мифы народной медицины Развенчиваем мифы народной медицины

Народная медицина: польза или вред?

Лиза
Что запускать и где взять деньги: венчурный гид по Латинской Америке Что запускать и где взять деньги: венчурный гид по Латинской Америке

Как устроен венчурный рынок в Латинской Америке

Forbes
Весь мозг на одном кристалле. Будущее мемристоров приближается Весь мозг на одном кристалле. Будущее мемристоров приближается

Мемристорная вычислительная техника может прийти на смену традиционной

ТехИнсайдер
«Боец музыкального фронта» «Боец музыкального фронта»

Жавдет Айдаров навсегда остался настоящим ленинградцем

Дилетант
Почему мы боимся одиночества и что делать, если вы одиноки? Почему мы боимся одиночества и что делать, если вы одиноки?

Почему одиночество гильотиной нависает над людьми?

Правила жизни
4 фразы нового партнера, которые должны стать для вас «красными флажками» 4 фразы нового партнера, которые должны стать для вас «красными флажками»

Как распознать сигналы, говорящие о нездоровых или даже опасных отношениях

Psychologies
Китайские ученые лишили мышей хромосомы. А потом еще одной Китайские ученые лишили мышей хромосомы. А потом еще одной

Ученые научились сшивать мышиные хромосомы между собой

N+1
Детство и юность Людмилы Гурченко. О малоизвестных фактах из жизни великой актрисы рассказывают ее друзья детства Детство и юность Людмилы Гурченко. О малоизвестных фактах из жизни великой актрисы рассказывают ее друзья детства

Бесценные свидетельства тех, кто знал Людмилу Гурченко в детстве и юности

Коллекция. Караван историй
Что должно быть в машине: 25+ необходимых вещей Что должно быть в машине: 25+ необходимых вещей

Автомобиль не склад, однако множество вещей в нем возить необходимо

РБК
Керамика, мечи и украшения: в Германии найдены богатые могилы каменного века и раннего Средневековья Керамика, мечи и украшения: в Германии найдены богатые могилы каменного века и раннего Средневековья

Найденные сокровища говорят о долгой истории проживания людей у ​​реки Дунай

ТехИнсайдер
Два в одном: спортивный болид и электрокар в концепции Porsche Taycan Два в одном: спортивный болид и электрокар в концепции Porsche Taycan

Porsche Taycan принято считать первым электромобилем немецкого концерна Porsche

ТехИнсайдер
«Это недопустимо»: нейл-мастер рассказала о самой опасной ошибке при наращивании ногтей «Это недопустимо»: нейл-мастер рассказала о самой опасной ошибке при наращивании ногтей

«Самые кошмарные ногти, которые она когда-либо видела»

VOICE
«Лавка Болотова». Как металлург из Тулы стал поставщиком помидоров в White Rabbit, Selfie и рестораны Новикова «Лавка Болотова». Как металлург из Тулы стал поставщиком помидоров в White Rabbit, Selfie и рестораны Новикова

Можно ли бросить всё, сделать ставку на продажу овощей и выиграть?

Inc.
«У чёрта на куличках» — это где? Даем геолокацию «куличек», где обитал тот самый чëрт «У чёрта на куличках» — это где? Даем геолокацию «куличек», где обитал тот самый чëрт

«У черта на куличках» есть реальная историческая основа, и даже конкретное место

ТехИнсайдер
Что вы знаете о Лермонтове? 7 неожиданных фактов из жизни русского поэта Что вы знаете о Лермонтове? 7 неожиданных фактов из жизни русского поэта

7 неочевидных фактов о самом романтичном поэте своего времени

ТехИнсайдер
О чем на самом деле думают мужчины? Разбираемся, стоит ли это угадывать О чем на самом деле думают мужчины? Разбираемся, стоит ли это угадывать

Что ОН хотел этим сказать, о чем ОН думает, почему ОН так поступил

VOICE
Андрей Кончаловский: гид по творчеству живого классика (азбука «Правил жизни») Андрей Кончаловский: гид по творчеству живого классика (азбука «Правил жизни»)

Опорные пункты в творчестве мэтра Андрея Кончаловского

Правила жизни
3 главные загадки Древнего Египта, которые ученые до сих пор не могут раскрыть 3 главные загадки Древнего Египта, которые ученые до сих пор не могут раскрыть

Мы до сих пор очень мало знаем о загадочных египетских пирамидах

ТехИнсайдер
«Люди не хотят, чтобы ребенок попал в переплет»: как воспитывают мальчиков и девочек «Люди не хотят, чтобы ребенок попал в переплет»: как воспитывают мальчиков и девочек

Какие клише по воспитанию детей существуют в России?

Forbes
Давай голосом. Вспоминаем историю Siri — голосового помощника, который опередил Google, продался Apple и изменил жизни миллионов Давай голосом. Вспоминаем историю Siri — голосового помощника, который опередил Google, продался Apple и изменил жизни миллионов

Отрывок из книги «Harvard Business Review: 10 лучших статей»

Inc.
В космосе найдена В космосе найдена

Одна из самых «экстремальных» звезд Млечного Пути оказалась намного более жуткой

ТехИнсайдер
Как произвести замену двигателя и оформить ее в ПТС Как произвести замену двигателя и оформить ее в ПТС

Какие моменты нужно учесть при замене мотора?

РБК
Открыть в приложении