Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

6 главных финансовых ошибок, которые люди совершают с 30 до 40 лет 6 главных финансовых ошибок, которые люди совершают с 30 до 40 лет

О деньгах нужно заботиться в любом возрасте, но с 30 до 40 — особенно

Maxim
Как перекупщики обманывают водителей: что важно знать при ввозе машины Как перекупщики обманывают водителей: что важно знать при ввозе машины

Эксперты назвали риски при заказе автомобилей из-за границы у перекупщиков

РБК
6 признаков глупого человека 6 признаков глупого человека

Как понять, кого нужно избегать? Да и нужно ли на самом деле?

Psychologies
Яна Сексте: Яна Сексте:

Бомба замедленного действия — Яна Сексте

Караван историй
«В моем доме вечный беспорядок»: 5 шагов на пути к организации пространства «В моем доме вечный беспорядок»: 5 шагов на пути к организации пространства

Вы наводите порядок дома, но в конце недели вас снова окружает хаос?

Psychologies
Йога в самиздате, ритмическая гимнастика по ТВ и суперфуд в трехлитровой банке: каким был ЗОЖ в СССР Йога в самиздате, ритмическая гимнастика по ТВ и суперфуд в трехлитровой банке: каким был ЗОЖ в СССР

Думаете, повальное увлечение ЗОЖем — явление последних 10–15 лет? А вот и нет

Правила жизни
Хлебное место Хлебное место

Экспедиция на «буханке» в деревню, которой нет

Автопилот
Собрание сочинений Собрание сочинений

Светлый и изящный интерьер в стиле галерейного пространства

SALON-Interior
Как уроженец Сомали построил бизнес на корпоративных переводах с редких языков и заработал $32 млн за год Как уроженец Сомали построил бизнес на корпоративных переводах с редких языков и заработал $32 млн за год

Как Мохамед Хусейн разбогател на переводах?

Inc.
Павел Деревянко: «Девчонки считают меня привлекательным» Павел Деревянко: «Девчонки считают меня привлекательным»

Главный по волейболу Паша Деревянко рассказывает про популярность и деньги

Maxim
Идеальный плейлист для собак: эта музыка успокоит вашего пса в дорожном путешествии Идеальный плейлист для собак: эта музыка успокоит вашего пса в дорожном путешествии

Эта музыка поможет собаке расслабиться, когда она сидит взаперти в машине

TechInsider
Феномен незавершенных действий: что такое эффект Зейгарник и как довести все до конца Феномен незавершенных действий: что такое эффект Зейгарник и как довести все до конца

Мысли о незавершенных делах способны повысить тревожность

Forbes
Какие из российских яблок самые вкусные, надо ли чистить яблоки и еще 10 вопросов о главной фруктовой скрепе Какие из российских яблок самые вкусные, надо ли чистить яблоки и еще 10 вопросов о главной фруктовой скрепе

Такой привычный с детства фрукт, как яблоко, вопросов вроде бы не вызывает

Maxim
Как устроена система охлаждения двигателя: что должен знать каждый Как устроена система охлаждения двигателя: что должен знать каждый

Что нужно знать о системе охлаждения двигателя, чтобы авто работало исправно

РБК
Скорость взаимодействия ридберговских кубитов приблизили к фундаментальному пределу Скорость взаимодействия ридберговских кубитов приблизили к фундаментальному пределу

Японским физикам удалось добиться обмена энергией между кубитами

N+1
Екатерина Медичи: чему с детства училась «кровавая» французская королева Екатерина Медичи: чему с детства училась «кровавая» французская королева

Книга рассказывает о самой знаменитой королеве Франции, религиозной фанатичке

Forbes
Археологи обнаружили древнейшее просо Британии Археологи обнаружили древнейшее просо Британии

Это просо вырастили в Британии около 910–800 годов до нашей эры

N+1
Все совпадения неслучайны: 6 криминальных сериалов, основанных на реальных событиях Все совпадения неслучайны: 6 криминальных сериалов, основанных на реальных событиях

Криминальные сериалы, в основу которых легли реальные трагические истории

Forbes
Пауки могут спать и даже впадать в Пауки могут спать и даже впадать в

Возможно, пауки не просто отдыхают, но и видят сны

TechInsider
Роман Карстена Хенна «Служба доставки книг» Роман Карстена Хенна «Служба доставки книг»

Отрывок из трогательной и доброй истории «Служба доставки книг»

СНОБ
5 самых высокотехнологичных ограблений: тонкий расчет 5 самых высокотехнологичных ограблений: тонкий расчет

Много ли высокотехнологичных ограблений банка в реальном мире?

TechInsider
Только не голосовое: 5 золотых правил «цифрового» этикета Только не голосовое: 5 золотых правил «цифрового» этикета

Как общаться в мессенджерах, чтобы не прослыть навязчивым занудой

Psychologies
Как пить, чтобы похудеть Как пить, чтобы похудеть

Влияет ли употребление алкоголя на набор веса?

Maxim
По заветам матери Терезы: личная история волонтерства в Индии По заветам матери Терезы: личная история волонтерства в Индии

Волонтерство: пролететь полмира, чтобы бескорыстно помогать страдающим

Вокруг света
Почему всем нравится совершенно разная еда: оказалось, проблема в генетике Почему всем нравится совершенно разная еда: оказалось, проблема в генетике

Почему одним людям нравятся брокколи и улитки, а другим нет?

TechInsider
Как подключить ноутбук к монитору: провода необязательны Как подключить ноутбук к монитору: провода необязательны

Как легко подключить лэптоп к обычному монитору?

CHIP
Навязанные «удобства» Навязанные «удобства»

Без чего автомобиль может легко обойтись?

Автопилот
Люди сжульничали независимо от предыдущей победы или поражения Люди сжульничали независимо от предыдущей победы или поражения

От чего зависит жульничество в азартных играх?

N+1
Человечество может погибнуть при экстремальных вариантах изменения климата Человечество может погибнуть при экстремальных вариантах изменения климата

«Четырех всадника» климатического апокалипсиса

TechInsider
Переменчивая как погода Переменчивая как погода

Тося Чайкина шутит, что она уже никакой не фрешмен

OK!
Открыть в приложении