Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как понять, что девушка кончила: полный гайд по женскому оргазму для мужчин Как понять, что девушка кончила: полный гайд по женскому оргазму для мужчин

Главные факты о женском оргазме и что стоит сделать, чтобы его достичь

Playboy
6 главных финансовых ошибок, которые люди совершают с 30 до 40 лет 6 главных финансовых ошибок, которые люди совершают с 30 до 40 лет

О деньгах нужно заботиться в любом возрасте, но с 30 до 40 — особенно

Maxim
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Как прием гормональных контрацептивов влияет на жизнь и психику женщин: ученые обозначили главные проблемы Как прием гормональных контрацептивов влияет на жизнь и психику женщин: ученые обозначили главные проблемы

Как синтетические гормоны влияют на женщин?

ТехИнсайдер
12 самых дорогих наборов LEGO 12 самых дорогих наборов LEGO

Коллекционные раритеты LEGO за бешеные деньги

Maxim
«Не было задачи стать звездой»: Евгения Медведева об отношении к себе и деньгам «Не было задачи стать звездой»: Евгения Медведева об отношении к себе и деньгам

Героиня нового выпуска «НеФорбсов» — фигуристка Евгения Медведева

Forbes
Карла Суарес: «Гавана, год нуля» Карла Суарес: «Гавана, год нуля»

Глава из романа «Гавана, год нуля» — о том, как можно отвлечься от ужаса вокруг

СНОБ
Как экономить при покупке пива — отвечает эксперт Как экономить при покупке пива — отвечает эксперт

Раскрываем секреты пивной экономии

Maxim
Как понять, что вы строите серьезные отношения не с тем человеком: 7 признаков Как понять, что вы строите серьезные отношения не с тем человеком: 7 признаков

Как понять, действительно ли это настоящая любовь?

Psychologies
Советский Хатико: чем закончилась история овчарки, встречавшей самолеты Советский Хатико: чем закончилась история овчарки, встречавшей самолеты

А ты знаешь, что в СССР был свой Хатико?

VOICE
Тип фигуры: как определить свой и как правильно подобрать гардероб Тип фигуры: как определить свой и как правильно подобрать гардероб

Как скрыть ненужное и подчеркнуть достоинства в соответствии с типом фигуры?

РБК
Как развить креативность: 14 любопытных способов Как развить креативность: 14 любопытных способов

Эти приемы могут повысить ваши творческие способности

Psychologies
X, Y и сексизм в науке X, Y и сексизм в науке

Как все устроить, чтобы мальчиков и девочек рождалось поровну

СНОБ
Не жук чихнул: почему знаменитости повально начали есть насекомых Не жук чихнул: почему знаменитости повально начали есть насекомых

Как диета из насекомых стала новым мировым трендом?

Правила жизни
Товарный знак на миллионы долларов в год: кто «изобрёл» смайлик и превратил его в финансовую империю Товарный знак на миллионы долларов в год: кто «изобрёл» смайлик и превратил его в финансовую империю

Как улыбающийся «эмоджи» прошёл через секс-революцию, рейвы и цифровизацию

VC.RU
5 захватывающих космических снимков 2022 года: что астрономы обнаружили в небе 5 захватывающих космических снимков 2022 года: что астрономы обнаружили в небе

Лучшие работы конкурса Astronomy Photographer of the Year 2022

ТехИнсайдер
История политических убийств: самые таинственные покушения на политиков История политических убийств: самые таинственные покушения на политиков

Практически все громкие политические убийства очень похожи друг на друга

Правила жизни
Чтение выходного дня: родство рока и рейва и история танцевальной музыки. Фрагмент книги «Вспышка энергии» Саймона Рейнольдса Чтение выходного дня: родство рока и рейва и история танцевальной музыки. Фрагмент книги «Вспышка энергии» Саймона Рейнольдса

Отрывок из книги «Вспышка энергии» о рейве и истории музыкального поколения

Правила жизни
Почему у Юпитера нет таких же колец, как у Сатурна? Или мы их просто не видим? Почему у Юпитера нет таких же колец, как у Сатурна? Или мы их просто не видим?

Почему у Юпитера нет великолепной обширной системы видимых колец?

ТехИнсайдер
Основатель Xsolla Александр Агапитов вложил более $2 млн в издателя NFT-игр OnlySpace Основатель Xsolla Александр Агапитов вложил более $2 млн в издателя NFT-игр OnlySpace

Александр Агапитов решил развивать NFT-гейминг

Forbes
Поэт и инвалид Поэт и инвалид

Игорь Гулин об Алике Ривине, эксцентрике и пророке блокады

Weekend
Самые яркие «Анны Каренины»: актрисы, которым пришлось броситься под поезд Самые яркие «Анны Каренины»: актрисы, которым пришлось броситься под поезд

Кто в истории кино играл Анну Каренину

VOICE
«С русским акцентом»: какой будет новая корпоративная культура после передела рынка «С русским акцентом»: какой будет новая корпоративная культура после передела рынка

Чего ждать старым сотрудникам? Как изменится корпоративная культура?

Forbes
Как убрать колонтитулы в Ворде: пошаговая инструкция для всех версий Как убрать колонтитулы в Ворде: пошаговая инструкция для всех версий

В этом материале мы пошагово опишем, как убрать колонтитулы в Ворде

CHIP
Николай Пирогов: за что святого доктора и отца-основателя военно-полевой хирургии отправили в ссылку? Николай Пирогов: за что святого доктора и отца-основателя военно-полевой хирургии отправили в ссылку?

Российский врач, ученый и педагог Николай Пирогов был фанатом своего дела

ТехИнсайдер
«Позорная стигма»: историк Михаил Майзульс о том, как в Средневековье помечали врагов «Позорная стигма»: историк Михаил Майзульс о том, как в Средневековье помечали врагов

Историк-медиевист Михаил Майзульс — как в Средние века использовали цвет

Forbes
Что такое Что такое

В Турции изобретен главный стоматологический тренд последних лет

VOICE
«Чахоточный шик. История красоты, моды и недуга». Как и почему туберкулез стал романтической болезнью «Чахоточный шик. История красоты, моды и недуга». Как и почему туберкулез стал романтической болезнью

Почему в XVIII–XIX веках чахотка была романтическим диагнозом

N+1
Потрясающие новые снимки Джеймса Уэбба: новорожденные звезды, сталкивающиеся галактики и горячие экзопланеты Потрясающие новые снимки Джеймса Уэбба: новорожденные звезды, сталкивающиеся галактики и горячие экзопланеты

Уэбб снял новые изображения галактик и туманность Киля

ТехИнсайдер
Ядерные испытания второй половины XX века и ядерный мистицизм Сальвадора Дали Ядерные испытания второй половины XX века и ядерный мистицизм Сальвадора Дали

Почему Сальвадор Дали променял Ленина на Гитлера и при чем тут Бог и атом

Правила жизни
Открыть в приложении