Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Бить или не бить: татуировщики – о трендах индустрии, выборе мастера и сведении рисунков Бить или не бить: татуировщики – о трендах индустрии, выборе мастера и сведении рисунков

Тату: правилах безопасности, стоимость и многое другое

GQ
Елена Яковлева: Елена Яковлева:

Я здесь абсолютно спокойно себя чувствую. Это мое место

Караван историй
Желаю всего самого лучшего Желаю всего самого лучшего

Что будет, если попробовать желать себе всего самого лучшего

Psychologies
Секс и репродукция будущего: мужские контрацептивы, искусственная матка и другие ноу-хау Секс и репродукция будущего: мужские контрацептивы, искусственная матка и другие ноу-хау

Технологические прорывы в области репродукции и контрацепции

СНОБ
Антагонизм полов: вопиющие примеры мужских манипуляций Антагонизм полов: вопиющие примеры мужских манипуляций

Так ли уж нужно биологам описывать природу в терминах семейного скандала

СНОБ
Готовится ли Тайвань к войне? Готовится ли Тайвань к войне?

Китаевед Андрей Дагаев — о том, как устроено тайваньское общество

Эксперт
Вопрос психологу: как научиться говорить «нет» Вопрос психологу: как научиться говорить «нет»

Как научиться говорить слово «нет» в нужные моменты без чувства вины

Правила жизни
Клеймо девочки: почему работа по дому ложится на плечи женщин Клеймо девочки: почему работа по дому ложится на плечи женщин

Отрывок из книги «Право на гнев» о разном обучении мальчиков и девочек

Forbes
Папины принцессы: чем живут и как выглядят скрытные дочери мировых политиков Папины принцессы: чем живут и как выглядят скрытные дочери мировых политиков

Теперь в башнях прячут наследниц современных политиков

VOICE
Истощение эго: почему мы устаем от принятия решений Истощение эго: почему мы устаем от принятия решений

Как мы принимаем решения и почему от этого так сильно устаем?

Psychologies
ДК Бондарев ДК Бондарев

Приглашаем на экскурсию в музей-квартиру художника Сергея Бондарева

Собака.ru
6 продуктов, которые категорически нельзя есть во время похудения 6 продуктов, которые категорически нельзя есть во время похудения

Пищевые ловушки здоровых продуктов

ТехИнсайдер
Бунт женских хромосом: трансгендерные лемминги и консервативные мухи Бунт женских хромосом: трансгендерные лемминги и консервативные мухи

Почему самцов и самок не всегда бывает поровну

СНОБ
«Жизнь по вызову»: каким получился новый сериал Сарика Андреасяна об эскорте в России «Жизнь по вызову»: каким получился новый сериал Сарика Андреасяна об эскорте в России

«Жизнь по вызову» — отставший от жизни проект о проституции

Forbes
Уровень воды в Ниле позволил египтянам подвозить камень к месту строительства пирамид Уровень воды в Ниле позволил египтянам подвозить камень к месту строительства пирамид

Как египтяне возводили пирамиды Гизы?

N+1
«Мы вам перезвоним» «Мы вам перезвоним»

9 причин, почему тебя не берут на работу и что с этим делать

Лиза
Если голуби перестанут трясти головой, они ослепнут! 5 удивительных фактов про голубей, о которых вы не догадывались Если голуби перестанут трясти головой, они ослепнут! 5 удивительных фактов про голубей, о которых вы не догадывались

Оказывается, голуби не так просты, как кажется!

ТехИнсайдер
Возьмем себя в руки Возьмем себя в руки

Мастер-класс «эрогенной анатомии»

Psychologies
Неочевидные детали, на которые нужно обратить внимание при покупке б/у смартфона Неочевидные детали, на которые нужно обратить внимание при покупке б/у смартфона

Как купить подержанный телефон и не облажаться

Maxim
Археологи нашли на новгородском Немецком дворе европейскую посуду и обувь Археологи нашли на новгородском Немецком дворе европейскую посуду и обувь

Руководитель экспедиции рассказал о находках, сделанных в слоях XIII–XIV веков

N+1
Какие привычные продукты богаты железом: рацион для укрепления иммунитета Какие привычные продукты богаты железом: рацион для укрепления иммунитета

Простые продукты, в которых много железа

ТехИнсайдер
10 вещей, которые нельзя делать с кошкой 10 вещей, которые нельзя делать с кошкой

10 вещей, которые могут навредить вашей кошке

Maxim
Как Cyberpunk 2077, но не лагает: во что поиграть еще, если тебе понравился шутер от CD Projekt RED Как Cyberpunk 2077, но не лагает: во что поиграть еще, если тебе понравился шутер от CD Projekt RED

Лучшие релизы о мрачном и технологически развитом будущем

Maxim
Как записать телефонный разговор на iPhone и Android Как записать телефонный разговор на iPhone и Android

Можно ли записать телефонный разговор на современном смартфоне?

CHIP
Как переоформить автомобиль разными способами Как переоформить автомобиль разными способами

Переоформление автомобиля: нормы закона и нюансы

РБК
Ловушка парентификации: как «стакан воды» превращается в травму на всю жизнь Ловушка парентификации: как «стакан воды» превращается в травму на всю жизнь

Нейропсихолог и психотерапевт Алена Ванченко — о травме парентификации

Forbes
«Развод в стиле кунг-фу»: женщина восстает против домашнего насилия «Развод в стиле кунг-фу»: женщина восстает против домашнего насилия

О том, как при помощи восточных единоборств противостоять мужу-насильнику

Forbes
Андрей Соколов: Андрей Соколов:

Все, что ты делаешь, все равно делаешь о себе в той или иной степени

Караван историй
Чужой ребенок Чужой ребенок

Воспитание чужих детей — тяжелое испытание для взрослого человека

СНОБ
Как избавиться от домашних клопов за один день: готовимся к сезону вредителей Как избавиться от домашних клопов за один день: готовимся к сезону вредителей

Как обезопасить свою постель от домашних клопов?

ТехИнсайдер
Открыть в приложении