Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Что случилось с дворцами Романовых после революции 1917 года? Фото «До» и «После» Что случилось с дворцами Романовых после революции 1917 года? Фото «До» и «После»

Что стало с дворцами Романовых после прихода большевиков к власти?

ТехИнсайдер
7 милых и крайне опасных представителей мира животных 7 милых и крайне опасных представителей мира животных

Милые животные, встреча с которыми может быть смертельно опасна

ТехИнсайдер
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
Когда (не) поздно начать Когда (не) поздно начать

У желаний нет возраста

Psychologies
Как понять, что у партнера сексуальная зависимость? Как понять, что у партнера сексуальная зависимость?

Не оказался ли ваш партнер секс-зависимым?

Psychologies
Дочери Евы: генеалогию человечества по женской линии можно проследить до самой праматери Дочери Евы: генеалогию человечества по женской линии можно проследить до самой праматери

«Адам» и «Ева» — виртуальные точки, с которых человечество ведет родословную

ТехИнсайдер
Гид по косметологии: что делать в 20, 30, 40 и 50 лет Гид по косметологии: что делать в 20, 30, 40 и 50 лет

Зачем ходить к косметологу, если все устраивает и жалоб нет?

Psychologies
Люди + технологии = любовь. Как не терять связь даже на разных концах мира Люди + технологии = любовь. Как не терять связь даже на разных концах мира

Самые удивительные способы быть ближе даже сквозь расстояния

Правила жизни
Суперкомпьютер обработал колоссальный объем данных, чтобы получить фантастическое изображение сверхновой Суперкомпьютер обработал колоссальный объем данных, чтобы получить фантастическое изображение сверхновой

Исследователи обработали серию наблюдений получили невероятный снимок сверхновой

ТехИнсайдер
6 главных ошибок при заваривании чая, превращающих благородный напиток в яд 6 главных ошибок при заваривании чая, превращающих благородный напиток в яд

Может ли чай быть вреден для здоровья?

ТехИнсайдер
Технологии в помощь здоровому сну: современные и необычные гаджеты для повышения качества сна Технологии в помощь здоровому сну: современные и необычные гаджеты для повышения качества сна

Среди специалистов по сну активно обсуждается вред для сна от гаджетов

ТехИнсайдер
Не виноватая я: 3 главные вещи, которые запрещали женщинам в СССР Не виноватая я: 3 главные вещи, которые запрещали женщинам в СССР

Три главных запрета, которые действительно портили жизнь гражданкам СССР

Правила жизни
Не просто выбросить, а заработать Не просто выбросить, а заработать

5 выгодных способов избавиться от старой техники

Лиза
Не то, чем кажется: развеиваем 4 популярных мифа о российской экокосметике Не то, чем кажется: развеиваем 4 популярных мифа о российской экокосметике

Как выбрать по-настоящему безопасный и эффективный экопродукт

VOICE
Как создать финансовую подушку безопасности Как создать финансовую подушку безопасности

Как сформировать финансовую подушку, можно ли иногда изымать из нее средства?

Psychologies
Секрет куличков Секрет куличков

В мае оттуда доносился потрясающий хор прудовых лягушек

Наука и жизнь
«Слежка за бывшими приводит к зависимости»: как заняться своей жизнью «Слежка за бывшими приводит к зависимости»: как заняться своей жизнью

Как появляется зависимость от слежки за бывшим партнером?

Psychologies
Казанский аллигатор: история Алексея Суклетина, который ел школьниц и кормил их мясом соседей Казанский аллигатор: история Алексея Суклетина, который ел школьниц и кормил их мясом соседей

Впервые Алексей убил в шесть лет — он задушил котенка

VOICE
От Голды Меир до Индиры Ганди: как женщины становились премьер-министрами От Голды Меир до Индиры Ганди: как женщины становились премьер-министрами

Женщины, которые, несмотря на трудности, реализовали свои политические амбиции

Forbes
Бессмертие ей к лицу: почему после Бессмертие ей к лицу: почему после

Почему рухнула карьера Эшли Грин?

VOICE
Что такое социальный контракт, как получить выплаты, и на какие бесплатные плюшки ты имеешь право Что такое социальный контракт, как получить выплаты, и на какие бесплатные плюшки ты имеешь право

Многие путают социальный контракт с субсидиями, но это неправильно

VOICE
В Новгороде отыскали домонгольские фрески из Георгиевского собора В Новгороде отыскали домонгольские фрески из Георгиевского собора

Археологи обнаружили фрагменты фресок из Георгиевского собора

N+1
Конечность: выдающиеся руки выдающихся людей. Фотоистория Конечность: выдающиеся руки выдающихся людей. Фотоистория

Руки, которые сыграли 5 тысяч концертов и выкопали 150 тонн картофеля

Правила жизни
Как воспитать в ребенке внутреннюю свободу — советы Димы Зицера Как воспитать в ребенке внутреннюю свободу — советы Димы Зицера

Что делать, если у ребенка конфликт с учителем?

СНОБ
Физики добились субпикосекундного переключения бозе-конденсата при комнатной температуре Физики добились субпикосекундного переключения бозе-конденсата при комнатной температуре

Физики добились потенциального улучшения оптоэлектронных устройств

N+1
Биологи построили теорию происхождения сложных клеток, из которых построены высшие организмы, в том числе человек Биологи построили теорию происхождения сложных клеток, из которых построены высшие организмы, в том числе человек

Как возникают сложные клетки — эукариоты?

ТехИнсайдер
Как быстро и просто узнать возраст вашей кошки Как быстро и просто узнать возраст вашей кошки

Зубы, шерсть и вес — как выяснить, сколько лет кошке?

ТехИнсайдер
Зашла на час, потеряла день: почему мы впадаем в зависимость от игр Зашла на час, потеряла день: почему мы впадаем в зависимость от игр

Что заставляет нас тратить часы своей жизни на это бессмысленную игру три в ряд?

VOICE
Как не нужно делать: оказалось, что опытные Как не нужно делать: оказалось, что опытные

Опыт — не главный критерий, когда речь заходит об общении кошки и человека

ТехИнсайдер
Какими бывают токсичные отцы Какими бывают токсичные отцы

Основные особенности характера токсичных отцов

Psychologies
Открыть в приложении