Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как выбрать TWS-наушники: 6 важных критериев Как выбрать TWS-наушники: 6 важных критериев

К выбору TWS-наушников стоит подойти максимально серьезно

CHIP
«Создательница ангелов»: история Хильды Нильссон, которая убивала детей «Создательница ангелов»: история Хильды Нильссон, которая убивала детей

«Создательница ангелов с улицы Брюкс» — самая известная в Швеции серийная убийца

VOICE
6 способов защиты от болезни Альцгеймера 6 способов защиты от болезни Альцгеймера

Есть полезные привычки, которые помогут сохранить ясность ума

Psychologies
Топ-10 лучших вариантов осеннего маникюра с акцентом: ты должна их попробовать! Топ-10 лучших вариантов осеннего маникюра с акцентом: ты должна их попробовать!

Маникюр с акцентом на один-два ногтя

VOICE
Как переоформить автомобиль разными способами Как переоформить автомобиль разными способами

Переоформление автомобиля: нормы закона и нюансы

РБК
Ресторатор Борис Зарьков — о японской муке, машине и The World's 50 Best Ресторатор Борис Зарьков — о японской муке, машине и The World's 50 Best

Ресторатором Борисом Зарьковым — о насмотренности, любви к Японии и планах

РБК
Суперкомпьютер обработал колоссальный объем данных, чтобы получить фантастическое изображение сверхновой Суперкомпьютер обработал колоссальный объем данных, чтобы получить фантастическое изображение сверхновой

Исследователи обработали серию наблюдений получили невероятный снимок сверхновой

ТехИнсайдер
Температура в холодильнике: какой она должна быть и как её регулировать Температура в холодильнике: какой она должна быть и как её регулировать

Как настроить оптимальную температуру в холодильнике

CHIP
Здоровое тело: 10 привычек стройных людей, о которых всегда нужно помнить Здоровое тело: 10 привычек стройных людей, о которых всегда нужно помнить

Стройность — это образ жизни! И ему вполне можно научиться

ТехИнсайдер
Как переживал начало Второй мировой войны ювелирный дом Cartier Как переживал начало Второй мировой войны ювелирный дом Cartier

Отрывок из книги об одном из самых известных ювелирных домов в мире

СНОБ
Рагим Джафаров: «Марк и Эзра. 2.0». Отрывок из романа Рагим Джафаров: «Марк и Эзра. 2.0». Отрывок из романа

Отрывок из фантастического и остросюжетного романа «Марк и Эзра. 2.0»

СНОБ
Улика — царица доказательств Улика — царица доказательств

Как расследование преступлений стало искусством

Weekend
«Боли больше нет»: каким показан грядущий мир в триллере «Преступления будущего» «Боли больше нет»: каким показан грядущий мир в триллере «Преступления будущего»

«Преступления будущего» — триллер о безрадостном будущем человечества

Forbes
Светочувствительные метки сделали бумажную книгу интерактивной Светочувствительные метки сделали бумажную книгу интерактивной

Интерактивная книга, которая максимально приближена к обычной бумажной книге

N+1
Парад гигантов: Кролик размером с человека, конь — со слона и еще троица аномально огромных животных Парад гигантов: Кролик размером с человека, конь — со слона и еще троица аномально огромных животных

Эти звери не догадываются, что занимают почетное место в Книге рекордов Гиннеса

ТехИнсайдер
10 вещей, которые нельзя делать с кошкой 10 вещей, которые нельзя делать с кошкой

10 вещей, которые могут навредить вашей кошке

Maxim
Формула успеха Формула успеха

Эти 10 привычек улучшат твое финансовое положение

Лиза
Катерина Сильванова, Елена Малисова: «О чем молчит Ласточка». Продолжение бестселлера «Лето в пионерском галстуке» Катерина Сильванова, Елена Малисова: «О чем молчит Ласточка». Продолжение бестселлера «Лето в пионерском галстуке»

Глава из книги «О чем молчит Ласточка» — о рефлексии юношеской любви

СНОБ
Кто умнее: кошки или собаки? Кто умнее: кошки или собаки?

Учение измерили когнитивные способности кошек и собак

Maxim
Позитивный пиар при небольших инвестициях: почему бренды поддерживают женский спорт Позитивный пиар при небольших инвестициях: почему бренды поддерживают женский спорт

Женский спорт созрел для серьезной монетизации

Forbes
Считавшуюся вымершей магнолию с Гаити переоткрыли спустя 97 лет Считавшуюся вымершей магнолию с Гаити переоткрыли спустя 97 лет

Небольшая популяция магнолий пережила вырубку лесов в горном ущелье

N+1
Саранский маньяк: история Дмитрия Балакина, который душил женщин их же одеждой Саранский маньяк: история Дмитрия Балакина, который душил женщин их же одеждой

«По характеру я добрый и мягкий», — так описывает себя саранский маньяк

VOICE
Как спланировать бюджет на месяц, чтобы сэкономить и заработать на мечту Как спланировать бюджет на месяц, чтобы сэкономить и заработать на мечту

Чтобы сэкономить на ненужных тратах и заработать больше, нужно составить бюджет

ТехИнсайдер
Слишком консервативен: какими получились рассказы Владимира Сорокина о женщинах Слишком консервативен: какими получились рассказы Владимира Сорокина о женщинах

Владимир Сорокин о женщинах — стереотипно и мизогинно

Forbes
«Человек не имеет значения ни для кого, кроме самого себя» «Человек не имеет значения ни для кого, кроме самого себя»

Говард Лавкрафт о том, что по-настоящему ужасно

Weekend
Групповые процессы вместо культа индивидуализма: почему сейчас «я» меняется на «мы» Групповые процессы вместо культа индивидуализма: почему сейчас «я» меняется на «мы»

Почему вдруг важными становятся групповые процессы, а не индивидуальность?

Psychologies
Почему современные животные не бывают такими огромными, как динозавры? Почему современные животные не бывают такими огромными, как динозавры?

Могут ли возникнуть животные, в сравнении с которыми покажутся карликами слоны?

ТехИнсайдер
Невидим, свободен... Невидим, свободен...

Теоретики рассматривали двумерные структуры на основе углерода ещё в XX веке

Наука и жизнь
«Слежка за бывшими приводит к зависимости»: как заняться своей жизнью «Слежка за бывшими приводит к зависимости»: как заняться своей жизнью

Как появляется зависимость от слежки за бывшим партнером?

Psychologies
Найти свою зону ближайшего развития и изменить жизнь Найти свою зону ближайшего развития и изменить жизнь

Зона ближайшего развития — работает ли это понятие для взрослых?

Psychologies
Открыть в приложении