Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Какими были валютные магазины «Березка» в СССР Какими были валютные магазины «Березка» в СССР

Что за магазины «Березка» были в СССР

Forbes
Маркировка полезности продуктов помешала производителю ввести европейцев в заблуждение Маркировка полезности продуктов помешала производителю ввести европейцев в заблуждение

Как меняется представление покупателей о вреде или пользе продукта

N+1
Желаю всего самого лучшего Желаю всего самого лучшего

Что будет, если попробовать желать себе всего самого лучшего

Psychologies
Инсулиновая помпа восстановила структуру мозга у подростков-диабетиков Инсулиновая помпа восстановила структуру мозга у подростков-диабетиков

Как разные способы введения инсулина влияют на мозг подростков с диабетом

N+1
Студент Эйнштейн Студент Эйнштейн

Путь Эйнштейна в науку был совсем не таким прямым и естественным

Наука и жизнь
Гонки с Чикатило: история Александра Пичушкина, который мечтал стать самым известным маньяком в СССР Гонки с Чикатило: история Александра Пичушкина, который мечтал стать самым известным маньяком в СССР

Битцевский маньяк собирался довести число своих жертв до 64

VOICE
10 научных фактов о фильме «День независимости» 10 научных фактов о фильме «День независимости»

Кинофильм, запрещенный на планетах, где нет чувства юмора

Maxim
После людей После людей

Призраки прошлого служат наглядным напоминанием об ошибках человечества

Вокруг света
Из-за чего судятся акционеры одной из самых популярных франшиз «Мозгобойня» Из-за чего судятся акционеры одной из самых популярных франшиз «Мозгобойня»

Почему сеть паб-квизов «Мозгобойня» раздирает корпоративный конфликт

Forbes
5 загадочных массовых заболеваний, которым не нашли объяснения до сих пор 5 загадочных массовых заболеваний, которым не нашли объяснения до сих пор

Семь случаев эпидемий, вызванных массовой истерией

ТехИнсайдер
Не только «Брат-2»: самые скрепные отечественные фильмы про русских за границей Не только «Брат-2»: самые скрепные отечественные фильмы про русских за границей

Как советские и российские режиссеры видели соотечественников за границей?

Maxim
Чем страдал Ван Гог, от чего, скорее всего, умер и как это сказалось на его картинах Чем страдал Ван Гог, от чего, скорее всего, умер и как это сказалось на его картинах

Какая история стояла за картиной «Прогулка заключенных» Ван Гога?

Правила жизни
Онлайн-конфигураторы ПК: выбираем лучший Онлайн-конфигураторы ПК: выбираем лучший

У каждого крупного ритейлера есть собственный конфигуратор ПК

CHIP
Убийцы Барби и Кен: как молодые супруги стали главными маньяками Канады Убийцы Барби и Кен: как молодые супруги стали главными маньяками Канады

Они годами вселяли страх в молодых женщин и девочек пригорода Торонто

VOICE
Все совпадения неслучайны: 6 криминальных сериалов, основанных на реальных событиях Все совпадения неслучайны: 6 криминальных сериалов, основанных на реальных событиях

Криминальные сериалы, в основу которых легли реальные трагические истории

Forbes
Греть предметы, а не воздух: в чем особенность инфракрасных обогревателей Греть предметы, а не воздух: в чем особенность инфракрасных обогревателей

Какой обогреватель лучше — инфракрасный или конвекционный?

CHIP
Что хорошего и что плохого в сериалах по «Звездным войнам»? Обсуждаем и критикуем проекты Disney+ Что хорошего и что плохого в сериалах по «Звездным войнам»? Обсуждаем и критикуем проекты Disney+

Разбираемся, за что стоит похвалить Disney+, а за что — покритиковать

Правила жизни
Ядовитые реки, отравленные моря Ядовитые реки, отравленные моря

Катастрофы, угрожающие живым организмам, происходят довольно часто

Наука и жизнь
«Любимый ребенок Компартии»: как TikTok связан с провластными СМИ Китая «Любимый ребенок Компартии»: как TikTok связан с провластными СМИ Китая

Коммунистическая партия, провластные СМИ и TikTok

Forbes
Когда (не) поздно начать Когда (не) поздно начать

У желаний нет возраста

Psychologies
Хайп мирового масштаба от исследователя NASA. Кто придумал нейросеть Midjourney и отберет ли она работу у живых художников и дизайнеров? Хайп мирового масштаба от исследователя NASA. Кто придумал нейросеть Midjourney и отберет ли она работу у живых художников и дизайнеров?

Может ли машина заменить живых дизайнеров? История нейросети Midjourney

Inc.
Хочется пожить для себя Хочется пожить для себя

Почему людей в зрелом возрасте так часто тянет на авантюры

Лиза
Хрупкое мужское эго Хрупкое мужское эго

Почему сегодня вокруг стало так много мужчин-истеричек

Лиза
Битва за Гран-Чако Битва за Гран-Чако

Война марок между Боливией и Парагваем

Дилетант
Время пить из самовара: как и зачем выбирать водогрейную машину в XXI веке Время пить из самовара: как и зачем выбирать водогрейную машину в XXI веке

Есть ли у тебя самовар, товарищ? Нет? Напрасно!

Maxim
«Облачно, возможны косатки». Морской биолог рассказывает, как они живут и общаются между собой «Облачно, возможны косатки». Морской биолог рассказывает, как они живут и общаются между собой

Отрывок из книги «Облачно, возможны косатки» — как косатки видят и слышат

N+1
5 новых русских романов, которые стоит прочитать 5 новых русских романов, которые стоит прочитать

Книги, которые дадут цельное представление о современной российской литературе

Maxim
Везучие! При этом типе старения лица не страшен набор веса — всё равно будешь выглядеть моложе сверстниц Везучие! При этом типе старения лица не страшен набор веса — всё равно будешь выглядеть моложе сверстниц

Возрастные изменения — очень коварный процесс

VOICE
Легко сказать: 9 простых (на деле — не очень) правил, которые помогут стать здоровее и счастливее Легко сказать: 9 простых (на деле — не очень) правил, которые помогут стать здоровее и счастливее

Советы, которые помогут понять: жизнь лучше, чем кажется

Правила жизни
У живой клетки взяли половину цитоплазмы и секвенировали ее транскриптом У живой клетки взяли половину цитоплазмы и секвенировали ее транскриптом

Метод, позволяющий расшифровать транскриптом отдельных клеток, не убивая их

N+1
Открыть в приложении