Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Земля и небо Земля и небо

Интерьер в природных оттенках на тридцать шестом этаже московской новостройки

AD
5 новых русских романов, которые стоит прочитать 5 новых русских романов, которые стоит прочитать

Книги, которые дадут цельное представление о современной российской литературе

Maxim
6 способов защиты от болезни Альцгеймера 6 способов защиты от болезни Альцгеймера

Есть полезные привычки, которые помогут сохранить ясность ума

Psychologies
Игорь Мишин: «Онлайн-кинотеатры сегодня — индустрия, где формируются новые тенденции» Игорь Мишин: «Онлайн-кинотеатры сегодня — индустрия, где формируются новые тенденции»

О том, как создавался бренд KION, о работе со студиями и продвижении сериалов

Эксперт
7 цепляющих эротических триллеров, которые ты мог пропустить 7 цепляющих эротических триллеров, которые ты мог пропустить

Любовь и смерть идут рука об руку в этих фильмах

Maxim
Дорогие мои: 6 вещей, которые помогут выглядеть солидно Дорогие мои: 6 вещей, которые помогут выглядеть солидно

Что такое статусный гардероб? Шкаф, набитый брендовой одеждой?

Правила жизни
История одной вещи: духи «Красная Москва», символ советской парфюмерии История одной вещи: духи «Красная Москва», символ советской парфюмерии

Их цветочно-шипровый шлейф витал в театрах, ресторанах и универмагах

Правила жизни
Кто умнее: кошки или собаки? Кто умнее: кошки или собаки?

Учение измерили когнитивные способности кошек и собак

Maxim
Беги быстрее: как спорт превратился в социальный лифт и почему он не всегда работает Беги быстрее: как спорт превратился в социальный лифт и почему он не всегда работает

Почему в большом спорте одни добиваются успеха, а другие уносят с собой травмы

Forbes
В Южной Корее снова отредактировали собак. Теперь — чтобы укрепить лабрадорам бедра В Южной Корее снова отредактировали собак. Теперь — чтобы укрепить лабрадорам бедра

В Южной Корее родились два генетически модифицированных лабрадора

N+1
Имеет значение: чего боятся мужчины Имеет значение: чего боятся мужчины

Топ-3 списка мужских страхов и рекомендации специалиста

Psychologies
Неподходящий день для пончиков: как пятницы становятся нерабочими Неподходящий день для пончиков: как пятницы становятся нерабочими

Почему пустые офисы в последний рабочий день недели стали нормой

VC.RU
Физики заставили фотоны интерферировать с магнонами Физики заставили фотоны интерферировать с магнонами

Физики продемонстрировали квантовую интерференцию между различными волнами

N+1
10 лет в ВТО: что дало России членство в организации 10 лет в ВТО: что дало России членство в организации

Вступление России в ВТО более 10 лет назад не привело к значительным изменениям

Forbes
«Боли больше нет»: каким показан грядущий мир в триллере «Преступления будущего» «Боли больше нет»: каким показан грядущий мир в триллере «Преступления будущего»

«Преступления будущего» — триллер о безрадостном будущем человечества

Forbes
Когда голод превращается в раздражительность: 3 совета для контроля эмоций Когда голод превращается в раздражительность: 3 совета для контроля эмоций

Как телесные ощущения воздействуют на эмоции

Psychologies
История одной вещи: орешки со сгущенкой — один из самых любимых советских десертов История одной вещи: орешки со сгущенкой — один из самых любимых советских десертов

Рассказываем о орешках со сгущенкой из СССР и делимся рецептом

Правила жизни
Менеджеры паролей – кто остался на рынке? ТОП-5 решений. Выбираем лучшие программы, заменяющие стикер на мониторе Менеджеры паролей – кто остался на рынке? ТОП-5 решений. Выбираем лучшие программы, заменяющие стикер на мониторе

Чем проще пароль, тем легче его подобрать, а чем сложнее – тем легче забыть

Цифровой океан
Какова вероятность погибнуть от космического мусора? Какова вероятность погибнуть от космического мусора?

Знаешь ли ты, что нам на голову постоянно из космоса что-то валится?

Maxim
Исследование показало, какую сексуальную практику предпочитают устойчивые пары Исследование показало, какую сексуальную практику предпочитают устойчивые пары

Секс втроем положительно сказывается на моногамных отношениях

Psychologies
Поворот сюжета Поворот сюжета

История лесничего Ивана Рейнмана

Дилетант
Нехватка дупел в австралийском заповеднике вынудила геккона поселиться в гнезде поссумов Нехватка дупел в австралийском заповеднике вынудила геккона поселиться в гнезде поссумов

Геккон поселился в одном гнездовом ящике с семейством тонкохвостых поссумов

N+1
Почему твоя белая рубашка Почему твоя белая рубашка

Почему белая рубашка не смотрится на тебе и портит все аутфиты? Разбираемся!

VOICE
Как не нужно заниматься фитнесом: 10 ошибок, которые делает каждый второй во время тренировок Как не нужно заниматься фитнесом: 10 ошибок, которые делает каждый второй во время тренировок

Эти ошибки популярны среди тех, кто только начинает заниматься спортом

ТехИнсайдер
Законы социальных систем: что общего у семьи и рабочего коллектива? Законы социальных систем: что общего у семьи и рабочего коллектива?

Что объединяет новоиспеченного мужа и только что принятого на работу сотрудника?

Psychologies
5 животных, которых мы считаем безобидными, но их стоит бояться 5 животных, которых мы считаем безобидными, но их стоит бояться

Безобидные существа, от которых на самом деле стоит держаться подальше

ТехИнсайдер
Синдром «drama queen». Почему мы переоцениваем важность эмоций и как победить зависимость от собственных чувств Синдром «drama queen». Почему мы переоцениваем важность эмоций и как победить зависимость от собственных чувств

Отрывок из книги «Дневник пофигиста. Тонкое искусство пофигизма на практике»

Inc.
Александра Белякова: «Варианта не быть богатой не было» Александра Белякова: «Варианта не быть богатой не было»

Как Александра Белякова сочетает карьеру певицы и бизнес-коуча

ЖАРА Magazine
Исторический горизонт технократизма Исторический горизонт технократизма

Каким русский космизм видел гуманистический научно-технический прогресс?

Эксперт
Какая самая высокая температура в известной Вселенной и можно ли ее достичь? Какая самая высокая температура в известной Вселенной и можно ли ее достичь?

Удастся ли нам нагреть на Земле вещество до самой высокой температуры?

ТехИнсайдер
Открыть в приложении