Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Без паники Без паники

Как бороться с тревожностью, которая мешает жить

Лиза
5 картин, иллюстрирующих эпоху неопределенности — время, в котором мы все живем сегодня 5 картин, иллюстрирующих эпоху неопределенности — время, в котором мы все живем сегодня

Пять художников и иллюстраторов изобразили, как представляют неопределенность

Правила жизни
Желаю всего самого лучшего Желаю всего самого лучшего

Что будет, если попробовать желать себе всего самого лучшего

Psychologies
Гид по метаверсу от Покраса Гид по метаверсу от Покраса

Покрас Лампас — о метаверсе, метаценностях и метамодернизме

Собака.ru
9 причин, почему современные автомобили хуже тех, что выпускали в 90-е и 2000-е 9 причин, почему современные автомобили хуже тех, что выпускали в 90-е и 2000-е

За плюсы современных машин мы заплатили сторицей

Maxim
Как «дьявольский» манускрипт XVII века пришлось расшифровывать с помощью DarkNet Как «дьявольский» манускрипт XVII века пришлось расшифровывать с помощью DarkNet

Расшифровка «сатанинской» рукописи XVII века, которой больше 300 лет

ТехИнсайдер
Букеровский лауреат Джордж Сондерс — о рассказе Льва Толстого «Хозяин и работник». Фрагмент книги «Купание в пруду под дождем» Букеровский лауреат Джордж Сондерс — о рассказе Льва Толстого «Хозяин и работник». Фрагмент книги «Купание в пруду под дождем»

Фрагмент книги, посвященный рассказу Льва Толстого «Хозяин и работник»

Правила жизни
Финансовая сепарация: что делать, если женщина материально зависит от мужа Финансовая сепарация: что делать, если женщина материально зависит от мужа

Как бороться с финансовой зависимостью в отношениях?

Psychologies
Почему с синдромами самозванца, перфекциониста и другими «спецэффектами» не надо бороться? Почему с синдромами самозванца, перфекциониста и другими «спецэффектами» не надо бороться?

А что, если мы научимся использовать синдром самозванца себе во благо?

Psychologies
Стесняюсь спросить: почему женщинам бывает тяжело достичь оргазма с партнером? Стесняюсь спросить: почему женщинам бывает тяжело достичь оргазма с партнером?

Что делать, если оргазм не наступает без подручных средств?

Правила жизни
Генотерапия вернула слух мышам Генотерапия вернула слух мышам

Ученые разработали препарат, который вернул мышам слух

N+1
Правила жизни Салмана Рушди Правила жизни Салмана Рушди

Правила жизни романиста Салмана Рушди

Правила жизни
Ремни и вискоза под запретом: эти платья ни в коем случае нельзя брать в отпуск! Ремни и вискоза под запретом: эти платья ни в коем случае нельзя брать в отпуск!

Не все, что ты носишь летом, подойдет для пляжного отдыха!

VOICE
Какие привычные продукты богаты железом: рацион для укрепления иммунитета Какие привычные продукты богаты железом: рацион для укрепления иммунитета

Простые продукты, в которых много железа

ТехИнсайдер
Самые сложные ударения из ЕГЭ: 10 слов, в которых ошибаются не только школьники Самые сложные ударения из ЕГЭ: 10 слов, в которых ошибаются не только школьники

Разбираем самые популярные ударения из тестов ЕГЭ

ТехИнсайдер
Отпуск без обязательств: что такое экспресс-путешествия и почему они набирают популярность в России Отпуск без обязательств: что такое экспресс-путешествия и почему они набирают популярность в России

Как спонтанные поездки ворвались в нашу жизнь, потеснив привычные путешествия

Вокруг света
Парад гигантов: Кролик размером с человека, конь — со слона и еще троица аномально огромных животных Парад гигантов: Кролик размером с человека, конь — со слона и еще троица аномально огромных животных

Эти звери не догадываются, что занимают почетное место в Книге рекордов Гиннеса

ТехИнсайдер
Формируем полезные привычки: 3 лайфхака Формируем полезные привычки: 3 лайфхака

Как без лишних усилий развить и закрепить желаемое поведение

Psychologies
Люди + технологии = любовь. Как не терять связь даже на разных концах мира Люди + технологии = любовь. Как не терять связь даже на разных концах мира

Самые удивительные способы быть ближе даже сквозь расстояния

Правила жизни
8 забавных фактов о полицейских собаках 8 забавных фактов о полицейских собаках

А ты знал, что в Штатах у собак есть офицерские звания?

Maxim
Чем противобуксовочная система отличается от ESP: факты, которые удивят даже опытных автовладельцев Чем противобуксовочная система отличается от ESP: факты, которые удивят даже опытных автовладельцев

Разбираемся в системах активной безопасности авто

ТехИнсайдер
Я теряю кости: как бороться с опасным заболеванием, которое разрушает скелет Я теряю кости: как бороться с опасным заболеванием, которое разрушает скелет

Остеопороз в медицине определяется как нарушение микроструктуры кости

ТехИнсайдер
По законам геометрии По законам геометрии

Оригинальная кровля делает неповторимым внешний облик этого частного владения

SALON-Interior
Как вычислить плохого мастера по наращиванию ресниц: главные признаки- Как вычислить плохого мастера по наращиванию ресниц: главные признаки-

Определить плохого лашмейкера не так-то просто, однако эти "маяки" помогут

VOICE
8 признаков здорового нарциссизма, которые ведут к успеху 8 признаков здорового нарциссизма, которые ведут к успеху

Здоровый нарциссизм, который способствует личностному росту

Psychologies
Хайп мирового масштаба от исследователя NASA. Кто придумал нейросеть Midjourney и отберет ли она работу у живых художников и дизайнеров? Хайп мирового масштаба от исследователя NASA. Кто придумал нейросеть Midjourney и отберет ли она работу у живых художников и дизайнеров?

Может ли машина заменить живых дизайнеров? История нейросети Midjourney

Inc.
Соберись, тряпка: как создать успешный и социально значимый бизнес на ненужных вещах Соберись, тряпка: как создать успешный и социально значимый бизнес на ненужных вещах

Из старой одежды можно сделать не только ветошь, но и синтетическое топливо

Forbes
8 программ для записи видео с экрана ноутбука 8 программ для записи видео с экрана ноутбука

Самые подходящие программы для записи видео с экрана компьютера

CHIP
Умерли в один день: история арабской принцессы, казненной в 1977 году вместе с возлюбленным Умерли в один день: история арабской принцессы, казненной в 1977 году вместе с возлюбленным

В реальности история принцессы "Жасмин" была совсем другой

VOICE
Призрачный успех: почему российскому бизнесу сложно покорить китайский рынок Призрачный успех: почему российскому бизнесу сложно покорить китайский рынок

Как оценивать потенциально новый рынок Китая?

Forbes
Открыть в приложении