Как и зачем исследовать логику нейросетей

N+1Hi-Tech

Внимание, черный ящик. Как и зачем исследовать логику нейросетей

Как и зачем исследовать логику нейросетей

Григорий Копиев

Прогресс в машинном обучении, достигнутый за последнее десятилетие, подарил нам как множество новых возможностей, так и неочевидные проблемы: модели машинного обучения стали настолько сложными и большими, что понять логику их действий все труднее. Вместе с Yandex Research, который проводит исследования машинного обучения мирового уровня, рассказываем, как разработчики изучают современные ML-алгоритмы — и почему это стоит делать, даже если они работают хорошо.

Начало обучения

Нейросети на слуху последние несколько лет. Может показаться, что это новый тип алгоритмов. Отчасти так оно и есть: многие архитектуры нейросетей, успевшие стать классическими, появились лишь несколько лет назад. Но идея повторить в машине принцип работы нейронных сетей была реализована на самой заре машинного обучения.

В конце 1950-х годов Фрэнк Розенблатт описал и реализовал «в железе» перцептрон — простейшую архитектуру искусственных нейросетей, которая заложила основу для современных нейросетей (а многослойные перцептроны широко применяются до сих пор).

Розенблатт показал работу перцептрона, обучив его распознавать знаки и символы, что для 1958 года было серьезным успехом. Но, пожалуй, главное достижение и следствие этого заключалось в укреплении идеи, что для создания машины инженеру не нужно вручную прописывать набор правил — они могут родиться сами в виде весов во время обучения.

В дальнейшем ученые придумывали все новые и новые архитектуры моделей машинного обучения, причем не только нейросетевые. И хотя математические операции внутри моделей по отдельности оставались понятными, их количество и взаимное влияние усложняло анализ работы алгоритмов.

Старший исследователь Yandex Research Андрей Малинин объясняет: «Представьте огромный часовой механизм размером с небоскреб, внутри которого крутятся миллиарды шестеренок размером в ноготь — все красиво крутится, но ничего не понятно. Мы можем посмотреть на какой-то локальный кусочек с парой шестеренок, и вроде ясно, как в нем все работает, но неясно, как это встраивается в механизм в целом».

Современная эра

В 2012 году в развитии машинного обучения наметился прорыв, связанный с нейросетью AlexNet. Это сверточная нейросеть для классификации изображений из датасета ImageNet, в котором содержится более 15 миллионов изображений объектов, разбитых на 22 тысячи категорий. Задача бенчмарка ImageNet — определить класс объекта на фотографии. AlexNet удалось выиграть соревнования ImageNet 2012 года, причем с большим отрывом от ближайшего конкурента: частота ошибок при определении пяти самых вероятных объектов составила 15,3 процента против 26,2 у алгоритма со второго места.

Такой успех можно объяснить несколькими причинами. Во-первых, разработчики улучшили архитектуру нейросети, использовав в качестве функции активации редкую для того времени и повсеместно применяемую сейчас ReLU. Во-вторых, хотя это была большая нейросеть, состоявшая из 650 тысяч нейронов и имевшая 60 миллионов параметров, разработчики нашли способ ускорить ее обучение. Они сумели распараллелить обучение сети на два графических процессора. Это была не первая работа, в которой нейросети предлагали обучать на графических процессорах, но, вероятно, первый заметный пример, который показал другим исследователям, что ограничения по вычислительной мощности, сдерживавшие развитие этой области, можно обойти. А значит, размеры моделей и обучающих датасетов можно смело увеличивать.

Спустя шесть лет исследователи из OpenAI проанализировали ключевые работы в области нейросетей и показали, что именно с AlexNet в 2012 году начался рост затрачиваемой на обучение вычислительной мощности. Если раньше она удваивалась каждые два года, следуя закону Мура, то с 2012 года удвоение происходило уже каждые 3–4 месяца. Благодаря такой четкой временной границе OpenAI предложила называть период после 2012 года «современной эрой».

Рост объема вычислений, проводимых при обучении моделей машинного обучения. На графике можно увидеть резкую смену тренда в 2012 году — начало «современной эры». OpenAI

Вместе с увеличением размера нейросетей менялись и подходы к обучению. Стало набирать популярность обучение без учителя на неразмеченных данных.

Хороший пример такого подхода — нейросети GPT, разработанные в OpenAI. Это модели генерации текста, задача которых сводится к предсказанию следующего слова в предложении. Это позволяет писать большие тексты, которые выглядят как результат работы человека, а не машины. Разработчики GPT решили уйти от обучения на ограниченных датасетах с размеченными текстами к самообучению на гигантском объеме самых разных текстов из интернета: GPT-3 обучили на 570 гигабайт текстов. Это позволило модели выучить структуру языка, после чего ее можно быстро дообучить для конкретной задачи, например генерации стихов в стиле любимого поэта, показав всего несколько примеров, а не собирая новый большой датасет.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

4 вредные привычки, которые, как подтверждают исследования, медленно разрушают здоровье 4 вредные привычки, которые, как подтверждают исследования, медленно разрушают здоровье

Привычки, которые могут стать смертельными, если их не контролировать

Inc.
Настоящие «убийцы Tesla». Как китайцы из BYD захватывают мир Настоящие «убийцы Tesla». Как китайцы из BYD захватывают мир

BYD: от батареек до крупнейшего на планете производителя электромобилей

РБК
11 способов становиться немного умнее каждый день 11 способов становиться немного умнее каждый день

Интеллект, как и тело, требует правильного питания и регулярных тренировок

Psychologies
7 российских брендов, которые используют традиционные элементы в дизайне одежды 7 российских брендов, которые используют традиционные элементы в дизайне одежды

Российские бренды, вдохновленные сказками и историей

СНОБ
Зачем Приштина усиливает давление на Белград Зачем Приштина усиливает давление на Белград

Приштина нацелена окончательно решить косовский вопрос в свою пользу

Эксперт
Жители эллинистической Береники разнообразно использовали ракушки от съеденных моллюсков Жители эллинистической Береники разнообразно использовали ракушки от съеденных моллюсков

Морские ресурсы играли важную роль в жизни эллинистической Береники

N+1
Температура в холодильнике: какой она должна быть и как её регулировать Температура в холодильнике: какой она должна быть и как её регулировать

Как настроить оптимальную температуру в холодильнике

CHIP
8 упражнений на растяжку, которые облегчат боль в спине 8 упражнений на растяжку, которые облегчат боль в спине

Наш спасительный фитнес для вашей спины

Лиза
Мини-биржа: как сервис выходцев из «Сбера» стал игроком №2 на рынке краудлендинга Мини-биржа: как сервис выходцев из «Сбера» стал игроком №2 на рынке краудлендинга

Cервис JetLend: как он увеличил свои показатели в три раза?

Forbes
Просто уходило лето Просто уходило лето

Как вернуть силы и восстановиться после отпуска?

Лиза
Очищение крови Очищение крови

Рассказываем, как убрать из крови (а значит, и из всего организма) все лишнее

Лиза
Как включить клавиатуру на ноутбуке: все проще, чем кажется Как включить клавиатуру на ноутбуке: все проще, чем кажется

Рассказываем о том, как включить клавиатуру на ноутбуке несколькими способами

CHIP
От горячего шоколада до спелой сливы: 7 классных вариантов маникюра для подготовки к осени От горячего шоколада до спелой сливы: 7 классных вариантов маникюра для подготовки к осени

Подборка нейл-дизайнов в самых трендовых оттенках осени

VOICE
Что делает мужчину сексуальным: 11 возбуждающих качеств Что делает мужчину сексуальным: 11 возбуждающих качеств

«Что ты замечаешь в мужчине в первую очередь?»

Psychologies
Рассказать о старости Рассказать о старости

Нужно ли рассказывать детям и подросткам о старости?

СНОБ
Реально ли выучить английский после 40? Проверим, на что способна ваша память Реально ли выучить английский после 40? Проверим, на что способна ваша память

Существует миф, что иностранные языки лучше учить в юности

ТехИнсайдер
Ниоткуда, с любовью Ниоткуда, с любовью

SUV как повод к ресентименту

Автопилот
Хабаровский музыкант МА ГАК ПА — о новом альбоме «V», любви к хокку и пути к успеху вдали от Москвы Хабаровский музыкант МА ГАК ПА — о новом альбоме «V», любви к хокку и пути к успеху вдали от Москвы

МА ГАК ПА — как живут дальневосточные музыканты

СНОБ
Зерно требует тонкой настройки Зерно требует тонкой настройки

Большой урожай в России при слабом экспорте обрушил цены на зерно внутри страны

Эксперт
AMOLED-дисплеи в смартфонах: плюсы и минусы AMOLED-дисплеи в смартфонах: плюсы и минусы

Разбираемся в том, что такое AMOLED-экран в смартфоне

CHIP
Как жара влияет на организм Как жара влияет на организм

Врач объяснил, что происходит с нашим телом под воздействием высокой температуры

Psychologies
Японские шары счастья Японские шары счастья

Шар темари — драгоценный подарок, символизирующий дружбу и верность

Наука и жизнь
Только не голосовое: 5 золотых правил «цифрового» этикета Только не голосовое: 5 золотых правил «цифрового» этикета

Как общаться в мессенджерах, чтобы не прослыть навязчивым занудой

Psychologies
Было навсегда, пока не кончилось: как равенство и инклюзия меняют продукты и компании Было навсегда, пока не кончилось: как равенство и инклюзия меняют продукты и компании

Как крупные компании изменились из-за политики DEI

Forbes
«Не то башня, не то труба»: почему реставрация дома Мельникова затянулась на 16 лет «Не то башня, не то труба»: почему реставрация дома Мельникова затянулась на 16 лет

Долгая история создания музея Константина и Виктора Мельниковых

Forbes
Что крадут наши эмоции: 7 фактов Что крадут наши эмоции: 7 фактов

Факты о негативном влиянии эмоций на нашу жизнь

Psychologies
«Люби меня, как я тебя»: почему в счастливых отношениях нам не хватает взаимности «Люби меня, как я тебя»: почему в счастливых отношениях нам не хватает взаимности

Почему в отношениях кто-то один или оба не чувствуют себя по-настоящему любимыми

Psychologies
Рубцы на коже: почему необходим комплексный подход к лечению Рубцы на коже: почему необходим комплексный подход к лечению

Можно ли сделать так, чтобы рубцы стали незаметными?

Psychologies
Когда голод превращается в раздражительность: 3 совета для контроля эмоций Когда голод превращается в раздражительность: 3 совета для контроля эмоций

Как телесные ощущения воздействуют на эмоции

Psychologies
Формула успеха Формула успеха

Эти 10 привычек улучшат твое финансовое положение

Лиза
Открыть в приложении