Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Это я беру на себя: почему бизнес все чаще размещает IT-решения на своих серверах Это я беру на себя: почему бизнес все чаще размещает IT-решения на своих серверах

Почему бизнес предпочитает развивать свою IT-инфраструктуру?

Forbes
Кто такие «бежевые» мамы и чем опасен новый тренд? Кто такие «бежевые» мамы и чем опасен новый тренд?

Почему «бежевое материнство» стало популярным и в чем его опасность для ребенка?

VOICE
Квантовая готовность: ждет ли бизнес новая технологическая революция Квантовая готовность: ждет ли бизнес новая технологическая революция

Существует риск проспать квантовую революцию, считает Андрей Скорочкин

Forbes
Жизнь в магнитном поле Жизнь в магнитном поле

Как изучают незаметные для органов чувств магнитные эффекты

Наука и жизнь
Конкурс страшных рассказов: Конкурс страшных рассказов:

Рассказ о семье, смерти и пчёлах: как девочка стала королевой одной ячейки

VOICE
Читай Читай

5 захватывающих графических романов

VOICE
От Марса до квантовой физики: 11 книг для любителей научной фантастики От Марса до квантовой физики: 11 книг для любителей научной фантастики

Что ждет человечество в будущем? Фантасты размышляют в своих книгах

Maxim
Эпидемия цифрового слабоумия: почему нынешние поколения глупее предыдущих Эпидемия цифрового слабоумия: почему нынешние поколения глупее предыдущих

Почему из-за развития цифровых технологий снижаются когнитивные функции человека

Монокль
8 вещей, которые нашатырный спирт сделает идеально чистыми 8 вещей, которые нашатырный спирт сделает идеально чистыми

Аммиак — один из самых мощных и недорогих бытовых очистителей

VOICE
А как у них? А как у них?

6 рецептов пасхальных куличей из разных стран

Лиза
Книга на выходные: как ChatGPT стал самым эффективным копирайтером «Зерокодера» Книга на выходные: как ChatGPT стал самым эффективным копирайтером «Зерокодера»

Отрывок из книги «Искусственный интеллект: путь к новому миру»

Inc.
Наука в фантастике: эпизоды истории Наука в фантастике: эпизоды истории

Одной из тем обсуждения в научной фантастике ХХ века была космическая экспансия

Наука и жизнь
Елизавета Юрьева: «Гордость зачастую – это способ защиты» Елизавета Юрьева: «Гордость зачастую – это способ защиты»

Елизавета Юрьева рассказывает, как она стала цыганкой

Ведомости
Спасительная рассрочка увеличивает риски Спасительная рассрочка увеличивает риски

Какие риски несут программы рассрочек при покупке жилья?

Монокль
Губернатор Московской области Андрей Воробьев: Нас часто сравнивают с нашей столицей Губернатор Московской области Андрей Воробьев: Нас часто сравнивают с нашей столицей

Глава Подмосковья об управлении регионом с помощью цифры и конкуренции с Москвой

Ведомости
Рукопожатие крепкое Рукопожатие крепкое

Как развивается рынок высокотехнологичных протезов

Эксперт
Как сохранить близость с детьми, даже когда они становятся взрослыми Как сохранить близость с детьми, даже когда они становятся взрослыми

Если вы хотите, чтобы ваши дети всегда доверяли вам, следуйте этим советам

Inc.
Роковая любовь в «эпоху джаза»: что вдохновило Фрэнсиса Скотта Фицджеральда на создание «Великого Гэтсби» Роковая любовь в «эпоху джаза»: что вдохновило Фрэнсиса Скотта Фицджеральда на создание «Великого Гэтсби»

Почему «Великого Гэтсби» можно считать пророчеством для американской мечты?

Правила жизни
3 сильные стороны интровертов, которые помогут им стать успешными 3 сильные стороны интровертов, которые помогут им стать успешными

Интроверты наделены множеством суперспособностей — нужно просто знать их

Inc.
Лидеры немного замедлились Лидеры немного замедлились

Топ-25 игроков увеличили выпуск комбикормов на 2,8%

Агроинвестор
Из Москвы в Питер на деньги синдиката Из Москвы в Питер на деньги синдиката

Как устроен механизм финансирования ВСМ Москва — Санкт-Петербург

Монокль
Исследователи обнаружили, что черные дыры могут помочь в процветании жизни, а не положить ей конец Исследователи обнаружили, что черные дыры могут помочь в процветании жизни, а не положить ей конец

Черные дыры могут быть не такими губительными для жизни, как предполагалось

Inc.
Продлили срок: что можно сделать из бывших тюрем Продлили срок: что можно сделать из бывших тюрем

Как бизнесмены и государство развивают бывшие тюрьмы

Forbes
Бомбардировки, голод, штурм: как Калининград встречал конец войны Бомбардировки, голод, штурм: как Калининград встречал конец войны

Как принималось решение о том, что кенигсбергская земля отойдет Союзу

ФедералПресс
Древние города Древние города

Что посмотреть в поселениях России, которым более тысячи лет

Лиза
Как приручить маркетинг и использовать его на все 100: объясняет эксперт Дмитрий Бескромный Как приручить маркетинг и использовать его на все 100: объясняет эксперт Дмитрий Бескромный

Как развить свой продукт с помощью digital-маркетинга

VOICE
Недоросли, скотинины, бригадиры и Стародум Недоросли, скотинины, бригадиры и Стародум

И спустя 200 лет пьесы Дениса Фонвизина остаются интересны и востребованы

Знание – сила
Мария Мацель: «Теперь наконец я могу делать и что-то свое» Мария Мацель: «Теперь наконец я могу делать и что-то свое»

Актриса Мария Мацель — о том, как снимаются фильмы-сны

Ведомости
Индейка на взлете Индейка на взлете

Российское производство мяса индейки выросло почти на 4%

Агроинвестор
ВЭБ определил стратегию ВЭБ определил стратегию

Группа ВЭБ ориентируется на нацпроекты

Эксперт
Открыть в приложении