Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Парадокс усилия: почему наш мозг сопротивляется сложным и долгосрочным задачам Парадокс усилия: почему наш мозг сопротивляется сложным и долгосрочным задачам

Почему мы так часто недооцениваем предстоящую работу?

Forbes
История 6 соток История 6 соток

Когда появилось такое явление, как дача? Кого можно считать первым дачником?

Лиза
На седьмое небо за пиццей: удивительные факты о высотных вращающихся ресторанах На седьмое небо за пиццей: удивительные факты о высотных вращающихся ресторанах

Как работает это чудо строительной инженерии — высотные вращающиеся рестораны?

ТехИнсайдер
Жертвы Кургана: подвиги и самоотдача города трудовой доблести Жертвы Кургана: подвиги и самоотдача города трудовой доблести

Линия фронта проходит возле твоего станка — таким был лозунг курганских рабочих

ФедералПресс
Насколько вы терпеливый человек? Психологический тест для самопознания Насколько вы терпеливый человек? Психологический тест для самопознания

Выберите свечу и узнайте, насколько вы терпеливы

ТехИнсайдер
Начало неолита на северо-западе Южной Азии сдвинули примерно на три тысячи лет Начало неолита на северо-западе Южной Азии сдвинули примерно на три тысячи лет

Почему ученые пересмотрели хронологию поселения Мехргарх?

N+1
Бум цифрового мошенничества в России: кто такие «инфоцыгане»? Бум цифрового мошенничества в России: кто такие «инфоцыгане»?

Как возник феномен «курсов из ничего» и что с ним происходит?

VC.RU
Революция со счастливым концом Революция со счастливым концом

Рубеж XIX и XX веков отмечен бурными событиями в целом ряде наук

Знание – сила
Жизнь на свободную тему Жизнь на свободную тему

Как вырастить ребенка уверенным, жизнерадостным и устойчивым?

Psychologies
Из Москвы в Питер на деньги синдиката Из Москвы в Питер на деньги синдиката

Как устроен механизм финансирования ВСМ Москва — Санкт-Петербург

Монокль
Простой способ повысить психологическую устойчивость и настроиться на позитив Простой способ повысить психологическую устойчивость и настроиться на позитив

Одно упражнение для поддержания психологической устойчивости

Inc.
Оборона в глубоком тылу Оборона в глубоком тылу

Какие экономические решения сделали СССР страной-победителем

Эксперт
Топ-7 хлебопечек: самые функциональные модели Топ-7 хлебопечек: самые функциональные модели

Хлебопечки, которые легко справятся с выпечкой ржаного хлеба и сладких батонов

CHIP
Коллекция суеверий Коллекция суеверий

Угличский музей мистики Дарьи Чужой переосмысляет фольклор

Отдых в России
Трудная жизнь нефтерубля Трудная жизнь нефтерубля

Если хочешь экономического мира, готовься к экономической войне

Деньги
Матч-пойнт Матч-пойнт

В чем феномен падела, как начать в него играть и насколько он травмоопасен?

Men Today
Найденная рыбаками на дне Тайваньского пролива древняя челюсть принадлежала денисовцу Найденная рыбаками на дне Тайваньского пролива древняя челюсть принадлежала денисовцу

Кусок нижней челюсти архаичного человека Penghu-1 принадлежал денисовцу

N+1
Почему долгосрочные сбережения «не летят» Почему долгосрочные сбережения «не летят»

Почему у людей нет интереса к программе долгосрочных сбережений и ИИС-3

Монокль
Гадаем по цветам Гадаем по цветам

Тест: какое растение тебе завести, чтобы оно радовало глаз и душу ?

VOICE
Кто такие «бежевые» мамы и чем опасен новый тренд? Кто такие «бежевые» мамы и чем опасен новый тренд?

Почему «бежевое материнство» стало популярным и в чем его опасность для ребенка?

VOICE
«У художника нет цели — только путь» «У художника нет цели — только путь»

Зорикто Доржиев о том, как искать себя в легендах и находить на Christie’s

Weekend
Святая вода из Эфиопии вызвала семь случаев устойчивой холеры в Европе Святая вода из Эфиопии вызвала семь случаев устойчивой холеры в Европе

Вспышка холеры в Европе: во всем виновата святая вода из Эфиопии

N+1
Рукопожатие крепкое Рукопожатие крепкое

Как развивается рынок высокотехнологичных протезов

Эксперт
Российский фармрынок переходит на дженерики: как изменится лекарственное обеспечение Российский фармрынок переходит на дженерики: как изменится лекарственное обеспечение

Дженерики становятся ключевым драйвером роста фармацевтического рынка

Inc.
От проверки юрлица до отзывов: 13 шагов для выбора программы допобразования От проверки юрлица до отзывов: 13 шагов для выбора программы допобразования

О том, как избежать образовательных продуктов, которые не несут ценности

Forbes
«Галилея археологов» «Галилея археологов»

Археологи давно борются с искушением перекопать поглубже всю Святую Землю

Знание – сила
Сарацинка, воительница, христианка Сарацинка, воительница, христианка

В эпоху джахилийи у разных племен бедуинов положение женщин различалось

Знание – сила
Как люди хоронят дружбу и отношения в переписках Как люди хоронят дружбу и отношения в переписках

Как цифровой мир лишает нас друг друга

Men Today
Недоросли, скотинины, бригадиры и Стародум Недоросли, скотинины, бригадиры и Стародум

И спустя 200 лет пьесы Дениса Фонвизина остаются интересны и востребованы

Знание – сила
Запечатанный воздух Запечатанный воздух

Японские семейные тайны Сахалина

Weekend
Открыть в приложении