Что такое метод SAE Match и как он поможет заглянуть в «душу» ИИ?

ForbesHi-Tech

Заглянули под капот: ученые выяснили, как ИИ принимает решения на разных этапах

Роман Рожков

Фото Getty Images

Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод, который помогает понять, почему ИИ-модель приняла то или иное решение в процессе вычисления, и при необходимости повлиять на нее, узнал Forbes. По мнению экспертов, этот метод, названный SAE Match, может помочь преодолеть эффект «черного ящика» для бизнеса и потенциально подтолкнуть вперед весь рынок, поскольку компании начнут больше доверять технологии.

В лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый научный метод под названием SAE Match, который позволяет заглянуть внутрь искусственного интеллекта, выяснить, в какой момент ИИ начинает давать неправильные или нежелательные ответы, и вовремя скорректировать их, рассказали Forbes в компании. «Это прорывной шаг на пути к более прозрачным, точным и понятным алгоритмам, что особенно важно при внедрении ИИ в критически важные сферы — такие, как медицина, финансы и безопасность», — утверждают в Т-банке.

В чем суть открытия

Метод SAE Match относится к области интерпретируемости ИИ, главная цель которой — сделать работу ИИ более прозрачной и понятной для человека, чтобы можно было отслеживать, как модель обрабатывает информацию, почему она принимает те или иные решения, и впоследствии повысить точность ответов.

Современные языковые модели состоят из нескольких слоев, каждый из которых использует результат предыдущего: так модель старается улучшить свои предсказания слой за слоем, поясняют в Т-банке: «Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. Ранее не существовало метода, который позволял бы проследить, как концепции изменяются от слоя к слою. SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений». Эксперименты на ряде моделей показали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, указывают в компании: «Это делает поведение ИИ более предсказуемым и понятным, в том числе дает возможность контролировать процесс генерации текста, а не просто накладывать внешние ограничения или обучать модель на новых данных, что дорого и требует больших вычислительных ресурсов».

Кроме того, как заверяют авторы метода (ими указаны Никита Балаганский, Ян Максимов и Даниил Гаврилов), SAE Match не требует дополнительных данных или дообучения модели, что делает его гораздо более доступным, чем другие методы контроля работы ИИ: «Это особенно важно для небольших команд, которые не могут позволить себе сбор и обработку больших наборов данных». Также метод, по их словам, позволяет отслеживать, когда модель начинает предсказывать нежелательные или потенциально опасные фразы, и предотвращать их появление, это поможет создавать более безопасные и этичные решения на базе ИИ.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

55 и вперед: как «серебряное поколение» адаптируется под новые карьерные треки 55 и вперед: как «серебряное поколение» адаптируется под новые карьерные треки

Как «серебряное поколение» адаптируется к новым карьерным реалиям

Forbes
Сила стиля Сила стиля

Какие тренды меняют мужскую моду

Men Today
Для чего нужен магниевый анод в бойлерах накопительного типа? Для чего нужен магниевый анод в бойлерах накопительного типа?

От чего и как именно защищает магниевый анод в бойлере косвенного нагрева?

CHIP
Китайское рекламное чудо Китайское рекламное чудо

На какую рекламу тратят рекламный бюджет компании на российском рынке

Ведомости
Пять языков любви Пять языков любви

Секрет прочных отношений

kiozk originals
Как люди хоронят дружбу и отношения в переписках Как люди хоронят дружбу и отношения в переписках

Как цифровой мир лишает нас друг друга

Men Today
Что такое дунхуа: все о китайском аниме Что такое дунхуа: все о китайском аниме

С чего пошло зарождение китайской анимации?

Maxim
Топ-5 самых странных игровых консолей в истории — от 1970-х до 2020-х Топ-5 самых странных игровых консолей в истории — от 1970-х до 2020-х

Самые необычные игровые консоли

CHIP
Беспределы роста. Для избранных? Беспределы роста. Для избранных?

Как будет развиваться глобальная энергетика в ближайшую четверть века

Монокль
«Джеймс Уэбб» вновь нашел в атмосфере потенциального гикеана диметилсульфид «Джеймс Уэбб» вновь нашел в атмосфере потенциального гикеана диметилсульфид

«Джеймс Уэбб» вновь обнаружил признаки наличия диметилсульфида

N+1
Настоящие произведения искусства: топ-5 самых красивых паспортов в мире Настоящие произведения искусства: топ-5 самых красивых паспортов в мире

Развороты некоторых паспортов можно смело вывешивать в галереях. Посмотрите!

ТехИнсайдер
Лингвистические фантомы Лингвистические фантомы

Как в русском языке появляются псевдоанглицизмы

Наука и жизнь
Распоследний магнат Распоследний магнат

«Киностудия» — самопародия голливудских остряков на киноиндустрию

Weekend
Как первый полет в космос повлиял на моду и дизайн: от русского космизма до визуальной культуры после Гагарина Как первый полет в космос повлиял на моду и дизайн: от русского космизма до визуальной культуры после Гагарина

Как философия русского космизма сформировала визуальную культуру XX-XXI веков?

ТехИнсайдер
Добавь изюминку Добавь изюминку

Как быстро и бюджетно преобразить дачный интерьер

Лиза
Формула любви Александра Абдулова Формула любви Александра Абдулова

«Герой должен умереть молодым» — старая японская пословица. Он жил всего 54 года

Коллекция. Караван историй
Мужчина мечты Мужчина мечты

Хочет ли Ярослав Могильников остаться в кино и как проходят его первые свидания

VOICE
Простой способ повысить психологическую устойчивость и настроиться на позитив Простой способ повысить психологическую устойчивость и настроиться на позитив

Одно упражнение для поддержания психологической устойчивости

Inc.
Вклад в людей и технологии Вклад в людей и технологии

Москва поддерживает бизнес, выделяя гранты на развитие экспортной деятельности

Ведомости
Пленка и рынок: отрывок из книги «Царапины и глитчи. О сохранении и демонстрации кино в начале XXI века» Пленка и рынок: отрывок из книги «Царапины и глитчи. О сохранении и демонстрации кино в начале XXI века»

Эссе из сборника «О сохранении и демонстрации кино в начале XXI века»

Правила жизни
«Отсутствие масштабных идей сдерживает приток инвестиций» «Отсутствие масштабных идей сдерживает приток инвестиций»

На чьи деньги стоит рассчитывать российским стартапам

Эксперт
Пережившие века Пережившие века

Обережные символы и представления о прекрасном, вшитые в традиционные ремесла

Вокруг света
Территория детства Территория детства

7 особенностей дизайна, которые точно понравятся твоему ребенку

Лиза
Полевой роман Полевой роман

1943 г.: лыжные гонки с гранатами и футбольный матч в освобожденном Сталинграде

Ведомости
Юродивый из Лефортова Юродивый из Лефортова

Почему смерть рэпера обсуждала вся страна и что не так с молодежной политикой?

Монокль
Сарацинка, воительница, христианка Сарацинка, воительница, христианка

В эпоху джахилийи у разных племен бедуинов положение женщин различалось

Знание – сила
6 причин, по которым простыни становятся серыми, и способы это исправить 6 причин, по которым простыни становятся серыми, и способы это исправить

Как предотвратить изменение цвета простыней

VOICE
Горизонт планирования Горизонт планирования

Актер Ярослав Могильников — о жизни и кино

Men Today
Дуэты на тарелке Дуэты на тарелке

Эти сочетания продуктов принесут двойную пользу вашему организму

Лиза
Тонны мусора: как современная экономика заставляет нас увеличивать количество отходов Тонны мусора: как современная экономика заставляет нас увеличивать количество отходов

О том, как гражданское общество в России строит систему сокращения отходов

Forbes
Открыть в приложении