Имеет ли значение доминирование английского языка для ИИ-моделей?

ТехИнсайдерHi-Tech

Оказалось, что у ИИ-моделей есть родной язык: чаще всего это английский

Владимир Губайловский

Исследователи Федеральной политехнической школы Лозанны (EPFL) показали, что большие языковые модели, первоначально обученные на английских текстах, похоже, сами используют английский для внутренних задач, даже когда получают подсказки (промпты) на другом языке. Поскольку ИИ все сильнее вмешивается в нашу жизнь, такое превалирование английского может иметь самые серьезные последствия в отношении языковых и культурных предубеждений.

Большие языковые модели, такие как ChatGPT, покорили мир, удивив нас своей способностью понимать наши слова и отвечать на нашем родном языке — гладко и связанно. Но есть нюанс: оказывается у них есть родной язык, и этот язык — английский.

Хотя с большими языковые моделями (LLM), такими как ChatGPT от Open AI и Gemini от Google, можно взаимодействовать на любом языке, первоначально они обучены работе с сотнями миллиардов текстовых параметров, в основном, на английском. Некоторые исследователи выдвинули гипотезу, что большую часть внутренней обработки LLM выполняют на английском языке и переводят полученный текст на целевой язык в самый последний момент. Однако доказательств этому до сих пор было мало.

Тестирование Llama

Исследователи Федеральной политехнической школы Лозанны (EPFL) изучили LLM с открытым исходным кодом Llama-2 (Large Language Model Meta (признана экстремистской организацией на территории РФ) AI), чтобы определить, какие языки использовались на каких этапах вычислительной цепочки.

«Большие языковые модели обучены предсказывать следующее слово. Они делают это, сопоставляя каждое слово с вектором чисел, по сути, с точкой в многомерном пространстве данных. Например, слово "the" всегда будет находиться в одной и той же фиксированной точке координат», — пояснил профессор Роберт Уэст, возглавивший исследование.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как наше имя влияет на нашу внешность: научные данные Как наше имя влияет на нашу внешность: научные данные

Могут ли наши имена влиять на наш внешний вид? Вероятно, да

ТехИнсайдер
10 цитат Киры Найтли, которые научат вас слушать себя, а не других 10 цитат Киры Найтли, которые научат вас слушать себя, а не других

Вспоминаем самые яркие высказывания Киры Найтли

Psychologies
Вовсе не для развлечения: зачем на самом деле в Windows были встроены игры «Косынка» и «Сапер» Вовсе не для развлечения: зачем на самом деле в Windows были встроены игры «Косынка» и «Сапер»

«Косынка» и «Сапер»: какой замысел Билла Гейтса они в себе таили?

ТехИнсайдер
Дизайн человека Дизайн человека

Как предсказать будущее фигуры без натальной карты? Боди-менеджмент — наше все.

Собака.ru
Как быстро возбудить девушку: 12 способов (гид, который стоит держать под рукой) Как быстро возбудить девушку: 12 способов (гид, который стоит держать под рукой)

Не знаете, как быстро возбудить девушку до предела? Вы по адресу!

Playboy
Сексизм в большом городе: как женщины борются с дискриминацией и домогательствами на рабочем месте Сексизм в большом городе: как женщины борются с дискриминацией и домогательствами на рабочем месте

Несмотря на внимание сексизм все еще не удается полностью искоренить

Inc.
Сельхозпроизводство условно стабильно Сельхозпроизводство условно стабильно

В 2023 году сельхозпроизводство показало небольшое снижение и устойчивость

Агроинвестор
Ностальгический алкоголь: почему коктейли в банках снова стали популярны Ностальгический алкоголь: почему коктейли в банках снова стали популярны

Популярность сладкого алкоголя: шлейф барной культуры или борьба со стрессом?

Forbes
6 видов лжи и их последствия для нашей психики 6 видов лжи и их последствия для нашей психики

Даже если обман остается нераскрытым, зачастую он не проходит бесследно

Psychologies
Все фантазии дизайнера Все фантазии дизайнера

Тонкая грань гармонии между модой, традициями и оригинальностью в интерьере дачи

Идеи Вашего Дома
Хортифутуризм Хортифутуризм

Превращаем сад в научно-фантастический рай

Караван историй
Визит «дамы в черном». Как о депрессии говорят писатели Визит «дамы в черном». Как о депрессии говорят писатели

Тексты современных писателей, где депрессия стала самостоятельным героем

СНОБ
От Lemonade до Renaissance: 5 лучших альбомов Бейонсе От Lemonade до Renaissance: 5 лучших альбомов Бейонсе

Альбомы, которые стоит послушать всем, кто хочет понять феномен «королевы Би»

Правила жизни
«Баба с прицепом — кринж»: почему мужчины боятся заводить отношения с женщинами с детьми «Баба с прицепом — кринж»: почему мужчины боятся заводить отношения с женщинами с детьми

Почему мы можем бояться отношений с человеком, у которого уже есть дети?

Psychologies
Зачем люди коллекционируют кроссовки и почему это хорошая инвестиция Зачем люди коллекционируют кроссовки и почему это хорошая инвестиция

Рассказываем о тех, кто покупает редкие кроссовки и зарабатывает на этом

Maxim
Похороны Хрущёва Похороны Хрущёва

Отрывок, описывающий похороны опального политика Никиты Хрущёва

Дилетант
Что такое синдром навязчивых грез и как с ним бороться Что такое синдром навязчивых грез и как с ним бороться

Что такое синдром навязчивых грез и можно ли от него избавиться

РБК
Восемь продуктов, повышающих гемоглобин Восемь продуктов, повышающих гемоглобин

Какие продукты помогут повысить гемоглобин в крови и справиться с анемией

РБК
«Величайший португалец» «Величайший португалец»

Хозяином Португалии был Антониу Салазар, а его богом была Стабильность

Дилетант
Петля затягивается: чем опасна новая уязвимость для проведения DDoS-атак Петля затягивается: чем опасна новая уязвимость для проведения DDoS-атак

Эксперты обнаружили новый вид атаки типа «отказ в обслуживании» (DDoS)

Forbes
Терминальная стадия: как в Черном море стало тесно продавцам зерна Терминальная стадия: как в Черном море стало тесно продавцам зерна

Через зерновые терминалы Черного моря уходит до 90% зерновых на экспорт

Forbes
«Пустые клеточки» таблицы Менделеева «Пустые клеточки» таблицы Менделеева

Откуда берутся новые химические элементы? Зачем расширять таблицу Менделеева?

Наука и жизнь
Панацея или пустышка? Панацея или пустышка?

Как разглядеть потенциал у стартапов в сфере биомедтеха

РБК
Больше энергии Больше энергии

14 советов, как разбудить организм, если все время хочется спать

Лиза
Источники энергии Источники энергии

Кетогенная диета – система питания, придуманная почти сто лет назад

Добрые советы
Как справиться с тревогой: 10 шагов к спокойствию Как справиться с тревогой: 10 шагов к спокойствию

Как остановить тревожные мысли, заземлиться и успокоиться

ТехИнсайдер
Перезагрузка мышления Перезагрузка мышления

Как устроена нейронная сеть и что мы можем сделать, чтобы управлять ею

Лиза
Правильный путь Правильный путь

Rolls-Royce Джейсона Момоа Phantom II 1929 года стал полностью электрическим

Y Magazine
Всего два дня отсутствия здорового сна могут заставить человека чувствовать себя на годы старше Всего два дня отсутствия здорового сна могут заставить человека чувствовать себя на годы старше

Недосып прибавляет к ощущаемому возрасту человека почти 4,5 года

ТехИнсайдер
Что не так с «Большими девочками»? 4 главные проблемы популярного шоу о похудении Что не так с «Большими девочками»? 4 главные проблемы популярного шоу о похудении

Почему шоу «Большие девочки» транслирует неправильные идеи

Psychologies
Открыть в приложении