Государствам нужно ускориться в регулировании искусственного интеллекта

МонокльРепортаж

В битвах вокруг ИИ победят корпорации

Государствам нужно ускориться в регулировании искусственного интеллекта и признать, что ситуация критическая

Наталья Быкова

Стоян Васев

Что создают в OpenAI и стоит ли этого бояться? Об этом — в интервью с экспертом по междисциплинарным исследованиям и стратегической аналитике, бывшим топ-менеджером IBM, SGI и Cray Research Сергеем Кареловым.

— Самая обсуждаемая тема в свете событий с OpenAI, — обнаружение специалистами компании у своей модели новой когнитивной способности самостоятельно находить информацию, которой нет в ее базе данных. Поясните, пожалуйста, что это может быть за модель и как у нее получилось выйти за пределы знаний, сформированных на стадии ее обучения?

— Да, основная причина, из-за которой начался весь этот бардак, заключается в том, что был совершен прорыв в исследованиях в сторону сильного искусственного интеллекта. А поскольку условия соглашения Microsoft и OpenAI были таковы, что в случае приближения к подобным результатам все предыдущие соглашения должны пересматриваться, то фактически OpenAI получала право забрать у Microsoft последние рычаги управления. Чтобы избежать этого, была разыграна многосерийная интрига с увольнением, а потом возвращением Сэма Альтмана. В результате чего совет директоров был кардинально обновлен в пользу интересов Microsoft.

Что же касается прорыва, то здесь мы можем только строить предположения. Есть информация, что в главном сегодняшнем проекте компании под кодовым названием Q* (читается Q-Star) велись исследования по трем направлениям.

Первое — это как раз про способность модели не просто искать информацию во внешней базе данных, в том же интернете или корпоративных базах, но и целенаправленно формулировать вопросы. Это означает, что она не привязана на сто процентов к базам, на которых строилось ее обучение, — а это очень неординарный результат. Дело в том, что все модели создаются схожим образом: учатся по нескольку месяцев на огромных объемах информации, выстраивая свои матрицы весов, свои внутренние представления об этой информации. Далее с ними начинают работать аналитики, задают им вопросы, просят высказаться по определенной теме, а модели в ответ обращаются вот к этой сформированной на этапе обучения матрице и на этой основе формулируют ответ. То есть теоретически модель не может выйти за пределы того, чему научилась на этапе обучения.

Новым лингвоботам Claude-2 и Bing дали возможность прямого обращения в сеть, это, конечно, сильно расширило возможности подобных систем, но эти обращения совершались исключительно на базе тех запросов, которые писали лингвоботам люди. Например, если их спрашивали, какие были группировки североамериканских индейцев за год до начала Гражданской войны в США, то боты искали в сети информацию о группировках индейцев и Гражданской войне в США, не понимая сути вопроса.

А вот тот прорыв, о котором мы говорим, связан с принципиально новой способностью модели. Она начала искать ответы в сети на собственные содержательные вопросы, чтобы лучше разобраться в теме: к примеру, что лежало в основе разделения индейцев на группировки — идеология, борьба за территорию и так далее.

Второе направление, которое получило сильный прогресс, — это системы, подобные AlphaZero, обыгрывающей чемпионов в шахматы. Они работают по другим принципам, осуществляют поиск по деревьям Монте-Карло (эвристический алгоритм поиска для некоторых видов процессов принятия решений, в первую очередь тех, которые используются в программном обеспечении, играющем в настольные игры. — «Монокль»). Интеграция поиска траектории токена по дереву Монте-Карло (как в AlphaZero) с традиционными для больших языковых моделей матрицами весов может быть особенно эффективна в таких областях, как программирование и математика, где есть простой способ определить правильность. И это может объяснять утечки о прорывном улучшении в проекте Q* способностей решения математических задач.

Третье направление — это комбинация Q-обучения и алгоритма A*.

Алгоритм A* — это способ нахождения кратчайшего пути от одной точки до другой на карте или в сети. Представьте, что вы ищете самый быстрый маршрут из одного города в другой. Алгоритм A* проверяет разные пути, оценивая, насколько они близки к цели и сколько еще предстоит пройти. Он выбирает путь, который, по его оценке, будет самым коротким. Этот алгоритм очень эффективен и используется во многих областях, например в компьютерных играх для нахождения пути персонажей или в GPS-навигаторах.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Как разбогатеть в кризис: откладывать или тратить? Как разбогатеть в кризис: откладывать или тратить?

Можно ли заработать в кризис?

Популярная механика
Александр Попов. Русский волшебник беспроводной связи Александр Попов. Русский волшебник беспроводной связи

Как русский ученый-физик Александр Степанович Попов изобрел радио

Зеркало Мира
Исследование: у владельцев собак риск развития деменции на 40% ниже Исследование: у владельцев собак риск развития деменции на 40% ниже

Люди старше 65 лет, у которых есть собаки, намного реже страдают деменцией

ТехИнсайдер
Новые отношения Новые отношения

После развода кажется, что новый брак почти невозможен, да и нужен ли?

Новый очаг
Как перестать мастурбировать: можно ли отказаться от мастурбации и зачем это нужно Как перестать мастурбировать: можно ли отказаться от мастурбации и зачем это нужно

Когда естественный способ разрядки становится зависимостью?

Psychologies
Ночь в музее, «комната Афродиты» и «зона похоти»: самые роскошные новогодние корпоративы в истории Ночь в музее, «комната Афродиты» и «зона похоти»: самые роскошные новогодние корпоративы в истории

Самые необычные новогодние вечеринки — как зарубежные, так и российские

Правила жизни
Как подобрать правильно вклад и не ошибиться? Как подобрать правильно вклад и не ошибиться?

С повышением ключевой ставки Банком России ставки по вкладам поползли вверх

Наука и техника
Дороги без дураков Дороги без дураков

Разбираемся, как именно строится транспортная система будущего

РБК
Дело о тестостероне Дело о тестостероне

Экзогенный тестостерон — способ оставаться молодым или источник проблем?

Здоровье
«Секс с учеными: Половое размножение и другие загадки биологии» «Секс с учеными: Половое размножение и другие загадки биологии»

Как дрожжи научились не скрещиваться с близкими родственниками

N+1
«Плохая девочка», Пугачева под фонк и новый пик Лолиты: как ремейки захватили чарты «Плохая девочка», Пугачева под фонк и новый пик Лолиты: как ремейки захватили чарты

Почему все вдруг пошли делать и слушать ремейки старых песен

Правила жизни
ВОЗмутительная политика ВОЗмутительная политика

Подходы к борьбе с табакокурением сегодня все больше напоминают охоту на ведьм

Наука
Европа призвала Африку к декарбонизации Европа призвала Африку к декарбонизации

Ежегодные конференции ООН по климату официально называются конференциями сторон

Монокль
Как завязывать галстук: 4 простых способа, с которыми справится каждый Как завязывать галстук: 4 простых способа, с которыми справится каждый

Как завязать галстук (и даже галстук-бабочку!) разными способами и без стресса

ТехИнсайдер
Одиночество назвали независимым фактором риска смерти от всех причин Одиночество назвали независимым фактором риска смерти от всех причин

Связаны ли как-то одиночество и смерть? Отвечают ученые

N+1
Фаина Рублева: «Картина звездного неба – величайшее в мире зрелище» Фаина Рублева: «Картина звездного неба – величайшее в мире зрелище»

Непростая, но очень интересная история Московского Планетария

Зеркало Мира
Самый странный мотив убийства: история Даны Сью Грей, помешанной на шоппинге Самый странный мотив убийства: история Даны Сью Грей, помешанной на шоппинге

Началось всё 16 февраля 1994 года: в этот день было найдено тело Нормы Дэвис

VOICE
Цветок по имени Настя Цветок по имени Настя

Об эмоциональном выгорании родителей, ухаживающих за неизлечимо больным ребенком

СНОБ
(Не) как у всех (Не) как у всех

Кухня — безупречный образец бесконечных повторений

Grazia
Кто хочет стать триллионером Кто хочет стать триллионером

Почему 100 лет назад рухнула германская марка

Деньги
Дружба с Канье Уэстом и сотрудничество с мировыми брендами: чем известен дизайнер Гоша Рубчинский Дружба с Канье Уэстом и сотрудничество с мировыми брендами: чем известен дизайнер Гоша Рубчинский

Чем прославился российский дизайнер Гоша Рубчинский  — в материале «Сноба»

СНОБ
Геннадий Хазанов Геннадий Хазанов

Геннадий Хазанов, артист эстрады, театра и кино, телеведущий, Москва, 77 лет

Правила жизни
Рынок жилья охлаждают Рынок жилья охлаждают

Правительство ввело ограничения в программы льготной ипотеки

Монокль
5 шагов в будущее 5 шагов в будущее

Эти открытия изменят медицину и продлят жизнь

Men Today
Танки на колесах Танки на колесах

Есть ли перспектива у так называемых «колесных танков»?

Обозрение армии и флота
Голова кругом Голова кругом

Есть ли у сосудов мозга углы

N+1
«Лучше пока погодить»: писатель Носов о том, нужно ли называть родителей предками «Лучше пока погодить»: писатель Носов о том, нужно ли называть родителей предками

Отрывок из книги Николая Носова «Иронические юморески. Кванты смеха»

Forbes
Несколько последних слов Несколько последних слов

Игорь Гулин о стихах Григория Дашевского

Weekend
Лаконичность в деталях Лаконичность в деталях

Дизайн-микс из дорогой акцентной мебели и предметов, найденных на маркетплейсах

Идеи Вашего Дома
Наталья Царевская-Дякина: «Возможно, школ и вузов в привычном нам понимании когда-нибудь не станет» Наталья Царевская-Дякина: «Возможно, школ и вузов в привычном нам понимании когда-нибудь не станет»

Как будет меняться система образования и что такое концепция life-work learning

РБК
Открыть в приложении