Государствам нужно ускориться в регулировании искусственного интеллекта

МонокльРепортаж

В битвах вокруг ИИ победят корпорации

Государствам нужно ускориться в регулировании искусственного интеллекта и признать, что ситуация критическая

Наталья Быкова

Стоян Васев

Что создают в OpenAI и стоит ли этого бояться? Об этом — в интервью с экспертом по междисциплинарным исследованиям и стратегической аналитике, бывшим топ-менеджером IBM, SGI и Cray Research Сергеем Кареловым.

— Самая обсуждаемая тема в свете событий с OpenAI, — обнаружение специалистами компании у своей модели новой когнитивной способности самостоятельно находить информацию, которой нет в ее базе данных. Поясните, пожалуйста, что это может быть за модель и как у нее получилось выйти за пределы знаний, сформированных на стадии ее обучения?

— Да, основная причина, из-за которой начался весь этот бардак, заключается в том, что был совершен прорыв в исследованиях в сторону сильного искусственного интеллекта. А поскольку условия соглашения Microsoft и OpenAI были таковы, что в случае приближения к подобным результатам все предыдущие соглашения должны пересматриваться, то фактически OpenAI получала право забрать у Microsoft последние рычаги управления. Чтобы избежать этого, была разыграна многосерийная интрига с увольнением, а потом возвращением Сэма Альтмана. В результате чего совет директоров был кардинально обновлен в пользу интересов Microsoft.

Что же касается прорыва, то здесь мы можем только строить предположения. Есть информация, что в главном сегодняшнем проекте компании под кодовым названием Q* (читается Q-Star) велись исследования по трем направлениям.

Первое — это как раз про способность модели не просто искать информацию во внешней базе данных, в том же интернете или корпоративных базах, но и целенаправленно формулировать вопросы. Это означает, что она не привязана на сто процентов к базам, на которых строилось ее обучение, — а это очень неординарный результат. Дело в том, что все модели создаются схожим образом: учатся по нескольку месяцев на огромных объемах информации, выстраивая свои матрицы весов, свои внутренние представления об этой информации. Далее с ними начинают работать аналитики, задают им вопросы, просят высказаться по определенной теме, а модели в ответ обращаются вот к этой сформированной на этапе обучения матрице и на этой основе формулируют ответ. То есть теоретически модель не может выйти за пределы того, чему научилась на этапе обучения.

Новым лингвоботам Claude-2 и Bing дали возможность прямого обращения в сеть, это, конечно, сильно расширило возможности подобных систем, но эти обращения совершались исключительно на базе тех запросов, которые писали лингвоботам люди. Например, если их спрашивали, какие были группировки североамериканских индейцев за год до начала Гражданской войны в США, то боты искали в сети информацию о группировках индейцев и Гражданской войне в США, не понимая сути вопроса.

А вот тот прорыв, о котором мы говорим, связан с принципиально новой способностью модели. Она начала искать ответы в сети на собственные содержательные вопросы, чтобы лучше разобраться в теме: к примеру, что лежало в основе разделения индейцев на группировки — идеология, борьба за территорию и так далее.

Второе направление, которое получило сильный прогресс, — это системы, подобные AlphaZero, обыгрывающей чемпионов в шахматы. Они работают по другим принципам, осуществляют поиск по деревьям Монте-Карло (эвристический алгоритм поиска для некоторых видов процессов принятия решений, в первую очередь тех, которые используются в программном обеспечении, играющем в настольные игры. — «Монокль»). Интеграция поиска траектории токена по дереву Монте-Карло (как в AlphaZero) с традиционными для больших языковых моделей матрицами весов может быть особенно эффективна в таких областях, как программирование и математика, где есть простой способ определить правильность. И это может объяснять утечки о прорывном улучшении в проекте Q* способностей решения математических задач.

Третье направление — это комбинация Q-обучения и алгоритма A*.

Алгоритм A* — это способ нахождения кратчайшего пути от одной точки до другой на карте или в сети. Представьте, что вы ищете самый быстрый маршрут из одного города в другой. Алгоритм A* проверяет разные пути, оценивая, насколько они близки к цели и сколько еще предстоит пройти. Он выбирает путь, который, по его оценке, будет самым коротким. Этот алгоритм очень эффективен и используется во многих областях, например в компьютерных играх для нахождения пути персонажей или в GPS-навигаторах.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

17 мгновенных фактов про «Семнадцать мгновений весны» 17 мгновенных фактов про «Семнадцать мгновений весны»

Рассказываем максимально интересное про «Семнадцать мгновений весны»

Maxim
Игра в молчанку Игра в молчанку

Почему мужчины замыкаются в себе после ссоры и как разрешить конфликт

Лиза
Евгений Цыганов: «Главная награда — иметь возможность делать то, что хочется» Евгений Цыганов: «Главная награда — иметь возможность делать то, что хочется»

Интервью с Евгением Цыгановым о театре, музыке и нынешнем состоянии нашего кино

СНОБ
Спонтанные поездки на зимние каникулы Спонтанные поездки на зимние каникулы

Если планировать ничего не хочется, всегда можно внезапно сорваться в поездку

Лиза
Бесконечно биться головой в закрытую дверь: как работают женщины-адвокаты в России Бесконечно биться головой в закрытую дверь: как работают женщины-адвокаты в России

Как не опускать руки, зная, что в России 99% приговоров — обвинительные

Forbes
Место силы Место силы

Однокомнатная квартира с вдохновляющим и наполняющим силами интерьером

Идеи Вашего Дома
Борис Порфирьев, Александр Широв: «Решить климатические проблемы в лоб невозможно» Борис Порфирьев, Александр Широв: «Решить климатические проблемы в лоб невозможно»

Как и кем формируется глобальная климатическая повестка

Монокль
Квантовое превосходство Квантовое превосходство

«Квантовый компьютер – атомная бомба XX века»

ТехИнсайдер
Между выгодой и риском Между выгодой и риском

Как в России и мире пытаются регулировать ИИ

РБК
«Коты полезны для здоровья?»: как работает фелинотерапия «Коты полезны для здоровья?»: как работает фелинотерапия

Как повседневное общение с кошками приводит к исцелению тела и души?

Psychologies
Кино Кино

Маршал советской комедии: путь Леонида Гайдая к эталону юмористического фильма

Правила жизни
А мы тебя ждали А мы тебя ждали

Как впустить в жизнь новое – разбираемся с психологом Еленой Голяковской

Новый очаг
Как перестать мастурбировать: можно ли отказаться от мастурбации и зачем это нужно Как перестать мастурбировать: можно ли отказаться от мастурбации и зачем это нужно

Когда естественный способ разрядки становится зависимостью?

Psychologies
«Тушкино семейство» «Тушкино семейство»

Ту-204 – среднемагистральный пассажирский самолет

Наука и Техника
Дом, который построил страх Дом, который построил страх

Как устроен хоррор от крыши до фундамента

Weekend
Жизнь других Жизнь других

Почему мы невольно начинаем подстраиваться и как найти «настоящего себя»?

Grazia
Жилое и мертвое Жилое и мертвое

Дом в русской литературе: между обыденным адом и потерянным раем

Weekend
ВОЗмутительная политика ВОЗмутительная политика

Подходы к борьбе с табакокурением сегодня все больше напоминают охоту на ведьм

Наука
9 манипуляций, которые используют токсичные родители: как защититься 9 манипуляций, которые используют токсичные родители: как защититься

Бойкот, газлайтинг, двойные послания: как ведут себя токсичные родители

Psychologies
Мозг новорожденных людей развит не хуже, чем у других приматов Мозг новорожденных людей развит не хуже, чем у других приматов

Мозг новорожденных людей развит не хуже, чем мозг других приматов

ТехИнсайдер
А мне летать охота: как стать бортпроводником А мне летать охота: как стать бортпроводником

Плюсы и минусы работы бортпроводником

ТехИнсайдер
3 серьезных минуса блестящего маникюра с втиркой — самого модного нейл-дизайна последних лет 3 серьезных минуса блестящего маникюра с втиркой — самого модного нейл-дизайна последних лет

Что не так с блестящим маникюром с втиркой?

VOICE
Если в твоем доме странно пахнет, обязательно проверь эти 11 проблемных мест Если в твоем доме странно пахнет, обязательно проверь эти 11 проблемных мест

Хочешь, чтобы твой дом всегда благоухал свежестью, но не можешь этого добиться?

VOICE
Итальяна Джонс Итальяна Джонс

«Химера»: старомодное кино о вечном самокопании и вечной Тоскане

Weekend
Функциональная красота Функциональная красота

Квартира, в которой внутренний интерьер и вид из окон дополняют друг друга

Идеи Вашего Дома
Что может Дед Мороз Что может Дед Мороз

Психолог Мария Зеленова о магическом мышлении и его роли в воспитании.

Новый очаг
5 признаков того, что вас обрабатывает манипулятор 5 признаков того, что вас обрабатывает манипулятор

Намерения манипулятора можно вычислить заранее, если знать, на что смотреть

Psychologies
Он у меня не подарок Он у меня не подарок

Если мужчина преподносит поющую корову, вместо того чтобы изучить твой вишлист

VOICE
Диванная аналитика Диванная аналитика

Люди, для которых «аналитика на диване» не оружие для баталий в соцсетях

Цифровой океан
«Диагноз» по селфи «Диагноз» по селфи

Иногда селфи может рассказать о человеке больше, чем тысяча слов

Здоровье
Открыть в приложении