Государствам нужно ускориться в регулировании искусственного интеллекта

МонокльРепортаж

В битвах вокруг ИИ победят корпорации

Государствам нужно ускориться в регулировании искусственного интеллекта и признать, что ситуация критическая

Наталья Быкова

Стоян Васев

Что создают в OpenAI и стоит ли этого бояться? Об этом — в интервью с экспертом по междисциплинарным исследованиям и стратегической аналитике, бывшим топ-менеджером IBM, SGI и Cray Research Сергеем Кареловым.

— Самая обсуждаемая тема в свете событий с OpenAI, — обнаружение специалистами компании у своей модели новой когнитивной способности самостоятельно находить информацию, которой нет в ее базе данных. Поясните, пожалуйста, что это может быть за модель и как у нее получилось выйти за пределы знаний, сформированных на стадии ее обучения?

— Да, основная причина, из-за которой начался весь этот бардак, заключается в том, что был совершен прорыв в исследованиях в сторону сильного искусственного интеллекта. А поскольку условия соглашения Microsoft и OpenAI были таковы, что в случае приближения к подобным результатам все предыдущие соглашения должны пересматриваться, то фактически OpenAI получала право забрать у Microsoft последние рычаги управления. Чтобы избежать этого, была разыграна многосерийная интрига с увольнением, а потом возвращением Сэма Альтмана. В результате чего совет директоров был кардинально обновлен в пользу интересов Microsoft.

Что же касается прорыва, то здесь мы можем только строить предположения. Есть информация, что в главном сегодняшнем проекте компании под кодовым названием Q* (читается Q-Star) велись исследования по трем направлениям.

Первое — это как раз про способность модели не просто искать информацию во внешней базе данных, в том же интернете или корпоративных базах, но и целенаправленно формулировать вопросы. Это означает, что она не привязана на сто процентов к базам, на которых строилось ее обучение, — а это очень неординарный результат. Дело в том, что все модели создаются схожим образом: учатся по нескольку месяцев на огромных объемах информации, выстраивая свои матрицы весов, свои внутренние представления об этой информации. Далее с ними начинают работать аналитики, задают им вопросы, просят высказаться по определенной теме, а модели в ответ обращаются вот к этой сформированной на этапе обучения матрице и на этой основе формулируют ответ. То есть теоретически модель не может выйти за пределы того, чему научилась на этапе обучения.

Новым лингвоботам Claude-2 и Bing дали возможность прямого обращения в сеть, это, конечно, сильно расширило возможности подобных систем, но эти обращения совершались исключительно на базе тех запросов, которые писали лингвоботам люди. Например, если их спрашивали, какие были группировки североамериканских индейцев за год до начала Гражданской войны в США, то боты искали в сети информацию о группировках индейцев и Гражданской войне в США, не понимая сути вопроса.

А вот тот прорыв, о котором мы говорим, связан с принципиально новой способностью модели. Она начала искать ответы в сети на собственные содержательные вопросы, чтобы лучше разобраться в теме: к примеру, что лежало в основе разделения индейцев на группировки — идеология, борьба за территорию и так далее.

Второе направление, которое получило сильный прогресс, — это системы, подобные AlphaZero, обыгрывающей чемпионов в шахматы. Они работают по другим принципам, осуществляют поиск по деревьям Монте-Карло (эвристический алгоритм поиска для некоторых видов процессов принятия решений, в первую очередь тех, которые используются в программном обеспечении, играющем в настольные игры. — «Монокль»). Интеграция поиска траектории токена по дереву Монте-Карло (как в AlphaZero) с традиционными для больших языковых моделей матрицами весов может быть особенно эффективна в таких областях, как программирование и математика, где есть простой способ определить правильность. И это может объяснять утечки о прорывном улучшении в проекте Q* способностей решения математических задач.

Третье направление — это комбинация Q-обучения и алгоритма A*.

Алгоритм A* — это способ нахождения кратчайшего пути от одной точки до другой на карте или в сети. Представьте, что вы ищете самый быстрый маршрут из одного города в другой. Алгоритм A* проверяет разные пути, оценивая, насколько они близки к цели и сколько еще предстоит пройти. Он выбирает путь, который, по его оценке, будет самым коротким. Этот алгоритм очень эффективен и используется во многих областях, например в компьютерных играх для нахождения пути персонажей или в GPS-навигаторах.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Стоит ли бояться искусственного оплодотворения? Стоит ли бояться искусственного оплодотворения?

Насколько безопасно ЭКО и кому именно подойдет этот метод

Популярная механика
«Как понять, что я навязываюсь?»: чек-лист от психолога «Как понять, что я навязываюсь?»: чек-лист от психолога

Как перебороть чувство, что мы «навязываем» свое общение другому

Psychologies
Верю в Веру! Воспоминания о Вере Васильевой Верю в Веру! Воспоминания о Вере Васильевой

Секретом здоровья и энергичности Веры Васильевой было отсутствие злости

Коллекция. Караван историй
Парк «Тужи»: ленд-арт и бурятские традиции Парк «Тужи»: ленд-арт и бурятские традиции

Парк «Тужи» сочетает природу Дальнего Востока и современный ленд-арт

Psychologies
Аккуратнее с духовностью! История, как румынский гуру домогался до своих учеников в Париже Аккуратнее с духовностью! История, как румынский гуру домогался до своих учеников в Париже

Этот пожилой гуру йоги занимался сексуальной эксплуатацией своих учеников

ТехИнсайдер
Привидения Дома Кранкенгагена Привидения Дома Кранкенгагена

Дом Кранкенгагена известен в Петербурге всем, чья страсть — привидения

СНОБ
7 опасных привычек водителя, от которых надо избавляться, пока не поздно 7 опасных привычек водителя, от которых надо избавляться, пока не поздно

Перечисляем неочевидные моменты, которых стоит категорически избегать за рулем

Maxim
5 признаков того, что вас обрабатывает манипулятор 5 признаков того, что вас обрабатывает манипулятор

Намерения манипулятора можно вычислить заранее, если знать, на что смотреть

Psychologies
“Он улетел, но обещал вернуться”. Как долго кошка помнит своего хозяина? “Он улетел, но обещал вернуться”. Как долго кошка помнит своего хозяина?

Привязываются ли коты к людям?

ТехИнсайдер
Счастливая история! Японец не разговаривал с женой 20 лет, но они продолжали жить вместе Счастливая история! Японец не разговаривал с женой 20 лет, но они продолжали жить вместе

Почему этот японец не разговаривал со своей женой два десятка лет?

ТехИнсайдер
Инновации, рожденные из боли: как соединить медицину и дизайн Инновации, рожденные из боли: как соединить медицину и дизайн

Как личная практика подтолкнула героя на создание революционных технологий

ФедералПресс
От «золотой клетки» к art of living От «золотой клетки» к art of living

Как изменились ценности покупателя элитной недвижимости за 30 лет

РБК
Анастасия Климова Анастасия Климова

Из чего состоит фэшн-стиль художницы Анастасии Климовой?

Собака.ru
Учимся падать Учимся падать

Иногда удовольствие зимнего отдыха сопровождается рисками. Давай ими управлять

Лиза
Метаморфозы Иракли Метаморфозы Иракли

Ираклий Пирцхалава редкий гость в Москве, но интервью получилось интересным!

OK!
5 фильмов о материнской любви 5 фильмов о материнской любви

Нет на свете большей силы, чем сила материнской любви

Psychologies
Не такой уж малый Не такой уж малый

Меры поддержки кредитования МСП все еще охватывают ничтожную его часть

Монокль
Как продвигать товары внутри маркетплейсов: инструкция для начинающих селлеров Как продвигать товары внутри маркетплейсов: инструкция для начинающих селлеров

Как начинающим предпринимателям продвигать свои товары и какие инструменты есть

Inc.
Спорно, но задорно Спорно, но задорно

Гарик Харламов вспомнил и проанализировал историю конфликтов в своей жизни

Men Today
Регина Тодоренко: «Не нужно бояться менять свою жизнь к лучшему!» Регина Тодоренко: «Не нужно бояться менять свою жизнь к лучшему!»

Регина Тодоренко считает, что каждый – творец собственной жизни

Добрые советы
Пример для подражания Пример для подражания

Об оригиналах, подделках и отличиях вдохновения от заимствования в искусстве

Grazia
Линия энергии Линия энергии

Минималистичный интерьер квартиры для молодой семьи с двумя детьми

SALON-Interior
Синдром именинника: почему перед днем рождения нам бывает грустно Синдром именинника: почему перед днем рождения нам бывает грустно

Почему перед днем рождения хочется ото всех закрыться в комнате

ТехИнсайдер
Ужасная красавица Ужасная красавица

Плотный облачный покров долго скрывал от людей настоящий характер этой планеты

ТехИнсайдер
Елки-палки Елки-палки

Как выбрать живую и искусственную елку

Лиза
Ты «чушпан», а я пацан. О чем сериал «Слово пацана. Кровь на асфальте» Ты «чушпан», а я пацан. О чем сериал «Слово пацана. Кровь на асфальте»

Почему «Слово пацана. Кровь на асфальте» стал таким популярным

Psychologies
Фанни Ардан: «Я обязательно вернусь» Фанни Ардан: «Я обязательно вернусь»

Актриса Фанни Ардан о русской культуре и фильме «Дворец»

Grazia
Ничего обнадеживающего: как народные сказки учат нас терпеть абьюз Ничего обнадеживающего: как народные сказки учат нас терпеть абьюз

Отрывок из книги «Архетипы в русских сказках»

Forbes
Сергей Шумский: «У роботов не будет инстинкта власти, как у человека» Сергей Шумский: «У роботов не будет инстинкта власти, как у человека»

Минувший год имеет шансы войти в историю как время взрывного роста нейросетей

РБК
Как справиться с разрывом дружбы: 6 советов Как справиться с разрывом дружбы: 6 советов

Как отгоревать завершение дружеских отношений

Psychologies
Открыть в приложении