Программисты, визионеры и гении бизнеса: кто придумал ChatGPT и куда они его ведут
В числе тех, кому мы обязаны появлением нашумевшего за последние несколько месяцев чат-бота ChatGPT, программист с российскими корнями, уроженка Албании, работавшая до OpenAI во французской аэрокосмической компании и помогавшая разрабатывать Tesla Model X, а также серийные предприниматели, трудоголики и техно-энтузиасты из Кремниевой долины. Как они сейчас рассказывают, никто из них не ожидал того бума, который вызвала очередная версия их продукта. Как зародилась идея ChatGPT и какие цели преследуют ее создатели?
За последний год искусственный интеллект (ИИ) стал мейнстримом. В начале февраля 2023 года количество пользователей чат-бота на основе языковой модели с генеративным искусственным интеллектом ChatGPT достигло 100 млн человек. С его помощью уже как минимум одному студенту удалось успешно защитить диплом, а в электронном книжном магазине Amazon в феврале насчитывалось около 200 книг, написанных ChatGPT, в том числе книга с названием «Как писать и создавать контент с помощью ChatGPT».
У огромного количества людей, которые активно взялись тестировать возможности генеративного ИИ — от журналистов до экспертов по новым технологиям и венчурных инвесторов — появилась новая тема для обсуждений и продуктивных дискуссий о том, как ChatGPT может повлиять на ментальные способности людей, на рынок труда в самых разных сферах и на расстановку сил в мире технологических гигантов.
Звездный час генеративного ИИ
Чат-бот ChatGPT, созданный компанией OpenAI, работает на основе технологии, которую принято называть «генеративный искусственный интеллект». Эта технология позволяет создавать новый оригинальный контент на основе большого объема данных и алгоритмов машинного обучения. Таких инструментов существует на рынке довольно много, ChatGPT — не единственный в своем роде. Например, другая популярная нейросеть, Midjourney умеет по текстовому описанию генерировать изображение. Однако пока еще ни одной нейросети не удавалось достичь такой виральности, как у ChatGPT.
По словам Сэма Олтмена, генерального директора OpenAI, за пять дней после запуска чат-бота им воспользовался 1 млн человек. А уже к январю количество пользователей достигло 100 млн. TikTok потребовалось девять месяцев, чтобы достичь такого же успеха, а Instagram (соцсеть признана в РФ экстремистской и запрещена) — два с половиной года. Для сравнения, на сервере Midjourney в Discord сейчас 13,4 млн участников. Финансовый холдинг UBS называл ChatGPT самым быстрорастущим приложением в истории.
ChatGPT вызвал такой интерес отчасти благодаря сравнительной простоте и доступности — бесплатная бета-версия сейчас доступна для всех и работает по крайней мере на 95 языках. При этом она умеет писать длинные тексты, отвечать на вопросы и составлять практически любые материалы: бизнес-планы, рекламные стратегии, шутки, сценарии фильмов, приглашения на вечеринку и многое другое. Например, в феврале 2023 году ChatGPT сдал медицинский экзамен United States Medical Licensing Examination (USMLE), который дает право работать врачом в США. Результаты этой нейросети обошли модель, которая обучалась исключительно на медицинской литературе — PubMedGPT.
Этому триумфу предшествовали долгие годы предварительной подготовки и научных исследований в области машинного обучения и языковых моделей. ChatGPT создан на основе языковой модели GPT-3, разработанной OpenAI еще в 2020 году; перед этим были GPT and GPT-2 (от английского Generative Pre-trained Transformer — генеративный предобученный трансформер), появившиеся еще в 2018 и 2019 годах. Изначально компания OpenAI придумала сделать чат для общения с ИИ, чтобы улучшить свои большие языковые модели (LLM), в частности, GPT-3. Модель стала одной из самых мощных LLM в мире — она работала на основе 175 млрд параметров и обучалась примерно на ⅔ данных со всего интернета.
В марте 2023 года компания запустила еще более продвинутую версию — GPT-4, которая, если верить обещаниям разработчиков, работает на основе уже 100 трлн параметров, умеет распознавать не только текст, но и картинки, а также реже ошибается и стала креативнее. Предыдущую версию уличали в предвзятости и подлоге научных исследований, а новая, как утверждают разработчики, менее склонна к такому деструктивному поведению.
«На порядок меньше хайпа»
В середине ноября, как рассказывает The New York Times со ссылкой на сотрудников OpenAI, команда получила неожиданную задачу — за две недели выпустить чат-бот под названием Chat with GPT-3.5. Это смутило некоторых сотрудников, так как весь год компания работала над моделью GPT-4, которая была почти готова. Планировалось, что новая нейросеть выйдет в начале 2023 года вместе с несколькими чат-ботами, с помощью которых пользователи могли бы опробовать GPT-4.
Но руководство беспокоилось, что конкурирующие компании выпустят свои чат-боты с ИИ до запуска до GPT-4. А приложение, работающее на старой версии, поможет быстрее собрать обратную связь для улучшения GPT-4.
По другой версии, которую излагает Fortune, идея выкатить на широкую аудиторию чат для более эффективного обучения модели появилась у одной из команд внутри компании. Чат-бот казался им отличным решением, потому что тогда бы нейросеть регулярно получала обратную связь. В итоге в начале 2022 года команда начала создавать проект, который стал ChatGPT.
Есть и третья версия — ее предлагают в эксклюзивном интервью изданию MIT Technology Review четверо топ-менеджеров компании, включая сооснователя Джона Шульмана. Согласно их рассказу, ChatGPT представляет собой слегка улучшенную версию уже существовавшей модели для обучения InstructGPT, в которую добавили данные для разговорной речи и слегка изменили процесс обучения. По их словам, именно разговорные модели, судя по всему, стали тем секретным ингредиентом, который обеспечил популярность чата.
Они говорят также, что, поскольку этот чат-бот представлял собой по сути лишь слегка модифицированный в исследовательских целях предыдущий продукт, они не придавали этому запуску большого значения, и вызванный им хайп их самих сильно удивил. «Был период, когда вся моя лента в соцсети практически полностью состояла из скриншотов ChatGPT, — говорит Джон Шульман. — Я предполагал, что этот чат-бот интуитивно понятен людям, и надеялся, что он вызовет интерес, но такого уровня массовой популярности я не мог ожидать».
В этой части все три версии сходятся — ни основатели, ни сотрудники не предполагали, что выпускают мегахит. Официально OpenAI отказалась комментировать статью The New York Times про гонку вооружений ИИ и ChatGPT в частности. Но, по информации неназванных источников, некоторые из сотрудников скептически отнеслись к возможному успеху ChatGPT. Они считали, что модель двухлетней давности покажется людям скучной.