Нейросеть нейросетей
На словах все гладко: по просьбе человека нейросеть может нарисовать эффектную картинку и написать складный текст. На деле получить от ИИ желаемый результат настолько сложно, что для этого появилась новая профессия — промпт-инженер*. Чтобы использовать нейросети в реальной бизнес-практике, нужны отдельные программные продукты. «Цифровой океан» посмотрел, как они создаются.
* Промпт-инженер — это человек, который профессионально составляет промпты, запросы для нейросетей. По прогнозу Bloomberg, в будущем промптинженеры смогут зарабатывать до 335 тыс. долларов в год. Промптинженерии уже обучают крупные онлайн-школы, такие как Udemy и Codeacademy.
В офисе АО «Нейросети» проектор выводит на стену презентацию, в которой все четко и ясно. Пользователь вводит запрос (скорее даже поручение): «Сформулируй идею бизнеса по продаже съедобных стаканчиков из тростника в Индии; придумай логотип и брендинг, упакуй в презентацию». Анимация изображает закипающую работу: ChatGPT пишет тексты, Midjourney создает иллюстрации, третья нейросеть с незнакомым названием верстает из всего этого эффектный коллаж. «А главное, вся работа делается на собственных серверах клиента, поэтому ценные идеи и чувствительная к утечкам информация остаются внутри компании», — добавляет Сергей Курьян, CEO АО «Нейросети».
Очень интересно, но ничего не понятно. Как это — Midjourney работает на серверах клиента? А как в ответ на максимально абстрактный запрос оркестр из нейросетей выдал целую концепцию бренда? Просим Сергея приготовиться: разговор об инновационном продукте «Мультикриейтор» будет долгим.
Инновация 1. Локальные нейросети
Если бы языковая модель GPT-3 обучалась на обычном компьютере, процесс занял бы 355 лет. Такое время потребовалось бы для подбора 175 млрд параметров — числовых коэффициентов, которые определяют работу каждого нейрона в этой гигантской нейросети. Впрочем, стоит ли называть ее гигантской — большой вопрос: актуальная модель GPT-4 почти в 1000 раз больше предшественницы и содержит 170 трлн параметров.
Разработчик языковых моделей компания OpenAI задействует настолько большие вычислительные мощности, что экологи из Массачусетского технологического института взялись подсчитать ее влияние на окружающую среду. Получилось не так много — примерно как пять бензиновых автомобилей. Но и не так мало: в мире компании, обладающие подобными мощностями, можно пересчитать по пальцам. Как же «Нейросети» собираются разворачивать языковые и графические модели на мощностях клиентов?
Дело в том, что обучение нейросети и ее работа — совершенно разные процессы. Процесс подбора тех 170 трлн параметров невероятно ресурсоемкий. Однако когда их значения уже известны, вся GPT-4 занимает всего 45 гигабайт, и гипотетически ее можно скачать на любой компьютер и даже смартфон.
Гипотетически — потому что OpenAI не заинтересована в том, чтобы ее дорогостоящий продукт скачивали все желающие. Зато заинтересованы многие другие разработчики, которые могут обучать свои нейросети на основе GPT-4 по принципу «глубокого обучения» (deep learning) — когда одна нейросеть учит другую. Например, новая нейросеть Vicuna демонстрирует эффективность в 90 % от ChatGPT, хотя это малобюджетный проект.
Сергей Курьян, CEO АО «Нейросети»: «Мы можем развернуть нейросеть практически с любым функционалом на мощностях клиента. При этом мы дообучаем ее, дополняем данными из базы заказчика. Дообучение заключается не столько в изменении параметров нейросети, сколько в добавлении контекста. Что такое контекст, понимает каждый, кто хоть раз пользовался ChatGPT: вместо того чтобы каждый раз писать бесконечно длинный запрос со всеми входящими данными, можно вести с нейросетью диалог, с каждой репликой уточняя свои пожелания. Также мы планируем предложить заказчикам облачный сервис, который будет работать на нашем оборудовании. В этом случае мы также гарантируем защиту от утечек чувствительных данных в сеть».