Почему ИИ не знает, что у кошки четыре ноги
Важнейшие вопросы, связанные с распространением искусственного интеллекта, оказывается, почти не ставятся и совсем не решаются. По крайней мере, так было до этого интервью

Наш разговор с Игорем Ашмановым, специалистом в области искусственного интеллекта и разработки программного обеспечения, главой компании «Ашманов и партнеры», начался с вопросов: почему многие доступные в России интерактивные сервисы в интернете, где вам отвечает чат-бот с генеративным искусственным интеллектом, на политически и исторически значимые вопросы дают совершенно «не наши», антироссийские ответы? И можно ли что-то с этим поделать?
При том что к американскому GhatGPT напрямую в России не подключиться, практически эта технология доступна на многих сайтах. Да и чат-боты официально российского происхождения могут поговорить с вами на важные темы уклончиво, а то и вовсе не официально и не «по-российски».
Наш собеседник подробно ответил, но затем сам поставил вопрос, причем уже шире. Охарактеризовав популярное направление развития и внедрения в жизнь ИИ как бредогенератор, Игорь Ашманов указал на целый ряд нешуточных опасностей применения этой технологии, особенно в попытках заменить ею общение с человеком, как в госорганах, так и в коммерции, использования ее для принятия важных решений и — на другом уровне, но с далекоидущими последствиями — ее применения учащимися. А также на то, что распространение ИИ сопровождается порядочной безответственностью.
Но есть и позитив. ИИ, не генеративный, нужен нам в промышленности, необходим в военных применениях. А за пределами этих и некоторых других насущных задач мы все еще свободны от того, чтобы скормить ему миллиарды рублей и гигаватты энергии. И у нас есть возможность остаться свободными не только от материальных затрат, но и, что еще важнее, как личности, но это потребует ума — настоящего — и усилий, предпринимать которые мы пока что не разучились.
«Повесточка» в методичках
— Надо начать с самого начала. ChatGPT или другие нейронки с большой лингвистической моделью, LLM, которых сейчас много, в основном производятся в США. Да, недавно был всплеск энтузиазма по поводу китайского DeepSeek. Но даже китайский DeepSeek, если его потрепать и поспрашивать, в некоторых обстоятельствах говорит, что сделали его в американской компании OpenAI, а вовсе не в Китае.
Это не значит, что его там сделали, а значит, скорее всего, что это сборная солянка, Франкенштейн.
Короче говоря, больших лингвистических моделей много, они разные, но все они делаются преимущественно в Америке. И уж как минимум движок, который их оживляет, то есть сама нейронная сетка, нейронный фреймворк, он точно придуман и сделан в США.
Как эти модели учатся, довольно хорошо известно, есть довольно много инструментов для их инструктирования. Существует массовая легенда, которая зацепила и наших людей тоже, что искусственному интеллекту дают просто походить по интернету, выкачать все тексты на свете, после чего он становится очень умным. Но это очень далеко от истины.
Там довольно много ручной работы, и эту работу порой делают десятки тысяч человек. В частности, есть так называемые асессоры, которых нанимают в Нигерии, в Индии и других странах, низкооплачиваемые, по возможности с английским языком, которым дают задание обучать LLM.
Например, есть вопрос к нейронке, ChatGPT или любой другой, и есть пять ее возможных ответов. Асессорам нужно выбрать оценку от «неприемлемо» до «очень хорошо» и поставить пять оценок. При этом существует методичка — страниц на тридцать, как рассказывают участники, — которая объясняет, как именно выставлять оценку, что хорошо, а что плохо.
Вот в этих методичках была «повесточка» в полный рост: и экологическая, и ЛГБТ*, и русофобская, и либеральная, и все, что хочешь. То есть туда закладывалась либеральная модель мира со всей этой ерундой и гадостью последние двадцать пять лет.
* Международное общественное движение ЛГБТ признано в России экстремистским и запрещено.
Наши «отечественные» большие лингвистические модели, которые у нас преподносятся как сделанные с нуля, на самом деле таковыми не являются. В первое время, когда на нашем горизонте появился ChatGPT 3.5, это произошло в январе два года назад, у нас в IT-отрасли и в медиа возникла истерика.
Люди в больших компаниях, которые до этого рапортовали наверх всем, включая самого большого начальника, о том, что у них тоже есть искусственный интеллект, что они в этом очень хорошо понимают и впереди планеты всей, пришли в ужас, потому что ничего подобного сделано не было, а начальник мог бы спросить, почему.
И дальше у них была прямо гонка, как быстро-быстро показать, что у них тоже это есть. Естественно, все было взято заподлицо, с цельнотянутыми движками, с цельнотянутыми данными и так далее, а затем переупаковано, чтобы предъявить и сказать, что у нас есть то же самое.
Поэтому эти большие модели в течение года-полутора как минимум на вопрос, кто тебя сделал, отвечали, что их сделала американская корпорация OpenAI.
Там, в этих наших цифровых гигантах, настолько люди наглые и беспардонные, что они поленились такое правило руками написать: когда спрашивают «кто тебя сделал?», надо сказать, что сделала их компания. Они настолько были уверены, что всем заморочат голову, что поленились сделать это руками. А это, в общем-то, совершенно нетрудно.
— Как можно понять, что полноценной «переупаковки» так и не произошло? Существуют ли интерактивные системы, которые обучались преимущественно на российском контенте? Ведь их широко используют, в том числе учащиеся при подготовке ответов на учебные задания.
— Вы, наверное, слышали истории, когда генеративному ИИ-сервису говорят нарисовать гайку, а он рисует орех. Почему? Потому что в английском языке есть два омонима. Nut — это и гайка, и орех. Сразу видно, что внутри «отечественного» движка запрос сначала переводится на английский, а уж дальше происходит ошибка с выбором не того омонима.
Это прямое доказательство, что это цельнотянутая вещь. Потом, конечно, эта переупаковка стала проникать глубже, но, в общем, наш искусственный интеллект очень вторичен. Нет у нас своих нейронных фреймворков. Нейронный фреймворк — это что-то вроде нейронной операционной системы, которая исполняет поверх себя всякие нейронные ИИ-приложения, в том числе большие лингвистические модели.
Вот этой нейронной операционной системы у нас нет. У нас есть западные нейронки, которые мы скачиваем в исходных текстах (как Linux), здесь компилируем и потом поверх них строим эти большие лингвистические модели, очень часто тоже либо по статьям американцев, либо просто есть готовый код и данные.
А потом берем и запускаем приложения на этих нейронных фреймворках — там разные приложения есть: распознавание лиц, генерация текста, генерация голоса и так далее. Вот это все очень вторично, и все это пронизано западной либеральной повесткой и ненавистью к русским. Это нашим разработчикам ИИ удается каким-то образом замаскировать.