Что такое интеллект?

В последнее время ведется много дискуссий на тему искусственного интеллекта. Надо заметить, что подавляющая часть выступлений на эту тему имеет околонаучный характер и часто делается не вполне компетентными спикерами, особенно из среды корпоративной бюрократии.
Для большинства людей все эти обсуждения вопросов искусственного интеллекта выглядят загадочно, а для людей с математическим и физическим образованием – крайне сомнительно. Постараюсь объяснить суть вопроса, не прибегая к строгому описанию математических теорий, а ограничившись общими рассуждениями, доступными широкому кругу читателей. Для более содержательного математического обсуждения этих вопросов читатели могут обратиться к Теории соседства и одноименной книге1-2.
1 Завесов А.Л. Теория соседства. (https:// www.researchgate.net/publication/371408887_ TEORIA_SOSEDSTVA)
2 Zavesov A.L. The Neighborhood Theory. (https://www.researchgate.net/publication/377731066_NEIGHBORHOOD_ THEORY)
Сам термин «искусственный интеллект» по сути является лозунгом и никакого глубокого смысла не несет до тех пор, пока мы не поймем, что такое интеллект. Определение интеллекта должно быть общим и не зависеть от того, является ли он искусственным, то есть реализуемым с помощью машин, или естественным, то есть присущим человеку.
В математике существуют неопределяемые понятия, такие как множество, система, точка, прямая и другие. Возможно, интеллект относится именно к таким неопределяемым понятиям. Однако хотелось бы выделить такую характеристику интеллекта, которая отражает его фундаментальную сущность, что должно помочь нам формализовать понимание интеллекта:
Интеллект – это деятельность, результатом которой является способность выработки обобщенных правил, которые позволяют описать исследуемую сущность (систему).
Иными словами, интеллект – это способность делать обобщения, которые приводят к пониманию устройства и функционирования системы.
Интеллект – это понимание через обобщение.
На следующем шаге нам нужно понять, как мы интерпретируем обобщение и как проводить процедуру обобщения. Возможно использовать такой подход:
– Упростим изучаемую систему так, что будет возможно для нее получить какие-то новые законы и закономерности;
– Если полученные законы и закономерности окажутся непротиворечивыми для начальной неупрощенной системы, то мы вполне можем их считать верными в общем случае.
Будем называть изложенный подход Методом непротиворечивого обобщения. Он прекрасно может быть реализован человеком, то есть естественным интеллектом. Но для машинного искусственного интеллекта нужно каким-то образом формализовать указанный процесс, то есть построить математическую модель, содержащую формальную процедуру обобщения.
Далее мы опишем несколько математических моделей, которые в определенной степени решают задачу обобщения. К базовым можно отнести нейросетевую модель и модель Теории соседства: они обе позволяют экстраполировать значение системы в новых точках по известным значениям в каких-то других точках. Генеративные модели позволяют генерировать новые тексты или функциональные распределения, основываясь на известных данных.

Нейронные сети
На сегодняшний день практически единственной базовой используемой моделью обобщения являются нейронные сети. Что они обобщают? Ответ на этот вопрос уходит корнями в 13-ю проблему Гильберта, которая изначально ставилась так: можно ли решить общее полиномиальное уравнение седьмой степени с помощью функций, зависящих только от двух переменных? Владимир Игоревич Арнольд показал, что это можно сделать. Вскоре 13-я проблема Гильберта была расширена и обобщена Андреем Николаевичем Колмогоровым: каждая многомерная непрерывная функция может быть представлена в виде суперпозиции непрерывных функций одной переменной (см. теорема КолмогороваАрнольда). И затем шведский математик Хехт-Нильсен применил теорему Колмогорова-Арнольда к нейронным сетям: любая n-мерная непрерывная функция в Евклидовом пространстве может быть приближена n входными нейронами и (2n+1) внутренними нейронами. Верно и в обратную сторону: любая нейронная сеть может быть приближена многомерной непрерывной функцией. В дискретном случае n параметров функции переходят в мультимножество, и тогда исследуемые функции определены над мультимножествами.
Мы знаем значение многомерной функции в каком-то наборе точек. И так как можно эту функцию приблизить, используя нейронную сеть, то мы можем предсказывать значение функции в любой другой точке из области определения. То есть, построив нейронную сеть, мы задали обобщающее правило, которое позволяет получить неизвестные ранее значения функции в новых точках.
Используемый нейросетевой подход является глобальным в том смысле, что значение вычисляемой функции в каждой точке зависит от всех значений выборки, по которой она строится. То есть изменение значений выборки даже в каких-то далеких отдельных точках приводит к изменению значений функции во всех точках области определения.