Поможет ли искусственный интеллект понять животных?
Умение понимать зверей, птиц, разных букашек, морских гадов — часто встречающийся мотив в мировой культуре. Есть множество разнообразных персонажей, разговаривающих с животными, — от библейского царя Соломона до Гарри Поттера. Для сказочных охотников, шаманов, колдунов беседы со зверями и птицами — обычное дело. Но мы-то не в сказке. Хотя отчасти животных всё-таки понимаем. Если собака рычит, оскалив зубы и прижав уши, то очевидно, что она нам угрожает. Если кошка мяукает перед пустой кормушкой, мы вряд ли ошибёмся, предположив, что она просит есть. Однако это достаточно простые ситуации. Нередко бывает, что наши питомцы своими «монологами» вводят нас в полное замешательство, и тогда волей-неволей начинаешь думать, что тебе сообщают что-то сложное, только язык этот как-то непонятен.
Изучая какой-нибудь человеческий язык, мы начинаем с алфавита, звуков и отдельных слов. Из слов мы учимся составлять предложения, а в устной речи — соблюдать произношение и интонацию, ведь смысл может ощутимо меняться в зависимости от порядка слов и от того, как они звучат. Но у животных нет ни зафиксированных алфавитов, ни словарей. Остаётся только сопоставлять звуки, которые они издают в разных ситуациях, и искать в этих звуках то, что делало бы их похожими на слова и предложения.
Язык китов, каракатиц и котов
Пожалуй, наиболее серьёзные усилия по распознаванию «речи» животных с применением искусственного интеллекта были предприняты в отношении кашалотов.
Голос кашалотов — сухие щелчки разных частот и ритма. Высокочастотные (15 кГц) щелчки киты издают во время эхолокации, прощупывая звуками окружающее пространство в поисках добычи. Щелчками относительно низкой частоты (5 кГц) кашалоты общаются друг с другом. Такие щелчки группируются в короткие ритмические «фразы», называемые кодами. Много лет записывая голоса кашалотов по всему миру, исследователи насчитали около 150 код. Это не значит, что каждый кит использует все полторы сотни последовательностей щелчков; у группы кашалотов в повседневном общении может быть всего лишь пара десятков код. При этом у разных групп есть собственные звуковые подписи. Каждая реплика кашалота завершается серией щелчков определённого ритма и темпа, уникальных для его группы. Например, у одних кашалотов финальные щелчки идут через равные промежутки времени, другие же делают паузу перед последним звуком. Предполагается, что коды указывают направление движения, помогают искать еду и в целом работают на укрепление социальных связей. В поисках добычи кашалоты разбредаются друг от друга довольно далеко, и позывные позволяют им потом снова собраться вместе.
Но полторы сотни «фраз» для полноценного языка как-то маловато, особенно если учесть, что у каждого отдельного кита лексикон намного меньше. На самом деле, 150 код — это результат относительно простого анализа, не улавливающего многих звуковых вариантов и оттенков. Уловить их помог искусственный интеллект. Методы машинного обучения позволяют выявить в большом массиве данных характерные комбинации элементов, их взаимосвязи, узоры или, как часто говорят, паттерны. Ища и находя эти комбинации, ИИ одновременно отмечает, насколько они друг от друга отличаются. И если данных действительно много, алгоритм в конце концов сможет воспроизвести эти паттерны.
В прошлом году в Nature Communications была опубликована статья, авторы которой отдали ИИ более 8700 звуковых фрагментов, записанных при исследовании нескольких десятков китов, принадлежавших к крупной, в четыре сотни особей, восточно-карибской группе кашалотов. Обычно коды кашалотов классифицируются по продолжительности и ритму: одни фразы получаются длинными, другие короткими, в некоторых паузы между щелчками относительно большие, а где-то щелчки идут друг за другом вплотную. ИИ обучился достаточно хорошо, чтобы правильно договаривать неполные коды, которые ему отдавали сверх учебного материала.
С помощью ИИ удалось выяснить, что кашалоты иногда навешивают на коды несколько финальных добавочных звуков, и чаще это бывает с короткими кодами. Они всё равно остаются короткими, то есть довесок не делает фразу значительно длиннее. Звуковые виньетки имеют место в определённых ситуациях: например, когда кит, плывущий сзади, присоединяется к щёлканью лидера группы или же берёт паузу в общении, или когда он замолкает. Другая модификация — изменение темпа код. Решив замедлить или ускорить свою «речь», кашалот ускоряет или замедляет несколько идущих друг за другом код. Слушая друг друга, киты подстраивают темп своих «фраз» под товарища, то есть если один кашалот ускорился в разговоре, то и другой, вступающий следом за ним, тоже ускорится, даже если оба они произносят разные «фразы».
За кашалотами этого клана наблюдают давно, и считалось, что они используют всего двадцать одну коду из известных ста пятидесяти. Но с учётом новых результатов получается, что в их распоряжении около трёх сотен код. Есть искушение уподобить добавочные концевые звуки суффиксам и окончаниям либо предлогам; правда, для изменений темпа такой очевидной аналогии уже не подобрать. С языковыми аналогиями лучше вообще быть поосторожнее, потому что неизвестно, несут ли они какую-то добавочную информацию модификации «фраз», как соотносятся с исходными «фразами», насколько меняют их смысл. Скажем, можно предположить, что если кит меняет темп код в ответ на чужое замедление или навешивает на них добавочные звуки, то он таким способом просто подтверждает социальную связь. Тогда это похоже на дружеское похлопывание по спине: приятели могут хлопать друг друга слева или справа, один раз или несколько, но смысл в любом случае остаётся тот же — они рады встрече.
Так или иначе, благодаря ИИ удалось узнать, что элементы «языка» кашалотов пластичны и меняются в зависимости от социального контекста. У кашалотов из разных групп отличаются не только звуковые сигналы, но и поведение в целом: они по-разному ведут себя с детёнышами, плавают другими маршрутами. Семьи одного клана могут объединяться друг с другом, а семьи из разных кланов — нет (по крайней мере, специалистам подобные случаи неизвестны). И специфическая манера щёлкать у кашалотов не врождённая, они обучаются клановым сигналам у старших китов. В таком контексте варианты код выглядят как часть большой картины поведенческих различий, индивидуальных и групповых. Соответственно, изучая разговоры кашалотов, можно узнать что-то новое об «общекультурной», социально-поведенческой динамике в их популяциях.
Перещёлкиваются между собой не только кашалоты, но и косатки, и дельфины, и другие зубатые киты. Усатые киты звучат иначе: они известны долгими протяжными песнями с очень сложным звуковым спектром, не чета щелчкам и посвистам кашалотов и дельфинов. Считается, что песни усатых китов несут сугубо социальные функции, но изучены они пока что слабо. Водных животных изучать вообще трудно, одних только звукозаписей тут недостаточно: чтобы узнать, что означает та или иная китовая песня, звуковая модификация, нужно регистрировать поведение китов, записывать их на видео, и чем больше таких записей, тем лучше.
Впрочем, некоторых водных обитателей можно изучать в аквариуме. Недавно был запущен масштабный исследовательский проект с каракатицами: предполагается собрать большую базу данных их движений и отдать её на анализ ИИ. Каракатицы — известные мастера менять расцветку, они способны изобразить на себе самые разные узоры, и далеко не всегда эти узоры нужны для маскировки: перемена окраски у каракатиц порой происходит по каким-то внутренним причинам, и есть все основания полагать, что так они общаются друг с другом.
