«ИИ для химии»: есть ли такие задачи, которые не под силу ИИ?

Наука и жизньНаука

ИИ в химии и не только

Рассказывает академик Валентин Анаников, доктор химических наук, заведующий лабораторией металлокомплексных и наноразмерных катализаторов Института органической химии им. Н. Д. Зелинского РАН. Беседу ведёт Наталия Лескова.

Фото Наталии Лесковой

Валентин Павлович, искусственный интеллект в химии — это какие-то специальные системы, обученные исключительно на химических данных, или некие универсальные языковые модели?

— Когда мы говорим об искусственном интеллекте в химии, чаще всего имеем в виду системы машинного обучения. Их сегодня активно используют учёные, и создаётся впечатление, что произошёл резкий скачок — повсюду статьи, гранты, проекты. На самом деле первые эксперименты с машинным обучением в химии начались несколько десятков лет назад, и постепенно это вошло в исследовательскую практику. Настоящий бум наступил тогда, когда появились большие языковые модели и чат-боты. Они открыли новый интерфейс — возможность общаться с программой на обычном человеческом языке. Мы буквально разговариваем с технологиями, и они отвечают нам.

— Это хорошо для научной работы?

— Хорошо это или плохо — вопрос дискуссионный. Но ИИ стал частью жизни миллионов людей, а вместе с этим изменилось и восприятие технологий ИИ. Если раньше нейросети были доступны только узкому кругу специалистов, то сегодня любой школьник или студент может взаимодействовать с ними. Для исследователей сейчас ключевой поворот состоит в том, что искусственный интеллект перестал быть самоцелью. Ещё недавно внимание было сосредоточено на разработке самих алгоритмов, архитектур нейросетей, методов обучения — то есть ИИ развивали ради самого ИИ. Такие работы, безусловно, важны и они продолжаются, но сегодня это уже не доминирующее направление. Главный тренд заключается в другом: мы вошли в фазу, которую называют «Эпохой искусственного интеллекта для…». То есть «ИИ для химии», «ИИ для биологии», «ИИ для медицины», «ИИ для инженерии» и даже «ИИ для гуманитарных наук». Количество проектов, где ИИ используется как инструмент для решения конкретных прикладных задач в разных областях, сейчас во много раз превышает число проектов, нацеленных на развитие самого искусственного интеллекта. И это естественный путь зрелости технологии: от экспериментов ради экспериментов — к повседневному инструменту, который помогает двигать вперёд науку и общество*. Выражение «ИИ для…» даже успело стать крылатой фразой, которая по-английски пишется как AI4 («for» сокращают цифрой «4»).

* Подробнее см. статью: Анаников В. П. Эпоха «ИИ для» и интеллектуальная инфраструктура науки и инженерии XXI века. Аддитивные технологии, 2025, № 3, 10—13.

— А в вашей лаборатории какой «ИИ для…»?

— Первые концептуальные лекции о том, как искусственный интеллект можно реально применять в химии, я читал примерно 4—5 лет назад. И за это время всё существенно изменилось. Если вначале речь шла в основном о том, как использовать методы глубокого машинного обучения для решения отдельных научных задач, то сегодня уже сформировалась целая иерархия уровней применения ИИ. В нашей лаборатории разработана специальная классификация ИИ-систем в науке — ассистент, аналитик и исследователь.

Приведу конкретный пример из нашей практики. Мы работали с массивами данных, полученных на масс-спектрометре. Представьте: всего за один рабочий день — 8 часов непрерывной работы прибора — накапливается такой объём информации, что для её расшифровки вручную с помощью традиционного программного обеспечения потребовалось бы примерно четыре года. А если прибор работает непрерывно неделю, то это уже более 50 лет расшифровки! Очевидно, что человеческими силами такие данные обработать невозможно: исследователь вынужден ограничиваться малой частью информации, выбирая самое простое, а значительная и зачастую самая интересная часть так и остаётся лежать «мёртвым грузом» на жёстких дисках.

Вот тут и проявляется сила нейронных сетей. Они способны анализировать данные в десятки тысяч раз быстрее. Если сеть обучена и хорошо протестирована, то обработка спектра, на которую у человека ушли бы годы, занимает менее часа. Ускорение в 20—30 тысяч раз превращает невыполнимую задачу в рутинную операцию и открывает новые научные возможности.

Но здесь важно подчеркнуть: нейросеть не берётся «с потолка». Её нужно создать, запрограммировать, обучить и протестировать. Поэтому сегодня в химических лабораториях особенно ценятся специалисты двойного профиля: химики, умеющие программировать, и программисты, готовые погрузиться в специфику химии. Только объединяя эти компетенции, можно действительно использовать потенциал ИИ и работать с лавиной данных, которая каждый день обрушивается на науку.

Валентин Павлович Анаников. Фото Наталии Лесковой

— И что же делать с тем количеством информации, которое обрушивается на учёных?

— Нейронные сети позволяют превратить эту лавину в осмысленные выводы. Алгоритмы ИИ обрабатывают массивы данных, формулируют гипотезы и сводят результаты к компактным формулировкам. В итоге вместо хаоса избытка информации мы получаем конкретные направления для будущих исследований.

К примеру, опытный химик, за плечами которого 10—15 лет работы, способен взглянуть на структуру молекулы и сразу сказать, насколько она сложная. Причём сложность — это не только размер, а целый комплекс характеристик: внутренняя связность, типы функциональных групп, их взаимное расположение и многое другое. Профессионал может почти «на глаз» поставить оценку: 7 баллов по десятибалльной шкале, 8 или 9. Это считалось чисто интуитивной задачей, не поддающейся формализации.

Однако мы смогли обучить нейронную сеть воспроизводить такую экспертизу. Для этого 50 специалистов дали три сотни тысяч оценок молекулам по уровню сложности, и на этих данных была обучена система ИИ, которая научилась предсказывать результат с высокой точностью. По сути, мы использовали алгоритм Learning to Ranank — это метод машинного обучения, который позволяет выстраивать объекты (в нашем случае молекулы) по относительной «сложности» на основе накопленных экспертных оценок. Такой подход часто применяют в поисковых системах, чтобы ранжировать результаты, а мы адаптировали его для химии.

Если говорить образно, фактически ИИ перенял у человека часть интуитивного восприятия — то, что раньше казалось исключительно человеческой прерогативой. Это ключевой шаг: от простой обработки данных ИИ постепенно переходит к области, где раньше оперировала только человеческая интуиция и опыт. Нейронные сети, которые копируют и тиражируют такие интуитивные действия человека, — крайне интересное явление. Здесь открывается целое поле для размышлений: что ещё из области человеческого опыта и интуиции может быть перенесено в цифровую форму? Конечно, нужно отметить, что это единичный и ограниченный пример — речь ни в коем случае не идёт о замене всей человеческой интуиции, а лишь о её локальной цифровой имитации в конкретном проекте.

— То, что ИИ можно обучить даже интуиции, звучит поразительно!

— Тем не менее это так. Приведу ещё один пример из нашей практики. Мы много лет изучаем механизмы реакций, и за десятилетия накопились гигабайты экспериментальных данных, которые частично так и оставались нерасшифрованными. Мы вернулись к этим массивам и с помощью нейронных сетей нашли новые вещества и реакции, которые в своё время остались незамеченными. Это напоминало сюжет фильма «Назад в будущее»: анализируя старые данные, мы словно совершали путешествие во времени и открывали то, что давно было перед глазами, но оказалось скрыто.

Здесь проявляются два ключевых момента. Первый — ИИ выступает в роли генератора гипотез. Если алгоритму задать исходные условия реакции — исходные компоненты, реагенты, катализаторы, растворители, — он способен сгенерировать много вариантов возможных химических реакций и их продуктов. Для небольшой системы это может быть, например, десять тысяч гипотез. Казалось бы, подобная когнитивная функция присуща только человеку, но нейросети уже неплохо справляются с этой задачей.

Далее подключается ИИ-аналитик. Его задача — проверить гипотезы: сопоставить каждую из них с экспериментальными спектрами и выделить те, которые действительно подтверждаются наличием нужных сигналов в спектрах. Таким образом, из десяти тысяч возможных гипотез отбирается та, которая наилучшим образом соответствуют изучаемому природному явлению. Человек тоже мог бы так сделать, но перебрать десять тысяч вариантов и проверить каждый — это работа не на одну человеческую жизнь. У специально обученного и заранее протестированного ИИ на эту задачу уйдёт примерно один день.

— Вас не пугает такой рост возможностей ИИ?

— Меня лично это совершенно не пугает. ИИ эволюционирует — это уже продвинутый инструмент, и в будущем может превратиться, в определённом смысле, в партнёра в проведении научных исследований.

— Есть ли такие задачи, которые не под силу ИИ?

— На всех трёх иерархических уровнях ИИ — ассистент, аналитик и исследователь — ключевой проблемой остаётся анализ достоверности данных. Нейросети нередко ошибаются: при решении сложных, многошаговых и вариативных задач вероятность ошибки существенно возрастает. Поэтому окончательная функция всегда остаётся за человеком — проверить, убедиться, перепроверить. Для химиков сделать проверку несложно, потому что критерием истинности является практика. Алгоритм может предсказать перспективный катализатор, но только эксперимент — его синтез и проверка — подтвердит, работает он или нет. То же самое при расшифровке спектров: даже если ИИ предлагает десять тысяч возможных структур и выделяет из них десять лучших, эти десять лучших кандидатур человек всё равно проверит вручную. ИИ ускоряет и расширяет поиск решений, но ответственность за достоверность результата пока — и, вероятно, ещё долго — остаётся за человеком.

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Открыть в приложении