О том, как научить искусственный интеллект понимать, а не угадывать химию

Наука и жизньНаука

Глаз-синхротрон

Беседу ведёт Наталия Лескова

Богдан Олегович Проценко. Фото Виктора Шаповалова

Рентгеновская спектроскопия поглощения — один из самых мощных инструментов изучения вещества. Однако до сих пор расшифровка спектров напоминала детектив с открытым финалом: учёные тратили месяцы на интерпретацию данных, полагаясь на опыт, интуицию и сложные расчёты. Теперь, благодаря методам, основанным на машинном обучении, этот процесс занимает всего несколько минут.

О том, как научить искусственный интеллект понимать, а не угадывать химию, рассказывает Богдан Проценко, лаборант-исследователь Международного исследовательского института интеллектуальных материалов Южного федерального университета (МИИ ИМ ЮФУ).

— Богдан Олегович, что такое рентгеновская спектроскопия и зачем она нужна?

— Это метод исследования вещества. У физиков, как у детей: чтобы понять, что внутри, надо вещь или сломать, или воздействовать на неё чем-то, и уже по результату, отклику делать выводы. Чтобы понять, что арбуз сладкий, достаточно просто похлопать по нему. А вот когда мы переходим к атомам и молекулам, мельчайшим деталям их строения и функционирования, к тому, как вообще устроена материя вокруг нас и почему она такая, а не какая-то другая — всё становится намного сложнее. Нет там «правды», которую можно увидеть глазами: размеры систем много меньше длины волны видимого света, а энергии процессов много больше. Дифракционный предел (который также называют критерием Рэлея или критерием Аббе) ограничивает минимальные размеры того, что можно увидеть. Но если взять длины волн, сопоставимые с размерами атомов и расстояниями между ними, то мы обойдём этот предел и окажемся в рентгеновском диапазоне.

Когда мы светим на вещество рентгеновским излучением, оно рассеивается либо с сохранением энергии, упруго, как говорят физики, либо неупруго, теряя или приобретая энергию после рассеивания. Первый вариант называется дифракцией — это отличный метод исследовать структуру упорядоченных объектов, например кристаллов. Рассеянное на кристаллической решётке рентгеновское излучение интерферирует, давая максимумы и минимумы на разных углах отражения. Но для этого нужен дальний порядок расположения атомов. А вот второму варианту, собственно рентгеновской спектроскопии, это уже безразлично.

Макет строящейся установки СИЛА (СИнхротрон + ЛАзер). Она объединит в себе сразу две установки: лазер на свободных электронах (с энергией 6 ГэВ) и синхротрон. За макетом — Богдан Проценко. Фото: Фото Назара Чубкова

Мы светим рентгеновским излучением разных энергий на вещество и смотрим, как оно поглощается. Это и есть рентгеновская спектроскопия. По форме зависимости поглощения излучения от его энергии, которая и называется спектром рентгеновского поглощения, можно понять, как в веществе расположены атомы и в каком химическом состоянии они находятся. При буквальном переводе с латыни spectrum — «образ», «душа», что как бы подчёркивает, что спектр отражает некоторые уникальные внутренние особенности объекта.

Идея рентгеновской спектроскопии в общем-то простая: раз рассеяние у нас неупругое, то есть часть излучения поглощается, теряет энергию, — значит, эта энергия на что-то расходуется. А идёт она на то, чтобы выбить электроны в атомах со своих «насиженных» мест и отправить их прочь из атома. Выбитый электрон тратит полученную энергию на то, чтобы преодолеть притяжение атома и затем столкнуться с соседними атомами. Ситуацию, когда излучение выбивает электроны из вещества, мы называем фотоэффектом, выбитый электрон — фотоэлектроном, а такого рода рассеяние на соседях с наложением результатов — интерференцией. В сущности, рентгеновская спектроскопия — это интерференция фотоэлектронов, где интерференционной решёткой служит сама материя. Разного рода интерферометры принадлежат к классу самых точных измерительных приборов, взять хотя бы обсерваторию LIGO, где впервые зафиксировали гравитационные волны.

В микромире между частицами и волнами нет чёткой грани — это так называемый корпускулярно-волновой дуализм. Поэтому на вылетевший электрон в силу квантовых эффектов можно смотреть как на волну, которая рассеивается на соседях, накладывается сама на себя и т. д. Представьте себе, что вы кинули в воду камень, и от его падения пошли волны на воде — вот это как бы выбитый электрон. Волны встречают препятствия, отражаются, эти вторичные отражённые волны накладываются уже на первую волну и друг на друга — получается интересная интерференционная картина. При разных энергиях излучения, то есть если с разной силой «пинать» электрон, интерференционная картина будет разной. Вот почему форма зависимости поглощения от энергии содержит в себе информацию как о локальном окружении атомов, так и об их электронной структуре. Примерно как в аналогии с кругами на воде, только с поправкой на то, что все процессы носят квантовый характер: получается, что фотоэлектрон, будучи одной (!) частицей, вполне прекрасно рассеивается сам на себе и учитывает в момент своего вылета (ещё до рассеяния на соседях, как бы «зная будущее наперёд») все возможные варианты того, как он сможет после вылета рассеяться на соседях. Если вам это кажется захватывающим — поздравляю, вы в шаге от вступления в наш клуб спектроскопистов!

— Что нужно, чтобы получить рентгеновский спектр какого-нибудь соединения?

— Понятное дело, что для рентгеновской спектроскопии нужен собственно рентген, и во всём мире строятся огромные установки для генерации очень яркого и сфокусированного излучения. Это синхротроны и рентгеновские лазеры на свободных электронах — монструозные устройства, способные генерировать излучение в миллионы раз ярче Солнца с микро- и фемтосекундным разрешением… На таких сложных и дорогих устройствах, занимающих, как правило, площадь очень большого здания, находится сразу несколько лабораторий — их называют линиями, или каналами, где каждая лаборатория реализует свою методику исследования. Возможности рентгеновской спектроскопии огромны, потому неудивительно, что существует корреляция между научно-техническим уровнем страны и количеством подобных установок. Учёные обычно пишут заявку на то, чтобы получить возможность провести измерения на одной из них, и, если она выигрывает, приезжают командой, с оборудованием и образцами, и проводят измерения круглосуточно — там каждый час на счету. Экспериментальная работа на таких установках позволяет получать уникальные данные, ценные практически в любой области, от искусствоведения и истории до геологии экзопланет, структурной биологии, катализа и материаловедения. Например, структура подавляющего большинства белков человечеству известна во многом благодаря синхротронам.

— Насколько я знаю, в нашей стране на данный момент всего одна такая установка — в Курчатовском институте.

— Да, это Курчатовский источник синхротронного излучения («КИСИ-Курчатов»). Кроме него есть ещё два ускорителя в Новосибирске (ВЭПП-3 и ВЭПП-4), которые часть времени работают на генерацию синхротронного излучения. Ещё активно строятся или планируются новые, например СКИФ (Сибирский Кольцевой Источник Фотонов), СИЛА (СИнхротрон+ЛАзер), РИФ и другие. Думаю, нам в Ростове один, пусть и небольшой ускоритель, тоже бы не помешал.

— Какие всё это решает фундаментальные задачи?

— Спектроскопия рентгеновского поглощения — это один из важнейших инструментов, необходимых для того, чтобы узнать, как на самом деле устроено вещество вокруг нас. Иными словами, понять на атомарном уровне устройство материи, какая она, почему и как функционирует.

Причём ограничений на состояние образца нет, рентгеновская спектроскопия применима для любого агрегатного состояния вещества и может применяться прямо в процессе работы (в этом помогает проникающая способность рентгена), например, можно исследовать, как деградируют катализаторы прямо в ходе реальной реакции или как стареют литий-ионные батареи в циклах зарядки-разрядки. Её используют и для изучения биологических объектов (в частности, металлических центров в белках), для диагностики конструкционных и функциональных материалов, в том числе для микроэлектроники.

Фото Назара Чубкова

— Что представляет собой ваша разработка?

— Наша разработка — это метод для быстрого и точного анализа данных спектроскопии рентгеновского поглощения, основанный на искусственном интеллекте или машинном обучении. Мы с вами говорили про то, как много полезной информации содержится в рентгеновских спектрах и как их измеряют, но ни слова про то, как их, собственно, анализируют. А это очень непросто. Мы не видим отдельные атомы и их состояние, но видим некоторую сложную общую картину. Как будто бы это какая-то тень, отбрасываемая объектом, но не сам объект. А как восстановить объект по отбрасываемой им тени? Если структура однозначно определяет спектр, то спектр не всегда однозначно определяет структуру. В математике даже есть термин для такого рода задач — некорректные обратные задачи. Наша разработка посвящена тому, как решить эту некорректную задачу: с помощью машинного обучения построить алгоритм получения структуры из спектра.

У спектра рентгеновского поглощения есть две основные области: тонкая структура вблизи края поглощения (XANES) и протяжённая тонкая структура поглощения после края (EXAFS). Последняя, поскольку в ней доминирует рассеяние на соседях, позволяет исследователь в большей степени геометрические параметры (то, как расположены атомы), и для неё существует формула, подгоняя которую к данным, учёные получают структурные параметры вещества. А вот для XANES, где есть вклад в рассеяние и геометрии локального окружения и электронного состояния атомов, такой формулы нет. И не будет никогда. Так уж устроена наука, что только в школе всё понятно и для всего есть уравнение, решаемое аналитически, в жизни и науке, увы, не так. Перед нами ларец с ценнейшей информацией, но ключа у нас от него нет… Потому исследователям остаётся либо с весьма ограниченной точностью численно моделировать простейшие системы на суперкомпьютерах, чтобы понять какие-то закономерности, либо сравнивать неизвестную систему с известными.

Спектр каждого материала уникален, и его особенности — как отпечаток пальца человека. Поэтому этот метод так и называется — «метод отпечатка пальца». Исследователи берут библиотеку спектров веществ-эталонов и пристально вглядываются в то, что у этих спектров есть общего и различного с неизвестным спектром. Хотя звучит это не очень точно, надёжно и воспроизводимо… Иными словами, исследователи потратили огромные усилия и деньги, чтобы построить синхротроны, провести на них измерения, — и не могут из этих данных извлечь полезную информацию. Однако давайте приглядимся к последнему методу внимательнее — в нём мы собираем выборку, или библиотеку данных, и на её основе ищем закономерности, воспользовавшись которыми, пытаемся сделать вывод или предсказание для новых данных. Ничего не напоминает? Да это же просто пресловутое машинное обучение, раздел столь популярного ныне искусственного интеллекта!

Авторизуйтесь, чтобы продолжить чтение. Это быстро и бесплатно.

Регистрируясь, я принимаю условия использования

Рекомендуемые статьи

Белеет парус на болоте Белеет парус на болоте

Чем так уникален нерукотворный природный парус — белокрыльник болотный?

Наука и жизнь
Астероидные кольца, сила гравитации и сжатие звездного облака: откуда взялась Луна Астероидные кольца, сила гравитации и сжатие звездного облака: откуда взялась Луна

Почему ни одна из гипотез не может объяснить, как на самом деле «родилась» Луна

Maxim
О чем пишут научно-популярные журналы мира О чем пишут научно-популярные журналы мира

Какую информацию хранит мед и какой ущерб наносят неликвидированные скважины?

Наука и жизнь
Как избежать ошибок на переговорах Как избежать ошибок на переговорах

Распространенные просчеты в оффлайн- и онлайн-переговорах и как их избежать

Inc.
Зеленый дракон Зеленый дракон

Как Китаю удалось пройти путь от «угольной коптилки» до лидера энергоперехода

ТехИнсайдер
Банановые перспективы российских субтропиков Банановые перспективы российских субтропиков

Инвесторы хотят импортозаместить экзотические фрукты

Агроинвестор
Зазеркалье времени: лучшие экранизации «Алисы в Стране чудес» — от немого кино до голливудского фэнтези Зазеркалье времени: лучшие экранизации «Алисы в Стране чудес» — от немого кино до голливудского фэнтези

Самые значимые экранизации «Алисы»: как каждая из них отражает свое время

Правила жизни
Опять и опять «Назад в будущее» Опять и опять «Назад в будущее»

Краткая история ленты «Назад в будущее», вырастившей последнее поколение XX века

Weekend
В России художник — пророк В России художник — пророк

Что и как видит художник и зачем вообще нужны искусствоведы

Монокль
Дейнотерий – слон с берегов Дона Дейнотерий – слон с берегов Дона

Слоны – одни из самых стабильных в эволюционном плане животных...

Наука и техника
Через санкции к росту Через санкции к росту

Как российская экономика ищет способы сотрудничества с глобальными игроками

Эксперт
Роботы против дефицита Роботы против дефицита

Роботизация помогает бизнесу, но требует новых специалистов

Ведомости
Буль-буль Буль-буль

Фантастический рассказ Владислава Кулигина «Буль-буль»

Знание – сила
Команда спасателей Команда спасателей

Справляемся с отпускными кризисными бьюти-ситуациями

Moodboard
В такси на Дубровку В такси на Дубровку

Ищешь живописное место для фотосессии? Советские фильмы знают ответ!

Лиза
Как отличить борщевик от дудника и других зонтичных растений Как отличить борщевик от дудника и других зонтичных растений

Как не спутать борщевик его с безобидными товарищами

Maxim
Главное – остаться незамеченным Главное – остаться незамеченным

В чем состоит военная (а возможно, и не только) хитрость стелс-технологии?

Наука и техника
Быстрый платеж Быстрый платеж

Оплата покупок по QR-коду: в чем выгода и в чем подвох

Лиза
Как работает автофокус в фотоаппарате? От сенсора до мотора в объективе Как работает автофокус в фотоаппарате? От сенсора до мотора в объективе

Как работает автофокус: подробно и со схемами

ТехИнсайдер
О пользе «бумажной волокиты» О пользе «бумажной волокиты»

На каком языке говорили евреи, вернувшиеся из вавилонского пленения?

Знание – сила
Сделано с заботой: о новой отчетной нагрузке Сделано с заботой: о новой отчетной нагрузке

Постараемся разобраться в правовой основе требований для налогоплательщиков

Ведомости
Снижение конденсационных следов от самолетов назвали важной климатической мерой Снижение конденсационных следов от самолетов назвали важной климатической мерой

Чтобы снизить влияние авиации на климат, лучше сосредоточиться на следах

N+1
Чистая правда Чистая правда

Хорошо умываться – значит, до «скрипа» кожи? Все с точностью до наоборот

Лиза
«Снимаешь парик и чувствуешь себя голой»: как живут женщины с алопецией «Снимаешь парик и чувствуешь себя голой»: как живут женщины с алопецией

Истории женщин, которые научились жить с алопецией и помогают другим

Forbes
Чернохвостые оленихи унаследовали миграционные маршруты матерей Чернохвостые оленихи унаследовали миграционные маршруты матерей

Как самки оленей учатся мигрировать у собственных матерей

N+1
Откуда что пошло на флоте Откуда что пошло на флоте

Повседневная жизнь на парусном военном корабле XVIII века

Наука и техника
Неандертальцы наследили на португальских пляжах Неандертальцы наследили на португальских пляжах

Археологи обнаружили на португальском побережье отпечатки ног неандертальцев

N+1
Олег Нестеров — об Александре Кнайфеле и пределах невозможного Олег Нестеров — об Александре Кнайфеле и пределах невозможного

Музыкант Олег Нестеров — о музыке, которую сегодня стоит услышать каждому

РБК
Как откручивать шкив коленвала и в какую сторону Как откручивать шкив коленвала и в какую сторону

Все о снятии шкива коленвала: инструменты, последовательность, как крепится

РБК
Музей как увлечение Музей как увлечение

Единственный в своем роде: музей при Институте космических исследований РАН

Знание – сила
Открыть в приложении