Вы молекулы называете? Нет, просто переводим...
Мы нередко сталкиваемся с тем, что поисковые системы и онлайн-переводчики могут путать похожие по написанию слова, подчас удивляя нас своей необычной нейросетевой логикой. Но может ли нейронная сеть одного из лучших онлайн-переводчиков правильно назвать химическое вещество по его структурной формуле?
У каждого из нас есть имя, которое в меру своей фантазии выбрали наши родители. Хотя существительным с большой буквы награждают не только живых людей, но и не менее живых котиков, а также самолёты, самокаты, версии операционных систем и всё то, к чему неровно дышит чья-то душа. Можно и любимую кухонную сковородку назвать «Матильдой», кто ж запретит.
У химических молекул тоже есть свои имена. На заре развития науки химии веществам по большей части давали простые (их ещё называют тривиальные) названия, обычно с отсылками к чему-то, из чего выделили какую-нибудь новую молекулу. Например, из чего могли бы раньше получать лимонную кислоту, как не из лимона?
Число изученных молекул росло всё быстрее и быстрее, и доступные слова и их сочетания для новых веществ бы-стро закончились. Ведь даже английский язык с его миллионом лексических единиц всухую проигрывает одной только органической химии, в которой число известных молекул уже приближается к 30 миллионам. Поэтому без какой-то системы названий молекул научные статьи по химии давно превратились бы в нечто, напоминающее магическую книгу заклинаний.
Навести относительный порядок на страницах химических манускриптов помог Международный союз теоретической и прикладной химии (IUPAC, в русском написании ИЮПАК). Благодаря ему и появилась система наименований химических соединений — номенклатура ИЮПАК. Это свод правил, объясняющий, как следует назвать молекулу, чтобы потом по этому названию можно было однозначно восстановить её формулу. То есть вы берёте из справочника название «2-метилпропанол-1», пытаетесь вспомнить страницы из учебника по химии за 10-й класс, неуверенно рисуете на листке бумаги молекулу пропана, пририсовываете ко второму атому углерода метильную группу, а к первому — гидроксильную, и вуаля — у вас появляется структурная формула изобутилового спирта, а не какого-нибудь диэтилового эфира.
Для простых молекул, вроде того же изобутилового спирта, названия по ИЮПАК получаются уникальные и не сказать, чтобы уж слишком сложные. А вот для больших и очень больших молекул с набором сопряжённых циклов, приправленных гетероатомами, букетом разнообразных функциональных групп и прочими химическими прелестями, возможны варианты, когда сразу несколько названий длиной в пару строчек будут правильными с точки зрения ИЮПАК. Хорошо, что обратную ситуацию, когда одному названию соответствует несколько разных химических веществ, номенклатура исключает — в этом её несравненное достоинство.
Те правила номенклатуры ИЮПАК, которые школьники стараются выучить на уроках химии, — это лишь верхушка айсберга терминологии органической химии. Целиком же она описана в так называемой Синей книге (Blue book) — желающие могут легко найти её в электронном виде и оценить масштаб терминологического бедствия. И об онлайн-справочниках мы заговорили не случайно.
Как и многие другие сферы нашей жизни, химия активно цифровизируется — всевозможные базы данных химических соединений и прочие кладовые химического знания уже давно перекочевали из пыльных бумажных архивов на страницы в интернете. Но чтобы найти информацию по интересующей вас молекуле, нужно знать её точное название, структурную формулу или какой-то другой способ однозначно указать на данное соединение. И здесь у компьютеров и у живых людей немного разный взгляд на «удобные» химические имена.
Компьютерным программам проще обрабатывать цифры и формулы, чем разбираться в названиях по ИЮПАК или тем более в «обычных» именах. Добавим к этому ещё тот факт, что не только тривиальные названия, но даже и строго номенклатурные могут отличаться на разных языках. Кто-то задастся логичным вопросом: «А чем же химикам не угодили обычные химические формулы?» Действительно, C