От фактов к фейкам: как ложь и манипуляции угрожают научным исследованиям
Опубликованные даже в научных журналах исследования в последние годы перестают быть надежной опорой для врачей, журналистов и адептов доказательной медицины. И на то есть объективные причины. Forbes Life разобрался, почему доверять таким работам с каждым днем все сложнее и к чему могут привести манипуляции ученых
«Миллиарды долларов выбросили в этот мусоровоз, но зато таким образом была построена не одна академическая карьера, кое-кто очень обогатился», — написал Дэвид Шолто, молодой биолог из Уэльса, в разгромной статье на своем личном сайте For Better Science в январе 2024 года. Он явно не предполагал, к каким последствиям это приведет. Пару лет назад Шолто уволился с работы и полностью отдался своему хобби — охоте на ведьм в научном мире. Он проводил целые дни, кропотливо отыскивая ошибки в исследованиях, а затем писал в журналы с просьбой отозвать недобросовестные публикации. Большинство писем Дэвида просто игнорировали.
Но в случае с блогом For Better Science все вышло иначе. Дэвид замахнулся буквально на святое — уличил в искажении данных группу ведущих исследователей гарвардского Института рака Dana Farber, одного из главных онкоцентров в мире. И это произвело эффект разорвавшейся бомбы. Представители Dana Farber отозвали шесть работ и внесли значительные правки еще в 31. Многие из них были опубликованы 15 и более лет назад и считались программными в изучении рака. По совпадению, в тот же день, когда Шолто опубликовал свое разоблачение, об отставке объявила директор Гарварда Клодин Гэй. В 40 ее статьях был найден грубый плагиат.
Все эти случаи не первые и не единичные. За 2023 год было отозвано 10 000 научных исследований — это самый высокий показатель в истории. Список областей, в которых чаще всего встречаются недобросовестные работы, возглавляют онкология и кардиология. А топ стран, где распространены фейковые исследования: Китай, Пакистан, Индия, Австралия, Россия и США. В 2021 году был завершен восьмилетний масштабный проект по проверке исследований в области рака. Выяснилось, что при попытке воспроизвести их результаты, это удается только в 50% случаев, — и они далеко не всегда оказываются такими впечатляющими, как было заявлено.
«И что мы будем делать? Сидеть и ждать, пока последствия будут фатальными? Или разберемся в причинах?» — задает вопрос Дэвид Шолто в своей статье. Вопрос кажется справедливым: попробуем разобраться в причинах.
Искусственный интеллект
Несколько месяцев назад одна из ведущих мировых научных организаций — Лондонское Королевское общество — провела эксперимент. Аспирантов разных специальностей попросили протестировать новую безымянную нейросеть и попробовать сломать ее «ограду» — так неформально называют защитный механизм, не позволяющий ИИ давать опасные советы и искажать факты. Многим участникам это удалось. Они заставили нейросеть виртуозно доказать, что утки — надежный индикатор чистоты воздуха, а лавандовым маслом можно лечить постковидные симптомы. Но успешнее всего были те, кто предложил ИИ написать несуществующие научные исследования в несуществующие журналы. Результаты были неотличимы от настоящих работ.
То, что наука прибегает к помощи ИИ, не новость. По данным масштабного опроса 2023 года, результаты которого были опубликованы в журнале Nature, 58% ученых считают, что ИИ помогает быстрее производить вычисления и экономит время исследователей. Еще 28% используют нейросети для работы несколько раз в неделю. Действительно, ИИ способен обрабатывать большие массивы данных, писать выводы из многостраничных работ. Но не только.
«Искусственный интеллект может очень быстро сгенерировать базу данных под любой заданный результат. То есть предложить данные, из которых этот несуществующий результат мог быть выведен, — объясняет Анча Баранова, биолог, профессор школы системной биологии в Университете Джорджа Мейсона, США. — Там будут имена, фамилии, возраст, распределение по биомаркерам». Такой эксперимент уже ставили, и нейросеть успешно справилась с задачей. Единственным искажением были не сами данные, а то, что ИИ представил больше гендерно-нейтральных имен, чем обычно встречается в популяции, потому что в нейросети заложен вокизм (от английского woke, wokeism — принцип социальной, расовой и половой справедливости. —Forbes Life). Баранова добавляет, что невозможно проверить, были в эксперименте реальные волонтеры или плод воображения ChatGPT: «Все крупные регуляторы защищают личные данные участников исследований. Вы не можете найти их контакты, позвонить и спросить, правда ли, что 27 января вам сделали укол в 7 часов вечера?»
Четыре года назад Gowing life, группа энтузиастов из Оксфорда и Лондонского университетского колледжа, провела похожий эксперимент, используя механизмы машинного обучения. В результате были сгенерированы совершенно неотличимые от настоящих исследования, доказывающие, например, что кофеин способствует росту мышц, а препарат от биполярного расстройства лечит рак простаты. Проблема в том, что ИИ может генерировать не только текст, но и изображения, используемые в научных работах: например, макрофотографии клеток. И отличить их от настоящих практически невозможно.
Впрочем, иногда определить фейк очень просто. В 2022 году Гильйом Кабанач, ученый-информатик из Тулузского университета, обнародовал несколько десятков научных работ, где встречалась фраза regenerate response («повторить запрос») — классическая команда для СhatGPT. Авторы просто забыли удалить ее из своих псевдотрудов.
Бумажные заводы
Paper mills («бумажные заводы») — принятое в научной среде название для сомнительных бизнесов, которые торгуют готовыми работами и авторством, обещая ученым публикации в солидных журналах. В большом исследовании «бумажных заводов» STM (независимая международная организация мониторинга качества научных исследований. — Forbes Life ) приводит письмо авторства одной такой компании. «Крупный поставщик академических работ предлагает готовые статьи на широкий круг тем, от экономики до инженерии. Каждая статья была написана, отредактирована, проверена и переведена командой экспертов, мы также достигли договоренностей о публикации с разными изданиями. Все, что требуется от вас, — это выбрать нужную тему и объем участия. Вы можете приобрести полное авторство или стать одним из контрибьюторов. Мы гарантируем, что статья будет напечатана и проиндексирована». Эта компания базируется в Латвии и за 12 лет существования помогла опубликовать уже 12 560 работ.