Как научные журналы борются с ошибками и подделками изображений
Ученые-расследователи используют свой натренированный вгляд, и специальное программное обеспечение на основе искусственного интеллекта (ИИ), чтобы обнаружить дубликаты изображений и даже подделки. Эти ученые освещают эти проблемы на онлайн-форуме PubPeer, на котором каждый день появляется множество новых сообщений, отмечающих проблемы с изображениями.
В прошлом месяце, например, Институт рака Дана-Фарбер (DFCI) в Бостоне, штат Массачусетс, заявил, что попросит журналы отозвать или исправить множество статей, написанных его сотрудниками. Об этом стало известно после того, как ученый-расследователь выразил обеспокоенность по поводу изображений в статьях. В институте заявляют, что продолжают расследовать эти проблемы.
Этот инцидент был лишь одним из многих. Перед лицом общественного внимания академические журналы все чаще применяют приемы и инструменты, в том числе модели ИИ, для выявления проблемных изображений до и даже после публикации. Журнал Nature рассматривает проблему и то, как издатели журналов пытаются ее решить.
Главные проблемы с изображениями
Сомнительные методы использования изображений включают использование одних и тех же данных в нескольких графиках, копирование фотографий или частей фотографий, удаление части изображения или объединение нескольких изображений.
Такие проблемы могут указывать на попытку ввести в заблуждение, но также могут быть результатом, например, вроде бы невинного желания «навести красоту». Тем не менее, по мнению экспертов, даже такие невинные отклонения от истины могут нанести ущерб науки.
Насколько распространены такие подделки и как меняется их число?
Точное количество таких инцидентов неизвестно. В базе данных, поддерживаемой веб-сайтом Retraction Watch, перечислено более 51 000 задокументированных опровержений, исправлений или выражений озабоченности по поводу изображений в научных статьях.
Одну из крупнейших попыток количественной оценки проблемы предприняли Элизабет Бик, специалист по научным изображениям из Сан-Франциско, Калифорния, и ее коллеги. Они изучили изображения в более чем 20 000 статей, опубликованных в период с 1995 по 2014 год. Они обнаружили, что почти 4% статей содержали сомнительные данные. Исследование также выявило увеличение количества дубликатов изображений, начиная примерно с 2003 года, вероятно, потому, что цифровая фотография облегчила изменение снимков, говорит Бик.
Современные статьи содержат гораздо больше изображений, чем те, что были выпущены несколько десятилетий назад, отмечает Бик: «Объедините все это с гораздо большим количеством статей, публикуемых в день по сравнению с десятью годами ранее, и возросшим давлением на ученых, от которых постоянно требуются новые публикации, и станет понятно, что проблема очень серьезная».
Что произошло в Институте рака Дана-Фарбер?
В январе 2024 года биолог и исследователь Шолто Дэвид из Понтипридда, Великобритания, написал в блоге о возможных манипуляциях с изображениями в более чем 50 биологических статьях, опубликованных учеными DFCI, который связан с Гарвардским университетом в Кембридже, штат Массачусетс. Среди авторов были президент DFCI Лори Глимчер и ее заместитель Уильям Хан. Представитель DFCI заявил, что они не разговаривают с журналистами. В блоге Дэвида освещались дублирования изображений и другие сомнительные манипуляции в статьях, охватывающих почти 20 лет.
DFCI, который уже расследовал некоторые из этих вопросов, добивается отзыва нескольких статей и исправления многих других. Но Барретт Роллинз, специалист по вопросам добросовестности исследований DFCI, говорит: «Следует помнить, что наличие дублирования изображений или неточностей в статье само по себе не является свидетельством намерения автора обмануть коллег, но результаты все равно тревожные».
Что делают журналы для проверки изображений?
Стремясь сократить количество публикаций неправильно обработанных изображений, некоторые журналы, в том числе Journal of Cell Science, PLOS Biology и PLOS ONE, обычно просят авторов предоставлять «сырые» снимки в дополнение к обрезанным или обработанным изображениям.
Многие издатели используют при проверке инструменты на основе ИИ, такие как ImageTwin, ImaCheck и Proofig. Семейство журналов Science объявило в январе, что теперь использует Proofig для проверки всех представленных статей.
Холден Торп, главный редактор журнала Science, говорит, что Proofig заметил вещи, которые заставили редакторов отказаться от публикации статей. Торп говорит, что авторы обычно благодарны, если их ошибки выявлены.
Какие проблемы находят ИИ-системы?
Все эти системы могут, например, быстро обнаруживать дубликаты изображений в одной и той же статье, даже если эти изображения были повернуты, растянуты или обрезаны или их цвет был изменен.
Разные системы имеют разные преимущества. Proofig, например, может обнаружить склейки, возникшие в результате вырезания или сшивания частей изображений. Преимущество ImageTwin, по словам Элизабет Бик, состоит в том, что эта модель ИИ позволяет пользователям сравнить указанное изображение с большим набором изображений из других статей. Некоторые издатели, в том числе Springer Nature, разрабатывают собственные ИИ-модели для проверки изображений.
Многие ошибки, обнаруженные инструментами ИИ, кажутся невинными. Изучив более 1300 статей, представленных в 9 журналов Американской ассоциации исследований рака в 2021 и начале 2022 года, Proofig отметил, что в 15% из них есть возможное дублирование изображений, что требует дальнейшего взаимодействия с авторами. Ответы авторов показали, что 28% из 207 дублирований были преднамеренными — например, из-за того, что авторы использовали одно и то же изображение для иллюстрации сходных примеров. 63% были непреднамеренными ошибками.
Насколько хорошо работают ИИ-системы?
Пользователи сообщают, что системы на основе искусственного интеллекта определенно позволяют быстрее и проще выявлять некоторые проблемы с изображениями. Они действительно хорошо находят дубли, склейки и изменения цвета. Но они гораздо хуже определяют результаты сложных манипуляций или фейков, созданных генеративными ИИ. Такие инструменты, как ImageTwin «полезны для обнаружения ошибок и нарушений на низком уровне, но это лишь один небольшой аспект более серьезной проблемы», — говорит Бернд Пулверер, главный редактор EMBO Reports. — «Существующие инструменты в лучшем случае показывают верхушку айсберга, который может резко вырасти. Нынешние подходы вскоре в значительной степени устареют».
Помогает ли тщательная проверка изображений перед публикацией?
Сочетание работы экспертов, использование технологических инструментов и повышеннfz бдительностm, похоже, работают на данный момент. «Мы применяем систематический скрининг уже более десяти лет и впервые наблюдаем снижение показателей выявления», — говорит Пулверер.
Но по мере того, как манипулирование изображениями становится все более изощренным, поймать его становится все труднее, говорит он. «Через пару лет все наши нынешние методы проверки целостности изображений по-прежнему будут полезны для фильтрации ошибок, но уж точно не для обнаружения мошенничества», — говорит Пулверер.
В конечном итоге искоренение манипулирования изображениями потребует комплексных изменений в том, как работает наука, как ставится и документируется эксперимент говорит Элизабет Бик.