04.03.2025, 19:21

Чтение мыслей на расстоянии ставится все ближе к реальности

Ученые Йельского университета разработали систему ИИ-модель, способную расшифровывать фМРТ-сканы. Модель, получившая название MindLLM, создает текстовое описание мыслительного процесса человека, анализируя фМРТ-скан. Модель обучена таким образом, что она не зависит от конкретного человека и в принципе может «читать мысли» любого, чьи сканы ей доступны.

Владимир Губайловский

Теги:

Мозг

Нейросети

Нейробиология

Чтение мыслей на расстоянии ставится все ближе к реальности

Unsplash

Ученые отдают себе отчет, что если удастся заменить дорогие и громоздкие фМРТ-сканеры на более портативные устройства, сканирующие мозг, возможность чтения чужих мыслей с помощью новой ИИ-модели может стать достаточно широко распространенной. Такая «телепатия» уже не фантастика.

Ученые Йельского университета разработали систему ИИ-модель, способную расшифровывать фМРТ-сканы. Модель, получившая название MindLLM, создает текстовое описание мыслительного процесса субъекта, анализирует фМРТ-скан. Модель обучена таким образом, что она не зависит от конкретного человека и в принципе может «читать мысли» любого, но ей для этого нужны фМРТ-сканы. Работа размещена на сервере arXiv.

Функциональная магнитно-резонансная томография (фМРТ) измеряет активность мозга только косвенно, нейроны она не видит. фМРТ измеряет уровень оксигенации крови, так называемый гемодинамический ответ: активные зоны мозга потребляют больше кислорода. Вот это и видит фМРТ. Ее картинка отстает от реальной нейронной активности иногда на целую секунду, но она обеспечивает пространственную карту активации мозга, хотя и с ограниченным временным разрешением. Эта техника предоставила многочисленные сведения о роли, которую играют различные зоны мозга. Но расшифровка сложных мыслей с помощью таких сканов — большая проблема.

Ученые, разработавшие MindLLM, подошли к проблеме напрямую. Модель состоит из двух основных компонентов: кодировщика сканов фМРТ и большой языковой модели (LLM). Кодировщик фМРТ обрабатывает данные сканирования и преобразует их в формат, который может понять LLM, предварительно обученная на широком спектре изображений с текстовыми описаниями.

Данные фМРТ состоят из сканов мозга людей, которые рассматривали изображения и давали ответ о его содержании. Например, если показано изображение бейсболиста в процессе броска, то спрашивается, что он бросает. Учитывая данные фМРТ, MindLLM должен сгенерировать текст, который описывает мозговую активность, зафиксированную при сканировании.

Обзор метода. MindLLM оснащен кодировщиком фМРТ, не зависящим от субъекта, и готовым LLM. MindLLM обучается на нескольких испытуемых с различными формами входного сигнала и набором данных, настраиваемых по инструкции, с целью кодирования различных аспектов семантической информации в фМРТ. После обучения MindLLM способен решать различные задачи декодирования текста. Одно из применений заключается в том, что декодированное содержимое может быть использовано для нейронного управления существующими системами, которые для этого не предназначены.

arXiv (2025). DOI: 10.48550/arxiv.2502.15786

Одним из ключевых нововведений MindLLM является его способность фокусироваться на наиболее важных частях данных фМРТ, что повышает их точность и эффективность. Другим важным аспектом MindLLM является метод, известный как настройка инструкций мозга (BIT). Он включает в себя обучение модели на разнообразном наборе изображений и текста, что позволяет ей захватывать широкий спектр представлений из сигналов фМРТ. Набор данных BIT включает задачи, связанные с восприятием, памятью, обработкой языка и сложными рассуждениями, гарантируя, что MindLLM может декодировать различные аспекты человеческой мысли.

Потенциальные приложения MindLLM разнообразны. Ученые говорят, что модель можно использовать для разработки интерфейсов мозг-компьютер, которые позволяют людям управлять устройствами с помощью своих мыслей. Модель может дать представление о когнитивных процессах, помогая исследователям лучше понять, как работает мозг.

Чтение мыслей на расстоянии

Архитектура модели. Кодировщик фМРТ сопоставляет фМРТ с серией фМРТ-токенов с помощью предложенного нами нейробиологически обоснованного механизма внимания. Большая языковая модель, содержащая как фМРТ, так и текстовые лексемы, будет обучаться с помощью настройки мозговых инструкций.

arXiv (2025). DOI: 10.48550/arxiv.2502.15786

Способность MindLLM декодировать мысли имеет этические последствия, которые обществу придется учитывать. Возможность декодирования личных мыслей вызывает опасения по поводу конфиденциальности и безопасности, и важно установить этические принципы для разработки и внедрения такой технологии. Ученые признают, что они не смогут контролировать любое использование модели.

Несмотря на впечатляющие результаты, MindLLM все еще находится на ранних стадиях разработки. Одним из ограничений является то, что фМРТ не является методом визуализации в реальном времени и требует значительного времени обработки, а также дорогостоящего громоздкого оборудования. Будущие исследования могут изучить более быстрые и портативные методы визуализации мозга, такие как электроэнцефалография (ЭЭГ) или функциональная спектроскопия в ближнем инфракрасном диапазоне, чтобы дополнить или заменить фМРТ в практических приложениях.

Кроме того, исследователи стремятся изучить связь между данными фМРТ и другими типами информации, такими как видео, чтобы получить более полное представление об активности мозга.