От научных результатов до бизнес-модели: участники хакатона Health&Science разработали детектор ковидных «спайков»

Большинство смертей во время пандемии коронавируса обусловлены сердечно-сосудистыми аномалиями. ННГУ имени Н. И. Лобачевского и EPAM Systems представили кейс на хакатон «Медицина, здравоохранение, наука» конкурса «Цифровой прорыв», в котором нужно было разработать детектор ковидных аномалий в ритме сердца. О формировании корпуса данных, постановке проблемы разработчикам, лучших решениях и планах их внедрения читайте в статье.
От научных результатов до бизнес-модели: участники хакатона Health&Science разработали детектор ковидных «спайков»

Уникальный корпус данных

Не занимайтесь самолечением! В наших статьях мы собираем последние научные данные и мнения авторитетных экспертов в области здоровья. Но помните: поставить диагноз и назначить лечение может только врач.

В ННГУ имени Н. И. Лобачевского собрана уникальная база данных о состоянии испытуемых в разных поведенческих, в том числе рабочих, контекстах. Сегодня в этой базе более 15 тысяч прецедентов. Это данные людей разных возрастов (от 2 до 83 лет), разных профессий, здоровых и больных различными заболеваниями и т.д. На ее основе удалось разработать карту стрессогенных зон уличной инфраструктуры Нижнего Новгорода, совместно с группой Татьяны Черниговской выяснить особенности функциональной системы переводчиков во время синхронного перевода и даже выявить основные причины неэффективности и стрессогенности дистанционного обучения.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

«Мы в своих исследованиях смогли объединить возможности давно известного, еще со времен полетов в космос Гагарина и Титова, метода регистрации ритма сердца и его вариабельности и современные программные и вычислительные возможности. В результате была создана технология событийно-связанной телеметрии ритма сердца, позволяющая в online-режиме получать объективные данные о том, как мозг управляет работой наших внутренних органов и, соответственно, какими ресурсами и возможностями в настоящий момент располагает организм данного конкретного человека», — рассказывает доктор биологических наук, заведующая кафедрой психофизиологии ННГУ Софья Полевая.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Проблематика кейса

Более 70% смертельных исходов при COVID-19 связано с острой сердечной недостаточностью и тромбозами. Клинические методы диагностики не позволяют определять предикторы этих проблем — зато могут программные. Университетом на основе исследования реальных пациентов были собраны уникальные данные, с которыми посчастливилось работать участникам конкурса. Результатом их работы стали готовые программные модели, алгоритмы, способные на ранних стадиях определить аномалии в кардиограмме и принять предиктивные медицинские меры.

«Около года назад в данных мониторинга функционального состояния из красной зоны ковидного госпиталя руководитель проекта профессор С.А. Полевая обратила внимание на странные микропаттерны ритмограммы ("спайки"). Структура этих изменений кардиоритма принципиально отличалась от стандартных нарушений ритма (различных экстрасистолий). Выяснилось, что такие "ковидные" спайки встречаются также на бессимптомной фазе до или после госпитализации. При сопоставлении с клиническими данными стало понятно, что частота их проявлений сильно коррелирует с нарушениями в системе свертывания крови, характерными для этого страшного заболевания. Стало быть, эти спайки являются важным диагностическим признаком для выявления повреждений сердечно-сосудистой системы, связанных с ковидом. Более того, чем чаще они встречаются, тем сильнее выражены нарушения микроциркуляции и, соответственно, повреждения различных органов: легких, сердца, почек», — отмечает доктор биологических наук, профессор кафедры психофизиологии ННГУ Сергей Парин.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

В рамках решения кейса участники должны были создать детектор ковидных аномалий на основе данных ритмограммы. Решение этой задачи обеспечит доклинический скрининг связанных с COVID-19 повреждений и снижение рисков смертности от сердечной недостаточности и тромбозов.

«Многие пациенты (практически все) при выписке из госпиталя нуждаются в динамическом наблюдении (мониторинге) состояния, чтобы избежать осложнений, связанных с рисками повышенного тромбообразования. Метод телеметрии ритма сердца оказался наиболее чувствительным к таким изменениям и подходящим для мониторинга в процессе повседневной жизни человека. Создание мобильного приложения для определения кардиоспайков может стать инструментом для самостоятельного мониторинга за своим здоровьем, и тем самым поможет избежать многих осложнений после перенесённой коронавирусной инфекции», — подчёркивает клинический эксперт ННГУ, нейропсихолог, магистр психологии Мария Циркова.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Отметим, что впервые на «Цифровом прорыве» был представлен data-кейс — описание конкретной проблемы, имеющее в своей основе датасет.

ТОП-3 решений команд

1 место: Звездочка (Москва)

Команда создала онлайн-сервис анализа R-R ритмов, который выявляет аномалии ритма, связанные с COVID-19. Сервис позволяет обрабатывать данные о пациентах, оперативно узнавать о необходимости врачебного вмешательства и помогает спасать жизни и здоровье людей.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
  • Уникальность: сервис создан с учетом необходимости быстрой обработки больших объемов данных, может использоваться для анализа данных с помощью телефона и из медицинских систем.
  • Стек решения: python, pytorch, flask, fastapi, plotly, sklearn, lighgbm, catboost.

«Мы выбрали этот кейс, потому что посчитали задачу детектирования опасных ковид-специфических аномалий в сердечных ритмах очень важной. Ковид уносит огромное количество человеческих жизней и наносит экономический ущерб по всему миру. Данные сердечных ритмов легко получать, но тяжело обрабатывать вручную.

Мы разработали и натренировали алгоритм машинного обучения для решения этой задачи. При обучении использовалась схема двойной вложенной кросс-валидации, при которой модель обучалась 25 раз на различных разбиениях данных. Все эти модели впоследствии работают вместе, корректируя друг друга, что гарантирует стабильность алгоритма.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Одну из наших моделей мы опубликовали на сайте сердечный-друг.рф. Мы проверили собственные ритмограммы при помощи разработанного алгоритма и, действительно, у переболевшего участника команды нашлись аномалии. Наше решение может применяться как врачами, так и простыми людьми», — Даниил Гафни, представитель команды «Звездочка».

2 место: NO1 (Москва)

Решение участников — две модели детектирования COVID-характерных аномалий на основе ритмограммы сердца. Робастное решение (F1-score=0.83) имеет нулевые требования к ресурсам и может работать на носимых устройствах. Продвинутое решение (F1-score=0.89), несмотря на нейросетевую архитектуру, способно с высокой скоростью работать на ЦПУ.

  • Уникальность: простое решение построено с использованием статистического аппарата, его можно использовать на ранней стадии внедрения для обеспечения proof of concept. Продвинутое решение представляет собой легковесную сверточную нейронную сеть, для тренировки которой использовались специфичные для задачи аугментации.
  • Стек решения: numpy, sklearn, PyTorch.
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

3 место: Sheesh (Нижегородская область)

На основе данных датасета и информации о корреляции между спайками на ритмограмме и болезнью COVID-19 было разработано решение, которое показывает точность детектирования спайков 88% по метрике F1 и может быть использовано для различных задач, таких как оценка состояния пациента во время реабилитации и при лечении COVID-19.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
  • Уникальность: использован подход Grid-search по метапараметрам трёх типов моделей, позволивший получить высокоточное и стабильное решение для задачи детектирования спайков.
  • Стек решения: Torch, Torch Lightning, Nuclio.

Оценка решений экспертами

Научные и технические эксперты высоко оценили решения команд-победителей.

«Учитывая, что для анализа были представлены настоящие нередактированные данные носимых датчиков ритма сердца, командам пришлось проявить не только компетенции в Data Science и big data, но и способность к поиску нестандартных решений. Особенно успешными нужно признать результаты трех призеров, которым за короткое время удалось создать чувствительную и надежную модель детектора», — Сергей Парин, доктор биологических наук, профессор кафедры психофизиологии ННГУ.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

«Вы герои, потому что смогли за такое короткое время пройти путь от научных результатов до бизнес-модели. Вы как никто понимаете, какая большая дыра в сфере здравоохранения существует: нет платформы контроля за здоровьем. Главный прорыв в том, что удалось запустить конвейер от датасета до цифрового продукта. Надеюсь, возникнет цифровая индустрия поддержки здоровья.

В основном, цели кейса достигнуты. У нас появился выбор из нескольких интересных решений, которые, при небольшой доработке, могут быть применены для скрининга без привлечения клиницистов. Это особенно важно в условиях непрекращающейся пандемии», — Софья Полевая, доктор биологических наук, заведующая кафедрой психофизиологии ННГУ.

«Решения задачи хакатона большинства команд были технически грамотными. Высокая плотность результатов на вершине лидерборда свидетельствует о том, что сама по себе задача поиска спайковых аномалий решаема на текущем уровне техники. Важным моментом является воспроизводимость технического решения детектора с помощью различных, подчеркну особо — публичных и открытых, имплементаций алгоритмов машинного обучения.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Решение синтетической задачи — добиться 100% распознанных аномалий в реальных биомедицинских данных является заведомо утопической, и такое потенциальное решение «на стероидах» вряд ли окажется устойчивым и жизнеспособным на практике. К счастью, участники хакатона это прекрасно поняли, и поэтому большинство решений может быть практически полезно, а решения победителей наиболее близки к непосредственному применению в существующих и разрабатывающихся системах», — Сергей Пермяков, IT-эксперт ННГУ, кандидат технических наук.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Будущее прототипов команд

Есть ли у решений команд будущее? Планируется ли их внедрение?

«Безусловно, полученные победителями хакатона результаты при незначительной целевой доработке могут быть включены в нашу технологию событийно-связанной телеметрии ритма сердца для прицельного скрининга проявлений ковида как на начальной стадии заболевания, так и при реабилитации постковидных пациентов», — Сергей Парин, доктор биологических наук, профессор кафедры психофизиологии ННГУ.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

«Планируется два варианта внедрения найденных решений. Простой жесткий алгоритм может быть установлен на "бытовой" вариант технологии, позволяющий каждому пользователю самостоятельно проверять свое состояние на наличие/отсутствие признаков заболевания. При обнаружении характерного спайка будут основания для немедленного обращения к врачам. Более сложная программа предназначена для клинического приложения, ориентированного на врачей. Учитывая чрезвычайно высокую способность вируса к мутированию, становится очевидным, что мы все обречены жить с ним долгие годы. Следовательно, оба варианта внедрения решений имеют большие перспективы», — Софья Полевая, доктор биологических наук, заведующая кафедрой психофизиологии ННГУ.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

«Глобально есть набор подходов, которые хорошо себя зарекомендовали. Следующий логичный шаг — это увеличение количества и качества данных. Нужно собрать больше статистики: люди разного пола, возраста, медицинских состояний. Нужно собрать данные по людям, которые не больны ковидом, потому что сейчас учитывали только тех, у кого был этот диагноз. То есть нужны инвестиции в сбор и аннотацию новых данных, и затем нужно понять, кто будет целевой аудиторией. Команды, кстати, по-разному это видели. Кто-то представлял бабушек, которые ставят на смартфоны это приложение. Кто-то рассматривал врачей как аудиторию. Кто-то представлял себе гибридную систему: устройство снимает показатели и отправляет их уже врачу, чтобы он внимательнее на них посмотрел. Можно расширять и сам спектр задач. На самом деле, чтобы приложение заработало, не так много нужно. Небольшая команда людей может за пару недель все это собрать. Но в первую очередь нужны исследования. Если это реально нужно людям, нет никаких препятствий, чтобы создать подобный сервис», — Павел Шашкин, Lead Data Scientist, Head of DS in Nizhny Novgorod EPAM, член жюри.