Что такое федеративное обучение: метод, который приведет к взрывному росту искусственного интеллекта

Федеративное обучение — это подход к обучению моделей ИИ, обеспечивающий конфиденциальность данных. Эксперты прогнозируют, что этот метод приведет к взрывному развитию нейросетей в областях с чувствительными данными.
Что такое федеративное обучение: метод, который приведет к взрывному росту искусственного интеллекта
Freepik
Разбираемся, как работает федеративное обучение, чем оно отличается от классического машинного обучения и как его можно применять.

Федеративное обучение (Federated Learning, FL) — это метод машинного обучения, при котором модель обучается на данных, распределенных между множеством устройств или серверов, без необходимости передачи этих данных в централизованное хранилище.

ЕвгенийПопов
руководитель направления «Здравоохранение»
Центра технологий для общества Yandex Cloud

В чем суть федеративного обучения

При традиционном (централизованном) подходе в обучении моделей ИИ разработчикам нужен прямой доступ к размеченному набору данных — датасету. Как правило, датасет загружается на тот сервер, где будет обучаться модель. Однако возникают ситуации, когда данных недостаточно — например, так бывает при разработке нейросетей для помощи в диагностике редких заболеваний. Чтобы обучить качественную модель, нужно собирать данные по разным организациям или даже по разным странам. Или эти данные могут быть очень чувствительными, и владельцы не готовы передавать их за пределы контура своей организации. При централизованном подходе в таком случае обучение модели становится невозможным.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Архитектура централизованного обучения
Архитектура централизованного обучения. В этом примере на центральный сервер передаются размеченные медицинские датасеты и на них обучается модель
Yandex Cloud

С такой проблемой, например, столкнулась компания Google, когда необходимо было обучать модель подсказок следующего слова для клавиатуры на Android. Чтобы качественно обучить такую модель, нужно было собрать все данные, введенные всеми пользователями смартфонов на Android, а это очень чувствительная информация. Тогда исследователи придумали подход федеративного обучения и представили его в 2017 году.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

При федеративном обучении все наоборот: сами данные никуда не передаются. Наоборот, модель передается на каждое устройство с данными и обучается там. После того, как она обучилась на отдельных данных, мы получаем несколько экземпляров моделей — теперь их нужно объединить в одну. Для этого на центральный сервер передаются только измененные параметры после обучения — новые веса модели. Дальше эти параметры объединяются по определенным алгоритмам, и получается модель, обученная на всех датасетах.

Для участников проекта такой подход – более безопасный. Роли участников гибко настраиваются: кто-то может запустить обучение, кто-то — только посмотреть задания, а кто-то – скачать результат.

Архитектура федеративного обучения
Архитектура федеративного обучения. Локальные модели обучаются на стороне данных, на центральный (федеративный) сервер передаются только измененные параметры (веса, изменения весов, градиенты). На федеративном сервере переданные параметры агрегируются — так получается глобальная модель
Yandex Cloud
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Как это работает

IT-архитектура

Для реализации федеративного обучения на практике разработано множество специализированного программного обеспечения, то есть фреймворков. Большинство из них используют открытый исходный код, например NVFlare, FLOWER, Substra, PySyft, FATE, OpenFL, TFF.

Архитектурно это выглядит как распределенная система, участниками которой являются все устройства или организации, на которых есть необходимые датасеты. Есть также центральный сервер, который управляет процессом. Распределенные узлы называются клиентами, а центральный узел — федеративным сервером. Разработчик модели ИИ не может взаимодействовать с клиентами и данными напрямую, он может только отправить задание на обучение модели через федеративный сервер.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
Пример архитектуры развертывания системы
Пример архитектуры развертывания системы. Клиника 1 разместила данные и FL-клиент в своей инфраструктуре. Клиника 2 — в арендованной облачной инфраструктуре. Разработчик разместил FL-сервер под проект также в облаке. Администратор подключается к серверу через защищенное SSH-соединение, а также может управлять сервером через консоль администратора (Admin Console). Разработчики могут отправлять задания на обучение моделей также через консоль администратора или через программный интерфейс (API). FL‑сервер координирует работу FL‑клиентов. Все подключения к FL‑серверу используют протокол gRPC, а каждый клиент работает со своим приватным датасетом по протоколу S3. Кроме того, в системе использован S3-бакет для распространения конфигураций FL‑клиентов
Yandex Cloud

Виды федеративного обучения

Не всегда бывает так, что данные, которые есть для обучения модели, одинаковы по структуре и формату. Это видно на примере из медицины, когда пациенты получают помощь в разных медицинских учреждениях.

Пациент может быть прикреплен к своей районной поликлинике и базовую помощь получать там. При этом, если он серьезно заболел, он идет в специализированную государственную или частную клинику. А еще часть услуг он может дополнительно получать по ДМС. Получается, что информация о его состоянии здоровья распределена по разным организациям.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Казалось бы, эту проблему уже решает государство: медицинские организации должны передавать данные в единую государственную информационную систему в области здравоохранения (ЕГИСЗ). Но не всегда для обучения моделей достаточно тех данных, которые передаются, а пытаться продублировать абсолютно все данные обо всех в одной базе может быть небезопасно и потребует много времени и денег.

Эта проблема решается разными типами федеративного обучения. Основных типов три: горизонтальное, вертикальное и трансферное.
машинное обучение: виды
Freepik
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Горизонтальное федеративное обучение

При таком подходе модель обучается на одинаковых признаках, но на разных записях. Допустим, нам нужно предсказать риск развития инфаркта от пола, возраста, веса и перенесенных ранее заболеваний. При горизонтальном обучении мы обучаем модель только на этих признаках, но при этом получаем данные из множества медицинских центров.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Вертикальное федеративное обучение

При вертикальном федеративном обучении признаки на отдельных клиентах могут быть немного другими. Допустим, несколько медицинских центров еще имеют информацию о результатах анализов. Мы не выкидываем эту информацию, а одновременно обучаем две версии модели: ту, которая учитывает анализы и ту, которая не учитывает. Но при этом также используем весь большой объем записей из всех медицинских центров.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Трансферное федеративное обучение

Трансферное обучение применяется тогда, когда данные сильно отличаются и по записям, и по областям. Допустим, есть еще доступ к данным о влиянии образа жизни пациентов (питание, занятия спортом, генетическая предрасположенность и даже доход) на риск развития инфаркта. Все эти данные собрать в одном месте практически невозможно. Но их можно также учитывать при обучении моделей и переносить результат обучения из одной области в другую.

Дополнительные типы и архитектуры федеративного обучения активно разрабатываются учеными и учитывают узкие индустриальные особенности, недостатки существующих типов, новые виды задач, конкретные особенности данных, пропускную способность каналов связи, вычислительные мощности конечных устройств.

Конечно, область применения федеративного обучения не ограничивается одной медициной, и для других индустрий существуют свои примеры. Используя разные типы федеративного обучения, можно решить практически любую задачу обучения моделей ИИ и существенно сэкономить силы на создании отдельных датасетов под конкретные задачи. Например, если иметь безопасный доступ к выгрузкам данных из разных систем, можно обучать на одних и тех же данных совершенно разные модели.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Как использовать федеративное обучение

Сценарии применения могут быть разными. Во-первых, технология хорошо подходит для проектов, когда модель нужно обучить на конфиденциальных данных, которые еще и сильно распределены географически. Например, это удобно для международных научных проектов в области ИИ, когда данные нельзя передать в другую страну из-за особенностей законодательства или других требований. Так, в одном из крупнейших проектов по обучению нейронной сети участвовало 20 центров, расположенных на пяти континентах. В проекте обучали модель для прогнозирования необходимости искусственной вентиляции легких (ИВЛ) для пациентов с симптомами COVID-19 по данным рентгеновских снимков грудной клетки.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

Во-вторых, федеративное обучение подходит тогда, когда нужно некое средство для безопасного предоставления доступа к своим данным многим участникам. Например, отдельный регион, ведомство или организация накопили большой массив данных, но не могут предоставить к нему доступ, так как данные очень чувствительные. Такой подход выбрал Сеченовский Университет для предоставления доступа разработчикам из своегобиобанка. С помощью облачных сервисов специалисты организовали платформу медицинских данных, которую можно использовать для разработки новых технологий машинного обучения — например, это полезно для изготовления лекарств и исследования новых методик лечения.

Наконец, в проектах с федеративным обучением несколько участников могут объединяться для решения общей задачи. Такой подход наиболее интересен банкам для обучения скоринговых или антифрод-моделей.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ
как использовать федеративное машинное обучение в медицине и других сферах
Freepik

Что дальше

Федеративное обучение — перспективный метод, в который компании готовы инвестировать. Согласно одному исследованию, рынок федеративного обучения в мире устойчиво растет примерно на 10% в год и к 2032 году составит более $300 млн. Пока наибольший интерес к технологии проявляют медицинские организации, финтех и разработчики технологий для промышленного интернета вещей.

РЕКЛАМА – ПРОДОЛЖЕНИЕ НИЖЕ

В России интерес к федеративному обучению до недавнего времени был больше научный — ученые из ИСП РАН, МФТИ и крупных IT-компаний исследовали и разрабатывали фундаментальные математические подходы к его работе. Однако за последние два года вырос спрос на его практическое применение. Так, Сеченовский Университет и ИСП РАН вместе с партнерами провелипилотный проект по применению технологии для обучения моделей по диагностике патологий сердца. Также стал заметен интерес со стороны государственных организаций, так как этот метод поможет обеспечить условия для доступа разработчиков к государственным данным для обучения моделей ИИ.

Дальнейшее развитие технологии и примеры успешных проектов повысят доверие компаний к методу федеративного обучения. Это, в свою очередь, приведет к быстрому развитию ИИ-решений. Вероятно, все преимущества федеративного обучения позволят ему стать одним из основных способов предоставления безопасного доступа к чувствительным данным для обучения моделей.