Обучение огромных моделей искусственного интеллекта в сфере здравоохранения при защите конфиденциальности данных

Исследователи из Университета Дьюка и Университета Питтсбурга разработали платформу, которая позволяет нескольким больницам и исследовательским центрам безопасно обмениваться личными данными пациентов, чтобы лучше обучать модели машинного обучения. Технология могла бы предоставить отдельным учреждениям доступ к передовым инструментам прогнозирования, которые они никогда не смогли бы разработать самостоятельно, как для продвижения исследований, так и для улучшения результатов лечения пациентов.

Называется "УЧЕНИК," исследователи подвели итоги разработки платформы на выставке «Ускоритель конвергенции 2021 Национального научного фонда», мероприятии, на котором исследовательский портфель программы представлен в формате выставки, как большая научная ярмарка.

"ИИ обладает невероятным потенциалом для улучшения анализа и диагностики данных о состоянии здоровья, но для достижения стандарта, приемлемого для использования в реальных решениях, требуется огромный объем данных," сказала Хелен Ли, профессор электротехники и компьютерной инженерии Клэр Бут Люс в Duke. "И всякий раз, когда вы говорите о медицинских данных, всегда возникает высокий уровень конфиденциальности. LEARNER позволяет использовать данные о состоянии здоровья из многих источников для обучения модели искусственного интеллекта без фактического обмена конфиденциальными данными."

Когда алгоритм машинного обучения обучается, он сравнивает принятые решения с правильными ответами, пытается настроить свою внутреннюю работу, чтобы исправить ошибки, и повторяет процесс снова и снова, пока не перестанет улучшаться. Эти изменения его внутренней работы называются весовыми параметрами.

LEARNER основан на концепции под названием "Федеративное обучение." В этой настройке одна модель ИИ размещается в центральном облаке, которое предоставляется пользователям в нескольких местах. Каждое местоположение запускает модель ИИ со своими собственными данными и создает новый набор весовых параметров, который, в свою очередь, отправляется обратно в облако. Затем центральная модель ИИ использует все новые весовые параметры для разработки единого обновленного алгоритма. Процесс повторяется до тех пор, пока модель ИИ не станет настолько хорошей, насколько это возможно.

Поскольку в облако передаются только весовые параметры, а не фактические данные, этот метод позволяет избежать любых опасений по поводу конфиденциальности данных, но окончательная обученная модель по-прежнему представляет данные от всех задействованных сущностей.

"Исходная информация остается скрытой на локальных компьютерах," объяснил Ли. "Для большой модели процесс обычно требует около 50-100 раундов обучения между локальными объектами и облаком, что звучит так, как будто это может занять много времени, но на самом деле занимает всего несколько часов."

Созданный в сотрудничестве с Хэн Хуанг, John A. Юренко, профессор Университета Питтсбурга, прототип LEARNER продемонстрировал свою полезность при работе с одноклеточными многоатомными данными и электронными медицинскими картами. В первом случае исследователи показали, что LEARNER может использовать данные секвенирования скРНК для прогнозирования белковых маркеров для связывания последовательностей мРНК с производством белка. В последнем случае они могли использовать данные медицинских карт для прогнозирования вероятности повторной госпитализации пациентов с сердечной недостаточностью в течение 30 дней после их освобождения.

Но если все пойдет по плану, это только начало. Исследователи разрабатывают удобный интерфейс, чтобы побудить исследователей и врачей использовать платформу. Это не только поможет LEARNER разработать новые и более совершенные модели здоровья ИИ, но и в конечном итоге платформа предоставит пользователям сотни, если не тысячи, предварительно обученных моделей ИИ, которые они смогут использовать в своих лабораториях и больницах.

"Мы надеемся, что LEARNER станет платформой для экспертов в области здравоохранения, которые хотят воспользоваться преимуществами ИИ, но, возможно, сами мало что знают об ИИ," сказал Ли. "Мы также надеемся, что это поможет исследователям искусственного интеллекта, которые хотят углубиться в области здравоохранения и биомедицины, сотрудничать друг с другом в крупномасштабных проектах."

Ли и ее коллеги ведут переговоры с компанией ИИ из Северной Каролины, чтобы продолжить разработку и, возможно, коммерциализацию платформы LEARNER.