Чтобы ответить на медицинские вопросы, которые могут быть применены к широкому кругу пациентов, модели машинного обучения опираются на большие и разнообразные наборы данных из различных учреждений. Однако системы здравоохранения и больницы часто сопротивляются обмену данными о пациентах из-за юридических, конфиденциальных и культурных проблем.
Новая техника, называемая федеративным обучением, является решением этой дилеммы, согласно исследованию, опубликованному во вторник в журнале Scientific Reports под руководством старшего автора Спиридона Бакаса, доктора философии.D., инструктор радиологии и патологии & Лабораторная медицина в Медицинской школе Перельмана Пенсильванского университета.
Федеративное обучение – подход, впервые реализованный Google для функции автозамены клавиатуры, – обучает алгоритм на нескольких децентрализованных устройствах или серверах, хранящих локальные образцы данных, без обмена ими. Хотя этот подход потенциально может быть использован для ответа на множество различных медицинских вопросов, исследователи Penn Medicine показали, что федеративное обучение является успешным именно в контексте визуализации головного мозга, поскольку они могут анализировать снимки магнитно-резонансной томографии (МРТ) пациентов с опухолью головного мозга и различать здоровая ткань мозга из раковых областей.
Например, модель, обученную в Penn Medicine, можно распространить в больницах по всему миру. Затем врачи могут тренироваться на основе этой общей модели, вводя собственные снимки мозга пациента. Затем их новая модель будет перенесена на централизованный сервер. В конечном итоге модели будут согласованы в модель консенсуса, в которой были получены знания от каждой из больниц, и поэтому она будет клинически полезной.
"Чем больше данных видит вычислительная модель, тем лучше она изучает проблему и тем лучше может ответить на вопрос, для ответа на который была разработана," Бакас сказал. "Традиционно машинное обучение использовало данные из одного учреждения, и затем стало очевидно, что эти модели не работают или хорошо обобщаются на данных из других учреждений."
Федеративная модель обучения должна быть утверждена и утверждена U.S. Управление по санитарному надзору за качеством пищевых продуктов и медикаментов, прежде чем его можно будет лицензировать и коммерциализировать в качестве клинического инструмента для врачей. Но если и когда модель будет коммерциализирована, это поможет радиологам, онкологам-радиологам и нейрохирургам принимать важные решения относительно ухода за пациентами, сказал Бакас. По данным Американской ассоциации опухолей головного мозга, в этом году почти у 80000 человек будет диагностирована опухоль головного мозга.
"Исследования показали, что когда дело доходит до границ опухоли, не только разные врачи могут иметь разные мнения, но и один и тот же врач, оценивая одно и то же сканирование, может видеть разное определение границ опухоли в один день недели по сравнению с другим," он сказал. "Искусственный интеллект позволяет врачу иметь более точную информацию о том, где заканчивается опухоль, что напрямую влияет на лечение пациента и прогноз."
Чтобы проверить эффективность федеративного обучения и сравнить ее с другими методами машинного обучения, Бакас сотрудничал с исследователями из Онкологического центра им. М.Д. Андерсона Техасского университета, Вашингтонского университета и Онкологического центра Хиллмана при Университете Питтсбурга, а корпорация Intel внесла свой вклад в обеспечение конфиденциальности. защита программного обеспечения для проекта.
Исследование началось с модели, которая была предварительно обучена на данных из нескольких учреждений из репозитория с открытым исходным кодом, известного как международная сегментация опухоли головного мозга или BraTS. BraTS в настоящее время предоставляет набор данных, который включает более 2600 снимков мозга, полученных с помощью магнитно-резонансной томографии (МРТ) у 660 пациентов. Затем 10 больниц приняли участие в исследовании, обучив модели искусственного интеллекта на собственных данных о пациентах. Затем метод федеративного обучения использовался для агрегирования данных и создания модели консенсуса.
Исследователи сравнили федеративное обучение с моделями, подготовленными отдельными учреждениями, а также с другими подходами к совместному обучению. Эффективность каждого метода оценивалась путем тестирования их на сканированных изображениях, вручную аннотированных неврологами. По сравнению с моделью, обученной с централизованными данными, которая не защищала конфиденциальность пациентов, федеративное обучение могло работать почти (99 процентов) идентично. Результаты также показали, что расширенный доступ к данным за счет частного сотрудничества между несколькими учреждениями может улучшить производительность модели.
Результаты этого исследования проложили путь к гораздо большему и амбициозному сотрудничеству между Penn Medicine, Intel и 30 партнерскими учреждениями при поддержке 1 доллара США.Грант в размере 2 миллионов от Национального института рака при Национальных институтах здравоохранения, который был присужден компании Bakas ранее в этом году. В мае Intel объявила, что Бакас возглавит проект, в котором 30 учреждений в девяти странах будут использовать федеративный подход к обучению для обучения согласованной модели ИИ на данных об опухолях головного мозга. Конечной целью проекта будет создание инструмента с открытым исходным кодом, который сможет использовать любой врач в любой больнице. Разработка инструмента в Penn’s Center for Biomedical Image Computing & Аналитикой (CBICA) руководит старший разработчик программного обеспечения Сартак Пати, MS.
Соавтор исследования Ривка Колен, доктор медицинских наук, доцент кафедры радиологии в Медицинской школе Университета Питтсбурга, сказала, что эта статья и более крупный проект федеративного обучения открывают возможности для еще большего использования искусственного интеллекта в здравоохранении.
"Я думаю, что это кардинально изменит правила игры," Колен сказал. "Радиомика для радиологии – это то же самое, что геномика для патологии. ИИ произведет революцию в этой области, потому что сейчас, как рентгенолог, большая часть того, что мы делаем, носит описательный характер. Благодаря глубокому обучению мы можем извлекать информацию, скрытую в этом слое оцифрованных изображений."