Исследователи разработали вычислительную основу для стандартизации данных нейробиологии во всем мире

Исследователи разработали вычислительную основу для стандартизации данных нейробиологии во всем мире

Благодаря стандартизированным форматам файлов изображений, таким как JPEG, PNG или TIFF, в которых хранится информация каждый раз, когда вы делаете цифровую фотографию, вы можете легко делиться селфи и другими изображениями с кем угодно, подключенным к компьютеру, мобильному телефону или Интернету. Никому не нужно загружать специальное программное обеспечение, чтобы увидеть вашу фотографию.

Но во многих областях науки, таких как нейробиология, обмен данными не так прост, потому что не существует стандартного формата данных. Поэтому в ноябре 2014 года инициатива «Нейроданные без границ», поддерживаемая Фондом Кавли, GE, Janelia Farm, Институтом исследований мозга Аллена и Международной организацией по координации нейроинформатики (INCF), провела хакатон для объединения идей по разработке и внедрению стандартный формат файла нейробиологии. И BrainFormat, структура стандартизации данных нейробиологии, разработанная в Национальной лаборатории Лоуренса Беркли (Berkeley Lab), входит в число кандидатов, отобранных для дальнейшего исследования. В настоящее время он является сильным претендентом на внесение вклада и развитие формата данных и стандарта хранения данных для всего сообщества исследователей нейробиологии. BrainFormat можно использовать бесплатно, его можно скачать здесь.

"Проблема стандартизации форматов данных и обмена файлами присуща не только нейробиологии. Многие области науки, в том числе мировое климатическое сообщество, пытались решить эту проблему," – говорит Оливер Рюбель, научный сотрудник лаборатории Беркли, разработавший BrainFormat. "Обмен данными позволяет исследователям проводить более масштабные и всесторонние исследования. Это, в свою очередь, повышает уверенность в научных результатах и, в конечном итоге, приводит к открытиям."

В связи с этой работой Национальный научно-вычислительный центр энергетических исследований (NERSC) лаборатории Беркли также работает с Джеффом Титерсом и Фрицем Зоммером из Центра теоретической нейробиологии Редвуд в Калифорнийском университете в Беркли над порталом совместного использования данных по вычислительной нейробиологии (CRCNS). что позволит исследователям-неврологам во всем мире легко обмениваться файлами без необходимости загрузки какого-либо специального программного обеспечения.

И BrainFormat, и CRCNS разрабатываются в рамках трехинституционального партнерства между Berkeley Lab, Калифорнийским университетом в Беркли и Калифорнийским университетом в Сан-Франциско (UCSF). Вычислительные инструменты также могут помочь облегчить исследование мозга Белого дома через инициативу по продвижению инновационных нейротехнологий (BRAIN).

Работа с потоком данных в мозгу

В 2013 году президент Барак Обама призвал сообщество нейробиологов получить фундаментальное представление о том, как развивается и функционирует разум, и открыть новые способы борьбы с заболеваниями и травмами мозга. Он назвал это Инициативой BRAIN.

Ожидается, что эта работа создаст поток данных для сообщества нейробиологов. В конце концов, измерение активности части нейронов в головном мозге одной мыши может дать почти столько же данных, сколько Адронный коллайдер, окружность которого составляет 17 миль. Поэтому, прежде чем исследователи смогут даже начать проводить измерения, они должны сначала разработать стандартный формат для маркировки и организации данных, обмена файлами и расширения аналитических и визуализационных методов и программного обеспечения для обработки огромных объемов информации.

"В настоящее время неврология – это сфера деятельности отдельных главных исследователей, которые проводят индивидуальные эксперименты и анализируют эти данные с помощью специального программного обеспечения. Это означает, что данные хранятся во многих различных форматах и ​​описываются по-разному, что затрудняет доступ сообщества к данным," говорит Кристофер Бушар, нейробиолог из лаборатории Беркли. "По мере роста объемов данных нам понадобится больше людей, которые будут смотреть на одни и те же данные по-разному."

Лаборатория Беркли активно ищет способы расширить свой вклад в инициативу BRAIN, и, как ученый из Отдела вычислительных исследований (CRD), Рубель знаком с тем, как помогать ученым из самых разных дисциплин в организации, хранении, доступе, анализе, обмене и огромном сложном наборы данных.

Чтобы придумать соглашение для маркировки, организации, хранения и доступа к данным нейробиологии, Рубель тесно сотрудничал с Бушаром в разработке приложений от нейрохирурга UCSF Эдварда Чанга и физика Berkeley Lab Питера Денеса для разработки BrainFormat с использованием технологий иерархического формата данных с открытым исходным кодом (HDF). За последние 15 лет HDF помогла различным научным дисциплинам систематизировать и обмениваться данными. Одним из известных пользователей HDF является Система наблюдения за Землей НАСА, основное хранилище данных для понимания глобального изменения климата.

Помимо стандартизации формата данных, HDF также оптимизирован для работы на суперкомпьютерах. Таким образом, создав BrainFormat на основе этой технологии, нейробиологи смогут использовать суперкомпьютеры для обработки и анализа своих массивных наборов данных.

"Эта работа действительно подчеркивает уникальную силу партнерства Berkeley Lab, Калифорнийского университета в Беркли и UCSF," говорит Денес. "UCSF известен своим клиническим и экспериментальным опытом нейробиологии в области корковой электрофизиологии in vivo; Калифорнийский университет в Беркли вносит свой вклад в области теоретической нейробиологии, статистического обучения и анализа данных мирового уровня; и Berkeley Lab объединяют опыт суперкомпьютеров и прикладной математики вместе с электроникой, микро- и нанотехнологиями."

Денес возглавляет контингент трех учреждений Berkeley Lab по разработке инструментальных средств и вычислительных методов для записи данных нейробиологии. Помимо разработки инструментов для борьбы с потоком данных, Инициатива BRAIN также потребует нового оборудования для сбора большего количества данных с более высоким разрешением и обработки их в режиме реального времени. Исследователям также потребуются новые алгоритмы анализа данных. Трехинституциональное партнерство также использует инструменты и опыт из различных областей науки для решения этих проблем.

"Сила Berkeley Lab всегда заключалась в науке о масштабе," говорит Прабхат, ученый-компьютерщик из лаборатории Беркли. "На протяжении многих лет многие области науки боролись с проблемами стандартизации форматов файлов, а также с управлением и совместным использованием массивных наборов данных, и наши сотрудники построили для них аналогичные инфраструктуры. Это не новая проблема, с BrainFormat и порталом CRCNS мы только что распространили эти решения на область нейробиологии."