Базы данных физиологических сигналов «physionet.org»

Разработчики и производители электронной медицинской аппаратуры, в которой используются различные методы математической обработки и анализа биомедицинских сигналов, постоянно сталкиваются с проблемой получения выборок реальных данных, необходимых как для поддержки работ по созданию алгоритмов и методов анализа, так и для оценки качества разработанных методов.

Примерно начиная с 1970-х годов, специалисты из Массачусетского технологического института (Massachusetts Institute of Technology; MIT, Бостон, США), работая над созданием первых микропроцессорных кардиологических мониторов, осознали необходимость формирования общедоступной базы данных аннотированных записей ЭКГ, которая могла бы послужить основой для разработки, совершенствования и объективного сравнения между собой алгоритмов автоматического анализа сердечного ритма по ЭКГ. Пятилетние усилия в этом направлении завершились в 1980 году созданием базы данных аритмий (М1Т-В1Н Arrhythmia Database), которая за короткое время завоевала репутацию общепринятого стандарта. Вслед за этим одна за другой начали появляться новые базы данных ЭКГ и других физиологических сигналов. К 1999 г. сотрудниками MIT был распространен комплект оптических дисков, содержащих уже 11 подобных коллекций сигналов. Создание портала «PhysioNet Resource» позволило нс только сделать эти базы данных общедоступными, но и открыть возможность для расширения их состава всеми желающими исследователями.

Портал «PhysioNet Resource» включает в себя три основных компонента:

· Архив записей сигналов «PhysioBank», представляющий собой большой и постоянно расширяющийся набор тщательно аннотированных цифровых записей физиологических сигналов, временных последовательностей и различного вида сопровождающей информации. В настоящее время (2016 год) «PhysioBank» содержит более 60 коллекций кардио-пульмонарных, неврологических и других сигналов как от здоровых пациентов, так и от пациентов, страдающих различными видами заболеваний. В частности, направленность данных коллекций охватывает такие социально значимые медицинские проблемы, как внезапная кардиологическая смерть, застойная сердечная недостаточность, эпилепсия, нарушения походки, апноэ сна и старение.

· Библиотека программ «PhysioToolkit» является обширным и постоянно расширяющимся набором программных средств, предназначенных для обработки и анализа физиологических сигналов, обнаружения значимых с точки зрения физиологии событий, интерактивного отображения и аннотирования сигналов, создания новых баз данных, моделирования физиологических и других сигналов, количественной оценки и сравнения методов анализа сигналов, а также для анализа нестационарных сигналов. Всё программное обеспечение свободно доступно в форме исходных кодов программ на условиях общественной лицензии «GNU» (General Public License, GPL).

· Виртуальная лаборатория «PhysioNetWorks» обеспечивает возможность сотрудничества с коллегами со всего мира в направлении создания, оценки, совершенствования, документирования и подготовки новых данных и программных средств для публикации на портале «PhysioNet Resource». В отличие от остальных двух компонентов портала, доступ в виртуальную лабораторию защищен паролем (который легко может быть получен в течении нескольких минут). Для участников лаборатории доступны надежные средства сохранения данных, удобные программы для просмотра и аннотирования сигналов, а также возможность интерактивного взаимодействия с более чем 3000 других исследователей.

Все базы данных, размещаемые на портале «PhysioNet Resource», должны быть подготовлены в соответствии со специально разработанным форматом, который предусматривает три вида файлов:

Заголовочные файлы. Представляют собой небольшие текстовые файлы, которые описывают сигналы (имя или URL файла сигнала, формат хранения, количество и типы сигналов, частота дискретизации, информация о калибровке, характеристики аналого-цифрового преобразования, продолжительность записи и начальное время).

Файлы аннотаций. Содержат набор меток, каждая из которых описывает свойства одного или нескольких сигналов в заданные моменты времени. Метки должны следовать в файле строго в порядке нарастания времени. Информация в файлах аннотаций упакована с использованием специального формата. Поэтому доступ к ней возможен только с помощью специальных программ из библиотеки «PhysioToolkit».

Файлы сигналов. Содержат в бинарном виде цифровые отсчеты сигналов, которые могут быть представлены либо непосредственно значениями отсчетов, либо в одном из предусмотренных форматов упаковки, служащих для сокращения занимаемого объема памяти. Объём файлов сигналов может быть очень велик (до десятков и сотен мегабайт).

Все три вида файлов, относящихся к одной записи сигнала, должны иметь одинаковое имя, но разные расширения. Заголовочные файлы имеют расширение «hea», файлы данных — расширение «dat», а файлы аннотаций могут иметь произвольные расширения, определяемые создателями и пользователями конкретной базы данных. Причём одной и той же записи сигнала могут соответствовать несколько видов файлов аннотаций, что позволяет осуществлять аннотирование записей с различных точек зрения.

В качестве примера рассмотрим описание одной из двухканальных записей ЭКГ из базы данных аритмий «М1Т-В1П Arrhythmia Database». Эта запись в базе данных имеет имя «119». Рассмотрим содержимое заголовочного файла «119.hea»:

· 119 2 360 650000

· 119.dat 212 200 11 1024 825 2943 О MI.II

· 119.dat 212 200 11 1024 930 -26388 О VI

· # 51 F 1129 654 х2

· # Pronestyl

· # The PVCs arc uniform.

В первой строке указано имя записи (119). число каналов сигнала (2), частота дискретизации (360 Гц) и общее число отсчетов сигнала в каждом из каналов (650000).

Во второй и третьей строках содержится информация, относящаяся к сигналам первого и второго каналов соответственно. Например, данные для первого канала, перечисленные во второй строке заголовочного файла имеют следующий смысл:

· 119.dat — имя файла, в котором содержится сигнал;

· 212 — обозначение используемого формата упаковки отсчетов сигнала;

· 200 – масштаб сигнала (число уровней квантования на I мВ);

· 11 разрядность аналого-цифрового преобразования; 1024 уровень нулевой линии дискретизованного сигнала;

· 825 — значение первого отсчета сигнала по данному каналу;

· 2943 — контрольная сумма, служащая для проверки ошибок;

· 0 — размер буфера для чтения сигнала (здесь не используется);

· MLII — обозначение отведения ЭКГ (здесь — мониторное отведение II).

Последние три строки заголовочною файла содержат комментарии для данной записи ЭКГ.

В файле с именем «119.dat» сигнал записан в виде последовательности II-битных отсчетов, представляющих собой целые неотрицательные числа, которые могут принимать значения от 0 до 2047. Для пересчета сигнала к общепринятому масштабу в милливольтах необходимо от каждого значения отнять величину указанного в заголовочном файле уровня нулевой линии (1024) и разделить результат на величину масштаба сигнала (400).

Ниже приведены данные из файла аннотаций, относящиеся к показанному на рисунке фрагменту сигнала:

· 32 +

· 309 N

· 503 V

· 977 N

· 1315 N

· 1651 N

· 1971 N

· 2294 N

· 2488 V

· 2956 N

· 3296 N

В первом поле каждой строки указана позиция отмеченной точки сигнала, выраженная в отсчетах (для перехода к времени в секундах это значение надо разделить на частоту дискретизации 360 Гц). Во втором поле каждой строки содержится идентификатор, раскрывающей смысл данной отметки времени. В нашем случае мы имеем три варианта таких идентификаторов:

· + — признак смены ритма (в самом начале записи ставится всегда);

· N — QRS-комплекс фонового ритма (относящийся к «норме»);

· V желудочковый комплекс (желудочковая экстрасистола).

Отметим, что приведенный пример является очень упрощенной иллюстрацией. В действительности, предлагаемый формат представления данных намного сложнее и обеспечивает пользователю богатый и гибкий набор возможностей. Подробное описание как форматов данных, так и специализированных программ для манипуляций с данными содержится в инструкциях, доступных на портале «PhysioNet Resource».

Одной из наиболее важных возможностей, предлагаемых порталом «PhysioNet Resource», является набор функций, позволяющих выполнять сравнение между собой различных алгоритмов обработки и анализа физиологических сигналов. Эта возможность поддерживается специализированным программным обеспечением, свободно доступным на данном сайте. Сравнение осуществляется путем сопоставления данных, содержащихся в двух файлах аннотаций, из которых один обычно содержит данные верификации (то есть служит эталоном), а другой — выраженные в тех же терминах и представленные в том же формате результаты работы некоторого испытуемого алгоритма. Программы реализуют сравнение информации из пары сравниваемых файлов аннотаций, подсчет ошибок и формирование итоговых таблиц, в которых имеются как сводные результаты по всему используемому набору записей, так и подробная расшифровка для каждой из записей. Анализ получаемых результатов позволяет как получать объективные стандартизованные оценки качества алгоритмов, так и осуществлять целенаправленную работу по совершенствованию программно-алгоритмического обеспечения систем анализа биомедицинских сигналов.

Задание по ЛР

На портале https://physionet.org/ в разделе Data найти раздел Neuroelectric and Myoelectric Databases.

В разделе Neuroelectric and Myoelectric Databases выбрать EEG During Mental Arithmetic Tasks

Ознакомиться с визуализатором Visualize waveforms

На любой из последовательности, выявить все альфа волны (см. 1 часть методички)

Произвести спектральный анализ (см. 2 часть методички)

Сделать выводы о возможности использования ЭЭГ для нейроинтерфейсов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: