Разработчики и производители электронной медицинской аппаратуры, в которой используются различные методы математической обработки и анализа биомедицинских сигналов, постоянно сталкиваются с проблемой получения выборок реальных данных, необходимых как для поддержки работ по созданию алгоритмов и методов анализа, так и для оценки качества разработанных методов.
Примерно начиная с 1970-х годов, специалисты из Массачусетского технологического института (Massachusetts Institute of Technology; MIT, Бостон, США), работая над созданием первых микропроцессорных кардиологических мониторов, осознали необходимость формирования общедоступной базы данных аннотированных записей ЭКГ, которая могла бы послужить основой для разработки, совершенствования и объективного сравнения между собой алгоритмов автоматического анализа сердечного ритма по ЭКГ. Пятилетние усилия в этом направлении завершились в 1980 году созданием базы данных аритмий (М1Т-В1Н Arrhythmia Database), которая за короткое время завоевала репутацию общепринятого стандарта. Вслед за этим одна за другой начали появляться новые базы данных ЭКГ и других физиологических сигналов. К 1999 г. сотрудниками MIT был распространен комплект оптических дисков, содержащих уже 11 подобных коллекций сигналов. Создание портала «PhysioNet Resource» позволило нс только сделать эти базы данных общедоступными, но и открыть возможность для расширения их состава всеми желающими исследователями.
Портал «PhysioNet Resource» включает в себя три основных компонента:
· Архив записей сигналов «PhysioBank», представляющий собой большой и постоянно расширяющийся набор тщательно аннотированных цифровых записей физиологических сигналов, временных последовательностей и различного вида сопровождающей информации. В настоящее время (2016 год) «PhysioBank» содержит более 60 коллекций кардио-пульмонарных, неврологических и других сигналов как от здоровых пациентов, так и от пациентов, страдающих различными видами заболеваний. В частности, направленность данных коллекций охватывает такие социально значимые медицинские проблемы, как внезапная кардиологическая смерть, застойная сердечная недостаточность, эпилепсия, нарушения походки, апноэ сна и старение.
· Библиотека программ «PhysioToolkit» является обширным и постоянно расширяющимся набором программных средств, предназначенных для обработки и анализа физиологических сигналов, обнаружения значимых с точки зрения физиологии событий, интерактивного отображения и аннотирования сигналов, создания новых баз данных, моделирования физиологических и других сигналов, количественной оценки и сравнения методов анализа сигналов, а также для анализа нестационарных сигналов. Всё программное обеспечение свободно доступно в форме исходных кодов программ на условиях общественной лицензии «GNU» (General Public License, GPL).
· Виртуальная лаборатория «PhysioNetWorks» обеспечивает возможность сотрудничества с коллегами со всего мира в направлении создания, оценки, совершенствования, документирования и подготовки новых данных и программных средств для публикации на портале «PhysioNet Resource». В отличие от остальных двух компонентов портала, доступ в виртуальную лабораторию защищен паролем (который легко может быть получен в течении нескольких минут). Для участников лаборатории доступны надежные средства сохранения данных, удобные программы для просмотра и аннотирования сигналов, а также возможность интерактивного взаимодействия с более чем 3000 других исследователей.
Все базы данных, размещаемые на портале «PhysioNet Resource», должны быть подготовлены в соответствии со специально разработанным форматом, который предусматривает три вида файлов:
Заголовочные файлы. Представляют собой небольшие текстовые файлы, которые описывают сигналы (имя или URL файла сигнала, формат хранения, количество и типы сигналов, частота дискретизации, информация о калибровке, характеристики аналого-цифрового преобразования, продолжительность записи и начальное время).
Файлы аннотаций. Содержат набор меток, каждая из которых описывает свойства одного или нескольких сигналов в заданные моменты времени. Метки должны следовать в файле строго в порядке нарастания времени. Информация в файлах аннотаций упакована с использованием специального формата. Поэтому доступ к ней возможен только с помощью специальных программ из библиотеки «PhysioToolkit».
Файлы сигналов. Содержат в бинарном виде цифровые отсчеты сигналов, которые могут быть представлены либо непосредственно значениями отсчетов, либо в одном из предусмотренных форматов упаковки, служащих для сокращения занимаемого объема памяти. Объём файлов сигналов может быть очень велик (до десятков и сотен мегабайт).
Все три вида файлов, относящихся к одной записи сигнала, должны иметь одинаковое имя, но разные расширения. Заголовочные файлы имеют расширение «hea», файлы данных — расширение «dat», а файлы аннотаций могут иметь произвольные расширения, определяемые создателями и пользователями конкретной базы данных. Причём одной и той же записи сигнала могут соответствовать несколько видов файлов аннотаций, что позволяет осуществлять аннотирование записей с различных точек зрения.
В качестве примера рассмотрим описание одной из двухканальных записей ЭКГ из базы данных аритмий «М1Т-В1П Arrhythmia Database». Эта запись в базе данных имеет имя «119». Рассмотрим содержимое заголовочного файла «119.hea»:
· 119 2 360 650000
· 119.dat 212 200 11 1024 825 2943 О MI.II
· 119.dat 212 200 11 1024 930 -26388 О VI
· # 51 F 1129 654 х2
· # Pronestyl
· # The PVCs arc uniform.
В первой строке указано имя записи (119). число каналов сигнала (2), частота дискретизации (360 Гц) и общее число отсчетов сигнала в каждом из каналов (650000).
Во второй и третьей строках содержится информация, относящаяся к сигналам первого и второго каналов соответственно. Например, данные для первого канала, перечисленные во второй строке заголовочного файла имеют следующий смысл:
· 119.dat — имя файла, в котором содержится сигнал;
· 212 — обозначение используемого формата упаковки отсчетов сигнала;
· 200 – масштаб сигнала (число уровней квантования на I мВ);
· 11 разрядность аналого-цифрового преобразования; 1024 уровень нулевой линии дискретизованного сигнала;
· 825 — значение первого отсчета сигнала по данному каналу;
· 2943 — контрольная сумма, служащая для проверки ошибок;
· 0 — размер буфера для чтения сигнала (здесь не используется);
· MLII — обозначение отведения ЭКГ (здесь — мониторное отведение II).
Последние три строки заголовочною файла содержат комментарии для данной записи ЭКГ.
В файле с именем «119.dat» сигнал записан в виде последовательности II-битных отсчетов, представляющих собой целые неотрицательные числа, которые могут принимать значения от 0 до 2047. Для пересчета сигнала к общепринятому масштабу в милливольтах необходимо от каждого значения отнять величину указанного в заголовочном файле уровня нулевой линии (1024) и разделить результат на величину масштаба сигнала (400).
Ниже приведены данные из файла аннотаций, относящиеся к показанному на рисунке фрагменту сигнала:
· 32 +
· 309 N
· 503 V
· 977 N
· 1315 N
· 1651 N
· 1971 N
· 2294 N
· 2488 V
· 2956 N
· 3296 N
В первом поле каждой строки указана позиция отмеченной точки сигнала, выраженная в отсчетах (для перехода к времени в секундах это значение надо разделить на частоту дискретизации 360 Гц). Во втором поле каждой строки содержится идентификатор, раскрывающей смысл данной отметки времени. В нашем случае мы имеем три варианта таких идентификаторов:
· + — признак смены ритма (в самом начале записи ставится всегда);
· N — QRS-комплекс фонового ритма (относящийся к «норме»);
· V желудочковый комплекс (желудочковая экстрасистола).
Отметим, что приведенный пример является очень упрощенной иллюстрацией. В действительности, предлагаемый формат представления данных намного сложнее и обеспечивает пользователю богатый и гибкий набор возможностей. Подробное описание как форматов данных, так и специализированных программ для манипуляций с данными содержится в инструкциях, доступных на портале «PhysioNet Resource».
Одной из наиболее важных возможностей, предлагаемых порталом «PhysioNet Resource», является набор функций, позволяющих выполнять сравнение между собой различных алгоритмов обработки и анализа физиологических сигналов. Эта возможность поддерживается специализированным программным обеспечением, свободно доступным на данном сайте. Сравнение осуществляется путем сопоставления данных, содержащихся в двух файлах аннотаций, из которых один обычно содержит данные верификации (то есть служит эталоном), а другой — выраженные в тех же терминах и представленные в том же формате результаты работы некоторого испытуемого алгоритма. Программы реализуют сравнение информации из пары сравниваемых файлов аннотаций, подсчет ошибок и формирование итоговых таблиц, в которых имеются как сводные результаты по всему используемому набору записей, так и подробная расшифровка для каждой из записей. Анализ получаемых результатов позволяет как получать объективные стандартизованные оценки качества алгоритмов, так и осуществлять целенаправленную работу по совершенствованию программно-алгоритмического обеспечения систем анализа биомедицинских сигналов.
Задание по ЛР
На портале https://physionet.org/ в разделе Data найти раздел Neuroelectric and Myoelectric Databases.
В разделе Neuroelectric and Myoelectric Databases выбрать EEG During Mental Arithmetic Tasks
Ознакомиться с визуализатором Visualize waveforms
На любой из последовательности, выявить все альфа волны (см. 1 часть методички)
Произвести спектральный анализ (см. 2 часть методички)
Сделать выводы о возможности использования ЭЭГ для нейроинтерфейсов.