Непараметрическая сегментация

Технология непараметрической сегментации ЭЭГ была разработана на основе теории так называемого анализа моментов резких изменений или разладок во временных рядах, имеющих четко выраженную кусочно-стационарную структуру. Определенные таким образом разладки являются, по сути дела, метками границ между квази-стационарными фрагментами. В рамках теоретической разработки этой проблемы было показано, что задача обнаружения изменения любой вероятностной характеристики данного стохастического процесса может быть сведена к одному и тому же алгоритму детекции изменений математического ожидания, но применяемому к различным модификациям исходного временного ряда. Каждая такая модификация или диагностическая последовательность может подчеркивать те или иные статистические особенности исходного процесса. Например, корреляционное преобразование исходного временного ряда проявит динамическую изменчивость дисперсионных свойств этого процесса.

При адаптации этой методологии к задаче сегментирования ЭЭГ была разработана специальная статистическая процедура для обнаружения моментов "разладок", основанная на обобщенном варианте статистики Колмогорова-Смирнова [15, 16]. Использование этих критериев в технике сегментирования ЭЭГ с учетом их вероятностных распределений, полученных в численном эксперименте на ЭЭГ подобных кривых, впервые позволило не только надежно обнаруживать границы сегментов, но и оценивать доверительные интервалы их позиционирования в рамках тестируемого фрагмента ЭЭГ [16]. В ходе адаптации методов обнаружения разладок для целей сегментирования ЭЭГ было показано, что в качестве диагностической последовательности целесообразно использовать нормированную автокорреляционную функцию ЭЭГ сигнала [15, 16].

Конкретный алгоритм поиска разладок в ЭЭГ был разработан, в том числе, и с намерением оценить всю иерархию сегментных описаний ЭЭГ в разных временных масштабах. Для этого, во-первых, была принята безоконная система компарации оценок ЭЭГ, позволяющая при поиске неоднородностей учитывать всю запись целиком: сравнение оценок математического ожидания сигнала или его диагностической последовательности проводилось слева и справа от движущейся вдоль записи ЭЭГ точки ее деления на две части. Во-вторых, для более точного вычисления порогового критерия, фиксирование разладок производилось поэтапно: сначала обнаруживалась самая мощная разладка, ставящая границу между двумя наиболее крупными сегментами ЭЭГ записи. Затем процедура повторялась, но уже не для всей записи, а для более однородных ее участков по обе стороны от первой разладки. Относительно разладок второго уровня также формировались еще более однородные участки, которые в свою очередь подвергались поточечному сканированию, и так до того момента, когда количество отсчетов очередного участка ЭЭГ не достигнет порога, ниже которого оценки математического ожидания в данном методе становятся статистически неустойчивыми.

Поскольку при любой технологии поиска моментов физических перестроек в ЭЭГ результаты этого поиска могут быть получены только в вероятностных оценках, существенным преимуществом данного подхода является возможность задавать в явном виде вероятность "ложной тревоги" (детекция отсутствующего сигнала) и "ложного спокойствия" (пропуск имеющегося сигнала) при детектировании границ сегментов. Помимо возможности гибкой оптимизации задачи обнаружения границ сегментов с точки зрения экспериментатора, это позволяет настраивать процедуру на работу в разных временных шкалах. Поднимая пороговый уровень "ложных тревог", например, можно настроиться только на наиболее выраженные межсегментные переходы, оценивая, таким образом, только макроскопическую сегментную структуру ЭЭГ. При снижении порога "ложных тревог" можно получить более детальную "микроскопическую" картину сегментной организации ЭЭГ.

Методология непараметрического анализа основана на двух идеях. Доказано, что определение изменений в любой функции распределения или вероятностной характеристике может быть сведено (с любой степенью точности) к определению изменений в математическом ожидании какой-либо другой последовательности, сформированной из первоначальной. Новую последовательность будем называть диагностической последовательностью. Например, рассматривая автокорреляционные функции

 

 

мы сведем задачу к определению изменений в одной из последовательностей . Изменения в автокорреляционных значениях соответствуют изменениям в спектрах мощности, так как спектр мощности равен преобразованию Фурье автокорреляционной функции. В частности  идентично полной мощности (по теореме Парсеваля).

Вторая идея подхода - это использование следующего семейства статистик:

 

 

Где , ,  - реализация диагностической последовательности. N - количество отсчетов в этой последовательности (в нашем случае во всей записи ЭЭГ). Это семейство статистик - обобщенный вариант статистики Колмогорова-Смирнова, которая используется для изучения совпадений или различий в функциях распределения двух последовательностей (фиксированного размера n). Другими словами мы рассчитываем разницу между средним значением первых n отсчетов и последних N-n отсчетов, умноженную на коэффициент в зависимости от . Это вычисление проводится для всех n: . Затем мы сравниваем максимум из этих n разностей со специальным порогом. Порог рассчитывается на основе предельных характеристик статистики (при ). Мы принимаем решение о стационарности реализации ЭЭГ если этот порог не достигнут, в противном случае считаем эту точку границей стационарных сегментов.

Метод может характеризоваться с помощью таких величин, как вероятность ложной тревоги (вероятность принятия решения о наличии границы, когда ее на самом деле нет), вероятность ложного спокойствия (вероятность того, что мы не заметим границу там, где она есть на самом деле) и временная погрешность границы сегментов. Для данной статистики эти величины являются функциями, зависящим от . Важное свойство используемой статистики заключается в том, что случай  обеспечивает минимум вероятности ложной тревоги, с другой стороны случай  соответствует минимуму вероятности ложного спокойствия и случай  обеспечивает минимальную временную погрешность границ сегментов.

Главным параметром, который должен определить пользователь для вычисления сегментации, является вероятность ложной тревоги. Чем меньше эта вероятность, тем больше порог и тем более сильные изменения статистики будут замечены. Корректируя вероятность ложной тревоги, можно фокусироваться либо на изучении макроструктуры ЭЭГ (высокий порог), либо микроструктуры (низкий порог).

Данный метод сегментации состоит из 3 этапов.

1 этап. На первом этапе задается вероятность ложной тревоги максимальной , т.е. нужно обнаружить все точки, в которых возможно изменение стационарности, включая те точки, которые могут быть ложными.

Формируем диагностическую последовательность, состоящую из автокорреляционных значений ЭЭГ данных:

 

 

Затем вычисляется статистика для данной последовательности и находится  и порог C. Если , то можно считать последовательность стационарной, в противном случае мы нашли точку нестационарности и получили 2 участка исходной последовательности, для которых заново находим статистику и порог, и повторяем процедуру проверки стационарности. Продолжаем вычисления рекурсивно, пока не получим набор стационарных сегментов.

Порог рассчитывается на основе предельной теоремы в зависимости от данной вероятности ложной тревоги. Доказано, что для стационарных последовательностей вероятность  стремится к значению , где  - дисперсия последовательности [19].

2 этап. На данном этапе нужно отбросить сомнительные точки, найденные на 1 этапе. Пусть на 1 этапе было найдено k точек нестационарности. Тогда формируем k новых отрезков.

 

 

Где ,  - набор точек нестационарностей (номера отсчетов).

Таким образом, получаем набор предположительно нестационарных сегментов  с центрами в точках . Для каждого сегмента вычисляется статистика с меньшей вероятностью ложной тревоги (более точный результат), порог C и проверятся действительно ли сегмент является нестационарным. Если нет, то данный сегмент исключается из дальнейшего рассмотрения.

Так как границы сегмента формируется половиной расстояний до ближайших точек нестационарности, сегмент получается более коротким, чем изначальный сегмент 1 этапа, на котором  была максимумом и вычисленная статистика должна дать более точный результат.

3 этап. На данном этапе рассматриваются только те сегменты , которые остались после 2 этапа. Для них рассчитывается статистика с вероятностью ложной тревоги  (самый точный случай). Так как на 2 этапе мы уже было выяснено, что данные сегменты нестационарны, то сейчас не нужно находить порог и сравнивать максимум статистики с ним. Просто находим максимум статистики для каждого сегмента и считаем эту точку окончательным вариантом точки нестационарности.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: