Алгоритмы обнаружения слабых сигналов

После обработки и построения карт геофизических полей, приступаем непосредственно к интерпретации (изучению геофизических полей) для выявления аномалий перспективных на обнаружение кимберлитовых тел. Предварительно надо провести еще одну математическую обработку полученных данных.

Критерии оптимальной фильтрации и соответствующие им алгоритмы обработки исходных данных обеспечивают выделение сигналов на фоне помех. На сегодняшний день известно два метода обнаружения слабых сигналов: параметрические и непараметрические. Принятие решения о наличии или отсутствии полезного сигнала после фильтрации осуществляется интерпретатором визуально. К сожалению, не всегда можно увидеть аномалию и сказать, что она обусловлена кимберлитовыми телами. Это обстоятельство делает последний этап обработки весьма субъективным, особенно для случая обнаружения слабых сигналов.

Большинство кимберлитовых тел создают слабые сигналы (аномалии).

В разведочной геофизике слабым сигналом (слабой аномалией) принято считать сигнал, который соизмерим по интенсивности с уровнем помех или ниже этого уровня. Его визуальное обнаружение практически исключено. Тем не менее, проблема обнаружения слабых сигналов в разведочной геофизике приобретает все большее значение в связи с поисками коренных месторождений алмазов. Под обнаружением сигнала обычно понимают факт установления его наличия. Однако, устанавливая факт наличия сигнала, тем самым относят сигнал к определенной точке наблюдения, частично решая одновременно и задачу выделения сигнала, состоящую в оценке параметров и формы сигнала. Нередко после обнаружения сигнала удается перейти к оценке его формы. Поэтому, рассматривая алгоритмы обнаружения слабых сигналов и оценку их параметров, можно считать, что решается задача их выделения.

Среди алгоритмов обнаружения слабых аномалий наиболее широко используются алгоритмы, построенные на критериях принятия статистических решений (таблица 6.1).

Эти критерии исходят из предположения о нормальном характере распределения помех. В связи с этим соответствующие им алгоритмы обнаружения носят название параметрических, поскольку нормальный закон распределения описывается двумя основными параметрами: математическим ожиданием и дисперсией (при некоррелированной помехе).

Таблица.6.1 – Критерии принятия статистических решений.

Критерий	Условия критерия	Правило решения (пороговое значение коэффициента правдоподобия)
Бейеса (минимального риска)	min [r(h) = p₀C_aa + p₁C_bb]	L₀ = p₀C_a/p₁C_b
Котельникова (идеального наблюдателя)	min (q = p₀a + p₁b)	L₀= p₀/p₁
Максимального правдоподобия	min q при p₀ = p₁ (a = b)	L₀ = 1
Максимума апостериорной вероятности	Max [p(H₁/X), p(H₀/X)]	P(H₁/X)>0.5 при p₀ = p₁
Минимакса	min r_max	L₀ = C_ap₀^/C_bp₁^, где p₁^*находится из условия C_aa = C_bb
Неймана-Пирсона	Min b при a = a₀	L₀ находится из интеграл P(L/H₁)¶L = a₀

Приведу критерии принятия статистических решений.

При проверке той или иной гипотезы всегда подразумевается наличие конкурирующей, или альтернативной гипотезы. Поэтому пространство наблюдений следует разбить на две области S₀и S₁. Область S₀образует множество точек, соответствующих принятию выдвинутой гипотезы (например, о равенстве средних, дисперсий, об отсутствии сигнала в наблюденных данных и т.д.). Область S₁ включает множество точек, соответствующих принятию альтернативной гипотезы (например, о неравенстве средних, дисперсий, о наличии сигнала в наблюдениях, искаженных помехами, и т.д.). Обозначим проверяемую гипотезу через Н₀ (нулевая гипотеза), а альтернативную ей – через Н₁ (ненулевая гипотеза). Обе гипотезы взаимно исключают друг друга и, следовательно, образуют полную группу событий. Выбор одной из гипотез называется статистическим решением. Принятие статистического решения сопровождается ошибками I и II рода.

Ошибка первого рода заключается в том, что принимается гипотеза Н₁, в то время как в действительности выполнятся гипотеза Н₀. Например, принимается решение о наличии сигнала (или о неравенстве средних, или о неравенстве дисперсий), в то время как на самом деле сигнал отсутствует (или равны средние, или равны дисперсии). В задачах выделения сигнала на фоне помех эта ошибка называется ошибкой обнаружения ложного сигнала.

Ошибка второго рода заключается в том, что принимается гипотеза Н₀, в том время как в действительности справедлива гипотеза Н₁. такая ошибка означает, что принимается, например, решение об отсутствии сигнала (или о равенстве средних, или о равенстве дисперсий), в то время как на самом деле сигнал имеется (или не равны средние, или не равны дисперсии). В задачах выделения сигнала эта ошибка называется ошибкой пропуска сигнала.

С ошибками I и II рода связаны соответствующие вероятности. Для их определения обозначим через Р(Х/ Н₀) оценку плотности распределения фиксированной выборки из элементов х₁, …, х_n, которая соответствует гипотезе Н₀, а через Р(Х/Н₁) – оценку плотности той же выборки, соответствующей гипотезе Н₁. Величины Р(Х/ Н₀) и Р(Х/Н₁) называют также функциями правдоподобия. Тогда вероятность ошибки I рода будет

a = ∫ Р(Х/Н₀) d W(Х) = Р(Х/Н₀) d X (6.1)

вероятность ошибки II рода

b = ∫ Р(Х/Н₁) d W(Х) = Р(Х/Н₁) d X (6.2)

где W(Х) – n-мерное пространство выборки х₁, …, х_n; h – порог для принятия решения, в частности h – прямая, разделяющая пространство W(Х) на области S₀и S₁.

Вероятности ошибок a и b определяются соответственно обозначенными областями на рисунке 6.1.

Р, %

P(x/H₁) P(x/H₂)

b a

Рис. 6.1 Плотность распределения признака x_i

Если ввести априорные вероятности гипотез Н₀и Н₁, равные соответственно р₀и р₁, то величина

q = р₀a + р₁b (6.3)

определяет полную безусловную вероятность ошибки.

Мощность характеризует чувствительность критерия, его способность отличать альтернативу от нулевой гипотезы. Расширение для гипотезы Н₀ критической области S₀ влечет за собой увеличение вероятности ошибки I рода и уменьшение вероятности ошибки II рода, т.е. для заданного размера выборки невозможно сделать сколь угодно малыми вероятности ошибок I и II рода. Критерий, который обеспечивает минимальную вероятность ошибки II рода при проверке простой (нулевой) гипотезы относительно простой альтернативной, называется наиболее мощным. Наиболее мощный критерий относительно всех возможных альтернативных гипотез называется равномерно наиболее мощным.

С ошибками I и II рода неизбежно связаны потери, которые с экономической точки зрения могут быть равными, что легко показать на примере задачи обнаружения сигнала на фоне помех. С этой целью вводят цены ошибок I и II рода С_a и С_b. произведение С_aa называется риском, соответствующим гипотезе Н₀. В задаче выделения сигнала это будет некоторая потеря (штраф), обусловленная принятием неправильного решения о наличии сигнала. Аналогично произведение С_bb есть риск, соответствующий гипотезе Н₁.

Средний риск при принятии решения

r(h) = p₀ С_aa + p₁ С_bb. (6.4)

Средний риск r(h) зависит от порога h, так как от h зависят значения вероятностей a иb.

Для принятия решения естественным является выбор такого порога h, который бы минимизировал средний риск (7.4). Правило, согласно которому величина h выбирается с учетом минимизации среднего риска, называется критерием Бейеса. При этом

h = Р(Х/Н₁)/ Р(Х/Н₀) = p₀ С_a/ p₁ С_b. (6.5)

Величина

L = Р(Х/Н₁)/ Р(Х/Н₀) (6.6)

называется отношением, или коэффициентом правдоподобия. Чтобы применять критерий Бейеса, надо установить цены, соответствующие каждому роду ошибок, а также априорные вероятности гипотез Н₀и Н₁. при этом однозначно определяется порог h = L₀, выше которого (L>L₀) принимается решение о выполнении гипотезы Н₁, в противном случае (L<L₀) – о выполнении гипотезы Н₀. Достоверная оценка значений С_a и С_b обычно связана с анализом большего статистического материала, который может быть получен, например, при решении задачи выделения сигналов на фоне помех для районов с хорошей геолого-геофизической изученностью. При отсутствии подобной информации в первом приближении полагают С_a = С_b. Это соответствует равным весам, которые приписываются, например, пропуску полезного сигнала и обнаружению ложного сигнала. Тогда средний риск (7.4) определяется полной безусловной вероятностью ошибки, и выбор порога h с учетом ее минимизации приводит к критерию Котельникова (или идеального наблюдателя). Величина h по критерию Котельникова определяется отношением априорных вероятностей h = L₀ = р₀/р₁. в практике геофизических исследований вероятности р₀ и р₁ также, как правило, неизвестны. Поэтому обычно считают р₀ = р₁= 0,5, что отвечает максимальной неопределенности гипотез Н₀и Н₁. Порог h становится равным единицы, т.е. h = L₀ = 1 соответствует критерию максимального правдоподобия (частный случай критерия Котельникова).

Применение теоремы Котельникова при заданных вероятностях р₀ и р₁ позволяет на основе формулы Бейеса (7.5) оценить апостериорную вероятность любой из гипотез, например, для гипотезы Н₁:

p(Н₁/X) = (p₁P(/H₁))/(p₁P(X/H₁) + p₀P(X/H₂)) = Lp₁p₀/(Lp₁/p₀ + 1) (6.7)

При этом принятие решения может базироваться на критерии максимума апостериорной вероятности.

Когда задание априорных вероятностей р₀и р₁является нецелесообразным, используется правило принятия решения, соответствующее так называемому минимаксному критерию, сущность которого заключается в следующем. Поскольку средний риск (7.4) зависит от априорных вероятностей, то наименьший риск имеет максимум при некотором значении р₁^*= 1- р₀^*, не равном ни нулю, ни единице, так как при р₁ ® 0 и при р₀® 0 риск стремиться к нулю. Очевидно, если выбрать критическое значение р₁^* и определить порог h для коэффициента правдоподобия как L₀ = p₀^* С_a/ p₁^* С_b, то действительный риск при любом, отличном от p₁^* значении p₁, не превзойдет риска, рассчитанного для L₀ = L₀ ^*. Значение вероятности p₁^* находится из уравнения ¶r(h)¶p₁ = 0, что приводит к равенству

С_bb = С_aa (6.8)

При минимаксном критерии принимают во внимание наихудший случай, что в конечном итоге определяет весьма осторожное правило принятия решения.

При отсутствии априорных данных о потерях и вероятностях р₀и р₁ используется критерий Неймана–Пирсона. Согласно этому критерию, выбирается такое правило, которое обеспечивает минимально возможное значение вероятности ошибки II рода b при условии, что вероятность ошибки I рода не будет больше заданной величины a₀, т.е. при a = a₀ = const находится min b.

При заданной величине a = a₀и известной функции правдоподобия P(X/H₀) можно определить порог h, равный L₀. С этой целью перейдем от n-мерной величины X к одномерной переменной коэффициента правдоподобия, т.е. P(X/H₁)¶X = P(L/H₁)¶L и P(X/H₀)¶X = P(L/H₀)¶L.

Действительно, правые и левые части таких равенств выражают одну и ту еж условную вероятность принятия решения о гипотезе Н₁ или о гипотезе Н₀. Области S₀ и S₁ при переходе от Х к L преобразуются в числовую ось значений L, на которой значение L₀ представляет границу (порог) для соответствующих гипотез. Отсюда

a = Р(L/H₀)¶L и b = интеграл Р(L/H₁)¶L (6.9)

Поскольку вероятность a равна заданной величине a₀, то заданным является и пороговое значение L₀. при этом доказано, что величина b имеет минимум для L =L₀, где L₀ определяется из (6.7) при a = a₀.

При решении задач выделения сигналов на фоне помех обычно применяются критерии максимального правдоподобия и Неймана-Пирсона.

Далее я хочу привести параметрические алгоритмы обнаружения сигналов, построенные при различных априорных предположениях о сигнале и помехах.

Способ обратных вероятностей предназначен для обнаружения заданных по форме сигналов. Если результаты измерений вдоль профиля f_iпредставляют собой сумму сигнала s_i и помехи n_i: f_i = s_i + n_i, причем помеха нормально распределена и некоррелирована для соседних точек профиля (имеет нулевое значение и дисперсию s²), то при равных априорных вероятностях о наличии р₁ и отсутствии р₀ сигнала

апостериорная (или обратная) вероятность наличия сигнала р(H₁/F) в соответствии с формулой (7) p(H₁/F) = L/(L + 1), где L - коэффициент правдоподобия:

(6.10)

В случае перемещения заданного сигнала s_i, …,s_m вдоль профиля наблюдений, как весовой функции линейного фильтра, получим распределение коэффициента правдоподобия L по профилю в виде

, (6.11)

где индекс j характеризует смещение сигнала вдоль профиля от точки к точке.

Согласно критерию максимального правдоподобия, для тех точек, для которых L_j>1, принимается решение о наличии сигнала, а по формуле Бейеса (формуле обратных вероятностей) решение о наличии сигнала принимается по величине апостериорной вероятности p(H₁/F)>0.5, где p_j(H/F) = L_j/(L_j + 1).

В основном алгоритме обнаружения (6.10) первый член под знаком экспоненты представляет собой энергетическое отношение сигнал/помеха r и при вычислениях остается неизменны; второй член является сверткой, обеспечивающей фильтрацию исходных данных (т.е. сам процесс обнаружения) по критерию максимума пикового отношения сигнал/помеха. Весовой функцией при этом служат ординаты сигнала, нормированные на дисперсию помехи s², т.е. h_i = s_i/s². следовательно, в алгоритме обнаружения сигнала, полученном на основе статистических гипотез, обеспечивается, с одной стороны, оптимальная согласованная фильтрация исходных данных, с другой – возможность вычисления апостериорной вероятности наличия сигнала, т.е. извлечение максимума информации о полезном сигнале.

Обнаружение заданного по форме сигнала на фоне коррелированных помех включает те же самые процедуры, что и случае некоррелированных помех. Отличие состоит в том, что для описания статистических свойств помех требуется оценка корреляционной матрицы R_n(m-i) по АКФ (автокорреляционная функция). Алгоритм обнаружения при этом сводится к вычислению коэффициента правдоподобия:

, (6.12)

где весовые коэффициенты h_i являются решением системы линейных уравнений åh_iR_n(m-i) = s(-m), т.е. определяются аналогично согласованному фильтру. Величина åh_is_i определяет энергетическое отношение сигнал/помеха, а åh_ifj-I представляет собой свертку, обеспечивающую фильтрацию данных по критерию максимума пикового отношения сигнал/помеха.

Надежность обнаружения сигнала оценивается по величине энергетического отношения сигнал/помеха r, которая еще до начала обработки может быть получена из расчета ВКФ (взаимо-корреляционная функция) данных соседних пар профилей и оценки интервала корреляции сигнала по АКФ.

Согласно критерию максимального правдоподобия надежность обнаружения сигнала

, (6.13)

где F -функция нормального распределения; - энергетическое отношение сигнал/помеха.

Формула (7.13) позволяет дать объективное определение понятия «надежный сигнал», или «надежная (достоверная) аномалия». Под надежным сигналом (аномалией) следует понимать такую составляющую поля, отношение энергии которой к мощности помех, в частности к их дисперсии, превосходит порог, соответствующий заданной вероятности обнаружения.

Анализ надежности обнаружения сигнала для критерия максимального правдоподобия показывает, что возможности обнаружения слабых сигналов вдоль одиночных профилей весьма ограничены: вдоль профиля можно провести надежное обнаружение (g³95%) сигнала, соизмеримого по интенсивности с помехой s² = s² лишь при достаточной его протяженности (m³10).

Применяется так же способ межпрофильной корреляции, при котором по положительным экстремумам функции взаимной корреляции данных соседних пар профилей предварительно оценивается простирание оси сигнала (аномалии), а затем по простиранию этой оси проводится суммирование. Возможность оценки различных простираний по ВКФ позволяет с помощью способа межпрофильной корреляции не только выделять слабые аномалии, но и проводить разрешение аномалий в случае их интерференции. Последнее обстоятельство весьма существенно при обработке геофизических данных, полученных при сложном геологическом строении.

Непараметрические методы обнаружения сигналов.

Предположение о нормальном законе распределения помех на практике не всегда имеет место. В связи с этим необходимо применение так называемых непараметрических способов (алгоритмов) обработки, которые оказываются эффективными в тех случаях, когда правомочности использования статистических приемов, базирующихся на нормальном законе распределения, сомнительно или их применение вообще не возможно.

Изучение помех, возникающих при изменении геофизических полей в скважине показало наличие двух дополнительных экстремумов в их распределении соответственно при очень низких и очень высоких значениях измеряемого параметра по сравнению с нормальным законом. Наличие подобных экстремумов связывается с помехами технического характера, такими как сбои при движении скважинного снаряда. Таким образом, отказ при построении алгоритмов выделения сигнала конкретного вида распределения помех, кстати, как и самих сигналов, если они представлены случайным процессом позволит обнаруживать сигналы в тех случаях, когда параметрические способы не эффективны.

Использование непараметрических способов обработки геофизических данных связанно с применением знаковых, ранговых и знаково-ранговых статистик.

Знаковая статистика – произвольная функция вектора f, т.е. последовательности наблюденных значений поля f₁, …,f_n. Например,

F = (-1,2,3,-5,0,5)

Алгоритм, использующий только знаки элементов выборки наблюдений, называется знаковым.

порядковая статистика – упорядоченная выборка, в которой все элементы вектора f(f₁, …,f_n) расставлены в возрастающем порядке. Порядковая статистика будет –5,-1,0,2,3,5.

Рангом R_iэлемента выборки f_i называется порядковый номер этого элемента в порядковой статистике. Так для примера f = -5,-1,0,2,3,5, R_i = 1,2,3,4,5,6.

Ранговая статистика – это произвольная функция от рангового вектора представляющего перестановку чисел, которая получается при замене элементов выборки их рангами. Ранговый алгоритм – сравнение ранговой статистики с некоторым заданным порогом.

Алгоритмы обнаружения сигналов, построенные на ранговых статистиках, наиболее эффективны при обнаружении сигналов, не содержащих постоянной составляющей. Хотя эти алгоритмы можно использовать для обнаружения сигналов и с постоянной составляющей, но их эффективность будет ниже эффективности знаково-ранговых алгоритмов.

Чтобы интерпретатору не обращаться за помощью к другим программам, помогающим выделить сигнал на фоне помехи, предлагаю создать приложение для программы OASIS montaj, базой которого будут вышеперечисленные алгоритмы обнаружения слабых сигналов. Для используемой в дипломном проекте системы программное приложение должно быть написано с помощью языка программирования Visual Basic.

Заключение.

В дипломном проекте рассматривалось применение системы OASIS montaj для обработки и интерпретации геолого-геофизической информации с целью выявления аномалий, перспективных на обнаружение кимберлитовых тел.

В проектной части была рассмотрена обработка первичных геофизических данных и построение по полученным результатам карт в системе Oasis montaj. Из проделанной работы можно сделать выводы, что данная система удобна в использовании, прекрасно подходит для обработки первичных данных, построения карт всего предложенного комплекса геофизических методов. Oasis montaj может быть использована и в дальнейшем для обработки геофизических данных.

Как отмечалось в главе 6, система не может помочь интерпретатору в обнаружении некоторых аномалий, поэтому создание программного приложения усовершенствовало бы рассматриваемую систему в направлении интерпретации геофизических данных.

СПИСОК ЛИТЕРАТУРЫ

1. «Отчет о результатах поисков коренных месторождений алмазов в бассейнах верхних течений рек Алакит, Марха, Сохсолоох в 1996-2001 г.г.». (Ответственные исполнители Устинов В.И., Цой И.Г.) Акционерная компания «Алроса», Амакинская Геологоразведочная Экспедиция.

2. Трофимова И.П. Системы обработки и хранения информации. М.: Высш. шк., 1989. – 191 с.

3. Цветков В.Я. Геоинформационные системы и технологии. – М.: Финансы и статистика, 1998. – 286 с.

4. Вычислительные математика и техника в разведочной геофизике: Справочник геофизика / Под ред. В.И. Дмитриева. – М.: Недра, 1990. – 498 с.

5. Никитин А.А. Статистические методы выделения геофизических аномалий. М.: Недра, 1979. – 280 с.

6. Инструкция по применению OASIS montaj.

7. Бугаец А.Н., Дуденко Л.Н. Математические методы при прогнозировании месторождений полезных ископаемых. Л., «Недра», 1976. – 270 с.

8. Комплексирование методов разведочной геофизики: Справочник геофизика/ Под ред. Бродового В.В. Никитина А.А. – М.: Недра, 1984. – 384 с.

9. СНиП 23-05-95 «Искусственное и естественное освещение»

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

8 9 10 11 12 13 14

Основные методологические подходы в педагогике

Типы организационных структур

Амортизация и способы ее начисления

Проблема универсалий в средневековой философии

Основные фонды предприятия

Типы экономических систем: рыночная экономика, традиционная экономика, административно-командная экономика, смешанная экономика

Самый сильный аргумент, почему эволюция человека не могла быть