Общие принципы оценки расхождения

Меру соответствия теоретического и экспериментального распределений характеризуют какой-либо случайной величиной W, которую называют мерой расхождения. В этом случае критерий согласия представляет собой число, равное вероятности того, что мера расхождения W вследствие случайных причин окажется не меньше её частного, полученного из опытов значения ω, то есть

k = P(W ≥ ω).

На практике за меру расхождения обычно принимают критерии λ, χ2 и ω2 (критерий лямбда, критерий хи-квадрат и критерий омега-квадрат соответственно). Порядок применения этих критериев определён ГОСТ 11.006-74.

Применение этих критериев основано на использовании так называемой нулевой гипотезы Н0, т.е. гипотезы, утверждающей, что наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках (флуктуациями). Все остальные гипотезы, кроме нулевой, в этом случае называют альтернативными.

При этом задаются уровнем значимости α (ошибка первого рода) – ошибкой отклонения верной гипотезы. Ошибка второго рода β -ошибка принятия ложной гипотезы. Величина 1-β носит название мощности критерия. Выразив эту величину через определённый параметр, можно получить функцию мощности. Выбор значений α и β должен зависеть от последствий совершения ошибок первого и второго рода, причём уменьшить одновременно ошибки первого и второго рода можно только увеличением объёма анализируемой выборки.

На практике обычно используют α = 0,01; 0,05; 0,10 и др. Например, при α = 0,01 мы рискуем отвергнуть верную гипотезу в среднем один раз из ста проверок согласия. Дополнительная до единицы вероятность носит название доверительной вероятности γ.

Процедура проверки согласия опытного и теоретического распределений случайной величины х заключается в получении упорядоченного ряда результатов наблюдений этой величины х1 ≤ х2 ≤…≤ хn,

в построении на основании их функции накопленных частостей и в сравнении этой функции с заданной теоретической.

7.2.Критерий согласия λ.

При использовании критерия λ определяют максимальное значение разности накопленной частости Fn(x) и вероятности F(x)

Dn = max [ Fn(x) – F(x) ] (44)

и вычисляют λ = Dn√n. (45)

Задаются доверительной вероятностью γ = P(λn ≤ λn табл), (46)

где

λn табл табличное значение λn для заданной доверительной вероятности γ.

Если λn ≤ λn табл, то делают заключение, что нет оснований отвергать принятую гипотезу. Если λn > λn табл, то гипотезу отвергают.

7.3.Критерий согласия χ2.

При использовании критерия χ2 вычисляют

k

χ2 =(mi – Mi)2 / Mi, (47)

i-1

где k – число интервалов разбиения; mi число отказов, попавших в i й интервал;

Mi математическое ожидание числа отказов в i – м интервале при принятой гипотезе.

Задаются доверительной вероятностью γ = P(χ2 ≤ χ2табл), (48)

где χ2табл табличное значение χ2 для заданной доверительной вероятности γ.

Если χ2 ≤ χ2табл, то для принятой доверительной вероятности гипотезу о согласии опытного и теоретического распределений принимают, в противном случае – отвергают.

7.4.Критерий ω2.

При использовании этого критерия в качестве меры отклонения эмпирической функции распределения Fn(x) выборки от теоретической функции F(x) используют величину

ω2 = ∫ [Fn(x) – F(x)]2 dF(x). (49)

– ∞

Вычисляют произведение

n

2 = 1/12n +[ F(xi) – (2i – 1)/2n ]2, (50)

i=1

где n – число реализаций; F(xi) – накопленная частость.

Задаются доверительной вероятностью

γ = P(nω2 ≤ nω2табл) (51)

где 2табл табличное значение 2 для заданной доверительной вероятности.

Если 2 ≤ nω2табл, то для принятой доверительной вероятности гипотезу о согласии опытного и теоретического распределений принимают, в противном случае – отвергают.

Критерий ω2 является более мощным, чем критерии λ и χ2, но при его применении требуется выполнение большого объёма вычислительных операций. Критерий ω2 может более точно учитывать различия распределений на «хвостах», т.е. там, где наиболее отчётливо наблюдаются различия между распределениями.

По ГОСТ 11.006 – 74 число наблюдений случайной величины для проверки согласия опытного и теоретического распределений должно быть более 100, если используют критерий λ и χ2 и более 50 – если используется критерий ω2.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: