Критерий Вилкоксона. По этому критерию проверяют гипотезу о совпадении функций генеральных совокупностей во всей области их определения F1(x) = F2(x)

По этому критерию проверяют гипотезу о совпадении функций генеральных совокупностей во всей области их определения F1(x) = F2(x).

Для определения критерия Вилкоксона образуют объединённый вариационный ряд для обеих выборок. Статистикой W критерия является сумма рангов (порядковых номеров в объединённом вариационном ряду) наблюдений из первой выборки (при этом считают, что n1 ≤ n2).

Статистика W имеет функцию распределения P(W), которую можно выразить формулой

P(W)=F(x) +f(x) (x3 –3x) {(n21+ n22 + n1 n2 + n1 + n2) / [ 20n1n2 (n1+n2+1)]}, (29)

где

F(x) и f(x) – функция и плотность центрированного нормированного нормального распределения:

x = (W – M[W] + 0,5)/σ[W]; (30)

M[W] = [ n2 (n1 + n2 + 1)] / 2; (31)

σ2 [W]= [n1n2 (n1 + n2 +1)] / 12. (32)

Если в объединённом вариационном ряду имеются совпадения рангов наблюдений из разных выборок, то

t

σ2[W]= [n1n2(n1+n2+1)/12] {1–[ki (k2i – 1)] / [(n1+n2)(n1+n2–1)(n1+n2+1)]}, (33)

где 1

t – общее число совпадений рангов; ki число равных по величине наблюдений в i –м совпадении рангов (i = 1, 2, …, t).

Вычисляют значение P(W) по формуле (29) и выбирают уровень значимости ε. Если ε /2 <P(W) <1 – ε/2, то гипотезу принимают. Если P(W) ≤ε/2 или

P(W) ≥ 1 – ε/2, то гипотезу отвергают.

Критерий Смирнова – Колмогорова.

Применяется в тех же случаях, что и предыдущий критерий, но объём каждой выборки при его применении должен быть n ≥ 25. В этом случае критерий Смирнова – Колмогорова является более мощным, чем критерий Вилкоксона.

Если требование по объёму каждой выборки соблюдено, то проверяют гипотезу о совпадении функций генеральных совокупностей во всей области их определения F1(x) ≡ F2(x).

Статистикой этого критерия является величина Dn1 n2= sup │Fn1(x)–Fn2 (x)│, (34) где sup верхняя граница модуля разности для всех значений x;

Fn1 (x) и Fn2 (x) – эмпирические функции распределения соответственно первой и второй выборок.

Для вычисления статистики Dn1 n2 используют формулы:

D+n1 n2 = max [ r/n2 – Fn1 (x′2r)] = max [Fn2 (x2r) – (r–1)/n1]; (35)

1≤r≤n2 1<r≤n1

Dn1 n2 = max [r/n1 – Fn2 (x2r)] = max [Fn1 (x2r) – (r–1)/n2]; (36)

1≤r≤n1 1≤r≤n2

Dn1 n2 = max (D+n1 n2 , Dn1 n2 ), (37)

где х2 члены вариационного ряда, построенного по второй выборке.

При вычислении по формулам (35…37) предполагают, что n1≤n2.

Если проверяемая гипотеза верна, то

P(√[n1n2/(n1+n2)¯] Dn1 n2 < y) = K(y), (38)

K(y) = ∑ (–1) k exp (–2k2y2) (39)

k=– ∞

y = Dn1 n2 / √1/n1+1/n2. (40)

Выбирают уровень значимости ε. Если ε/2 <K(y) <1–ε, то гипотезу принимают. Если K(y) ≤ ε/2 или K(y) ≥ 1–ε/2, то гипотезу отвергают.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: