По этому критерию проверяют гипотезу о совпадении функций генеральных совокупностей во всей области их определения F1(x) = F2(x).
Для определения критерия Вилкоксона образуют объединённый вариационный ряд для обеих выборок. Статистикой W критерия является сумма рангов (порядковых номеров в объединённом вариационном ряду) наблюдений из первой выборки (при этом считают, что n1 ≤ n2).
Статистика W имеет функцию распределения P(W), которую можно выразить формулой
P(W)=F(x) +f(x) (x3 –3x) {(n21+ n22 + n1 n2 + n1 + n2) / [ 20n1n2 (n1+n2+1)]}, (29)
где
F(x) и f(x) – функция и плотность центрированного нормированного нормального распределения:
x = (W – M[W] + 0,5)/σ[W]; (30)
M[W] = [ n2 (n1 + n2 + 1)] / 2; (31)
σ2 [W]= [n1n2 (n1 + n2 +1)] / 12. (32)
Если в объединённом вариационном ряду имеются совпадения рангов наблюдений из разных выборок, то
t
σ2[W]= [n1n2(n1+n2+1)/12] {1–[ ∑ ki (k2i – 1)] / [(n1+n2)(n1+n2–1)(n1+n2+1)]}, (33)
где 1
t – общее число совпадений рангов; ki – число равных по величине наблюдений в i –м совпадении рангов (i = 1, 2, …, t).
Вычисляют значение P(W) по формуле (29) и выбирают уровень значимости ε. Если ε /2 <P(W) <1 – ε/2, то гипотезу принимают. Если P(W) ≤ε/2 или
|
|
P(W) ≥ 1 – ε/2, то гипотезу отвергают.
Критерий Смирнова – Колмогорова.
Применяется в тех же случаях, что и предыдущий критерий, но объём каждой выборки при его применении должен быть n ≥ 25. В этом случае критерий Смирнова – Колмогорова является более мощным, чем критерий Вилкоксона.
Если требование по объёму каждой выборки соблюдено, то проверяют гипотезу о совпадении функций генеральных совокупностей во всей области их определения F1(x) ≡ F2(x).
Статистикой этого критерия является величина Dn1 n2= sup │Fn1(x)–Fn2 (x)│, (34) где sup – верхняя граница модуля разности для всех значений x;
Fn1 (x) и Fn2 (x) – эмпирические функции распределения соответственно первой и второй выборок.
Для вычисления статистики Dn1 n2 используют формулы:
D+n1 n2 = max [ r/n2 – Fn1 (x′2r)] = max [Fn2 (x′2r) – (r–1)/n1]; (35)
1≤r≤n2 1<r≤n1
D–n1 n2 = max [r/n1 – Fn2 (x′2r)] = max [Fn1 (x′2r) – (r–1)/n2]; (36)
1≤r≤n1 1≤r≤n2
Dn1 n2 = max (D+n1 n2 , D–n1 n2 ), (37)
где х′2 – члены вариационного ряда, построенного по второй выборке.
При вычислении по формулам (35…37) предполагают, что n1≤n2.
Если проверяемая гипотеза верна, то
P(√[n1n2/(n1+n2)¯] Dn1 n2 < y) = K(y), (38)
∞
K(y) = ∑ (–1) k exp (–2k2y2) (39)
k=– ∞
y = Dn1 n2 / √1/n1+1/n2. (40)
Выбирают уровень значимости ε. Если ε/2 <K(y) <1–ε, то гипотезу принимают. Если K(y) ≤ ε/2 или K(y) ≥ 1–ε/2, то гипотезу отвергают.