Критерий Вилкоксона. По этому критерию проверяют гипотезу о совпадении функций генеральных совокупностей во всей области их определения F1(x) = F2(x)

По этому критерию проверяют гипотезу о совпадении функций генеральных совокупностей во всей области их определения F₁(x) = F₂(x).

Для определения критерия Вилкоксона образуют объединённый вариационный ряд для обеих выборок. Статистикой W критерия является сумма рангов (порядковых номеров в объединённом вариационном ряду) наблюдений из первой выборки (при этом считают, что n₁≤ n₂).

Статистика W имеет функцию распределения P(W), которую можно выразить формулой

P(W)=F(x) +f(x) (x³ –3x) {(n²₁+ n²₂ + n₁ n₂ + n₁ + n₂) / [ 20n₁n₂(n₁+n₂+1)]}, (29)

где

F(x) и f(x) – функция и плотность центрированного нормированного нормального распределения:

x = (W – M[W] + 0,5)/σ[W]; (30)

M[W] = [ n₂ (n₁ + n₂ + 1)] / 2; (31)

σ²[W]= [n₁n₂ (n₁ + n₂ +1)] / 12. (32)

Если в объединённом вариационном ряду имеются совпадения рангов наблюдений из разных выборок, то

σ²[W]= [n₁n₂(n₁+n₂+1)/12] {1–[ ∑ k_i (k²_i– 1)] / [(n₁+n₂)(n₁+n₂–1)(n₁+n₂+1)]}, (33)

где¹

t – общее число совпадений рангов; k_i – число равных по величине наблюдений в i –м совпадении рангов (i = 1, 2, …, t).

Вычисляют значение P(W) по формуле (29) и выбирают уровень значимости ε. Если ε /2 <P(W) <1 – ε/2, то гипотезу принимают. Если P(W) ≤ε/2 или

P(W) ≥ 1 – ε/2, то гипотезу отвергают.

Критерий Смирнова – Колмогорова.

Применяется в тех же случаях, что и предыдущий критерий, но объём каждой выборки при его применении должен быть n ≥ 25. В этом случае критерий Смирнова – Колмогорова является более мощным, чем критерий Вилкоксона.

Если требование по объёму каждой выборки соблюдено, то проверяют гипотезу о совпадении функций генеральных совокупностей во всей области их определения F₁(x) ≡ F₂(x).

Статистикой этого критерия является величина D_n₁_n2= sup │F_n₁(x)–F_n₂(x)│, (34) где sup – верхняя граница модуля разности для всех значений x;

F_n₁(x) и F_n₂(x) – эмпирические функции распределения соответственно первой и второй выборок.

Для вычисления статистики D_n₁_n2 используют формулы:

D⁺_{n1 n2}= max [ r/n₂ – F_n1(x′_2r)] = max [F_n2(x^′_2r) – (r–1)/n₁]; (35)

^{1≤r≤n2 1<r≤n1}

D^–_{n1 n2}= max [r/n₁ – F_n2(x^′_2r)] = max [F_n1(x^′_2r) – (r–1)/n₂]; (36)

^{1≤r≤n1 1≤r≤n2}

D_{n1 n2}= max (D⁺_{n1 n2}, D^–_{n1 n2}), (37)

где х^′₂ – члены вариационного ряда, построенного по второй выборке.

При вычислении по формулам (35…37) предполагают, что n_1≤n₂.

Если проверяемая гипотеза верна, то

P(√[n₁n₂/(n₁+n₂)^¯] D_{n1 n2}< y) = K(y), (38)

_∞