Критерий Вилкоксона-Манна-Уитни

Применяется для сравнения двух независимых выборок объема и и проверяет гипотезу , утверждающую, что выборки получены из однородных генеральных совокупностей и имеют равные средние и медианы.

Пример задачи. Первая выборка — это пациенты, которых лечили препаратом А. Вторая выборка — пациенты, которых лечили препаратом Б. Значения в выборках — это некоторая характеристика эффективности лечения (уровень метаболита в крови, температура через день после начала лечения, срок выздоровления, число койко-дней, и т.д.) Требуется выяснить, имеется ли значимое различие эффективности препаратов А и Б, или различия являются чисто случайными и объясняются «естественной» дисперсией выбранной характеристики.

Описание критерия

Заданы две выборки

Дополнительные предположения:

1) Объемы выборок могут быть различными, .

2) Накладываются ограничения на мощности выборок .

Нулевая гипотеза : выборки получены из однородных генеральных совокупностей.

Вычисление статистики критерия:

1. По объединенной выборке строится вариационный ряд.

2. Каждому элементу ряда поставить в соответствие его номер в ряду - ранг. Если несколько элементов ряда совпадают по величине, то каждому из них присваивается ранг, равный среднему арифметическому их номеров. Последний элемент в ранжированной объединенной выборке должен имеет ранг .

3. Определяются значения - сумма рангов 1-ой выборки, - сумма рангов 2-ой выборки.

4. Вычисляются величины

.

Проверка .

5. Находится значение

6. Статистика критерия имеет вид:

7. Нулевая гипотеза принимается на уровне значимости , если выборочное значение статистики удовлетворяет одному из неравенств:

Двусторонний критерий:

Правосторонний критерий:

Левосторонний критерий:

В этом случае различия между X и Y не существенны.

Критерий Зигеля-Тьюки

Является ранговым критерием, предназначенным для проверки принадлежности двух независимых выборок к общей генеральной совокупности или к двум генеральным совокупностям с одинаковыми характеристиками рассеяния.

Пример задачи. Пусть на некотором предприятии два подразделения выполняют одну и ту же работу, но на оборудовании различных производителей. Каждому подразделению соответствует выборка, состоящая из рабочих этого подразделения. Каждое значение в выборке - это числовая оценка производительности данного рабочего. Требуется определить, одинаков ли разброс производительности при использовании того или иного оборудования.

Описание критерия

Заданы две выборки

Дополнительные предположения:

1) Объемы выборок могут быть различными, .

2) Накладываются ограничения на мощности выборок .

Нулевая гипотеза :

выборки принадлежат генеральным совокупностям с одинаковыми дисперсиями (В случае наличия сведений о равенстве средних, гипотеза может выдвигаться на принадлежность выборок одной и той же генеральной совокупности).

Вычисление статистики критерия:

1. Выборка меньшего объема определяется как вторая выборка .

2. Объединенная выборка объема упорядочивается в порядке возрастания и отмечается принадлежность каждого элемента к той или иной выборке.

3. Ранги расставляются по следующему правилу: наименьшему значению присваивается ранг 1, два наибольших значения получают ранги 2 и 3, ранги 4 и 5 получают следующие наименьшие значения и т.д. Схема расстановки рангов имеет вид

1, 4, 5, 8, 9, …, 7, 6, 3, 2.

4. Каждому из совпадающих по величине элементов присваивается ранг, равный среднему арифметическому

5. Для выборки меньшего объема () считается сумма рангов .

6. Статистика критерия имеет вид:

Нулевая гипотеза о равенстве дисперсий принимается на уровне значимости , если выборочное значение статистики удовлетворяет одному из неравенств:

Двусторонний критерий:

Правосторонний критерий:

Левосторонний критерий:

Пример 1. На основании суточной производительности двух автоматов определить: существенны ли различия двух выборок. Объемы выборок одинаковы, применим критерий Вилкоксона (n1=n2=11)

x                      
y                      

Для нахождения z* построим вспомогательную таблицу с необходимыми вычислениями (табл.5.1)

Таблица 5.1 Вычисление z*

xi yi di и знак
    -67   -11  
           
      4,5   4,5
    -44   -7  
           
    -32 4,5 -4,5  
           
           
           
           
           
        T 43,5
        mt  
        δ 11,25
        z* 0,93

Критерий: , основная гипотеза принимается, различия в оценках не существенны на данном уровне значимости.

Пример 2. Постановка задачи аналогична предыдущей, но объемы выборок различны (n1=11, n2=10), применим критерий Вилкоксона, Манна и Уитни

x                      
y                      

H0 – качество продукции двух станков одинаково, H1 – качество разное

Выборки слили и упорядочили, проставили ранги, в таблице элементы 2 выборки отмечены шрифтом (полужирный).

Элемент                      
Ранг     3,5 3,5   6,5 6,5       11,5
Элемент                    
Ранг 11,5   14,5 14,5            

Проверим:

Критерий: , основная гипотеза принимается, что свидетельствует о принадлежности двух выборок одной генеральной совокупности.

Контрольные вопросы

1. Дать определение непараметрической статистической гипотезы.

2. Характеристика задач об однородных ГС.

3. Ранг, связанные ранги.

4. Критерий Вилкоксона.

5. Критерий Вилкоксона, Манна, Уитни.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: