Практикум 1
Критерий U Манна-Уитни
Назначение критерия
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно определенного. Он позволяет выявлять различия между малыми выборками, когда n1, n2 ³ 3 или n1=2, n2³5
Описание критерия
Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше Uэмп, тем более вероятно, что различия достоверны.
Гипотезы (для случая, когда уровень первой группы на первый взгляд выше)
Н0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
|
|
Н1: Уровень признака в группе 2 ниже уровня признака в группе 1.
Ограничения критерия U
1. В каждой выборке должно быть не менее 3 наблюдений; n1, n2³3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.
2. В каждой выборке должно быть не более 60 наблюдений; n1, n2£60, т.к. ранжирование становится достаточно трудоемким уже при n1, n2³20 (ограничение не является строгим для случая компьютерной обработки).
3. В случае, если n1, n2³20, лучше использовать другой критерий, а именно угловое преобразование Фишера в комбинации с критерием l, позволяющим выявить критическую точку, в которой накапливаются максимальные различия между двумя сопоставляемыми выборками. Формулировка звучит сложно, но сам метод достаточно прост.
Пример
Результаты обследования студентов физического и психологического факультетов Петербургского университета. Данные приведены в Табл. 2.3
Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?
Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.
Таблица 2.3
Студенты - физики | Студенты-психологи | ||
Код имени испытуемого | Показатель невербального интеллекта | Код имени испытуемого | Показатель невербального интеллекта |
1. И.А. | 111 | 1. Н.Т. | 113 |
2. К.А. | 104 | 2. О.В. | 107 |
3. К.Е. | 107 | 3. Е.В. | 123 |
4. П.А. | 90 | 4. Ф.О. | 122 |
5. С.А. | 115 | 5. И.Н. | 117 |
6. Ст.А. | 107 | 6. И.Ч. | 112 |
7. Т.А. | 106 | 7. И.В. | 105 |
8. Ф.А. | 107 | 8. К.О. | 108 |
9. Ч.И. | 95 | 9. Р.Р. | 111 |
10. Ц.А. | 116 | 10. Р.И. | 114 |
11. См.А. | 127 | 11. О.К. | 102 |
12. К.Ан. | 115 | 12. Н.К. | 104 |
13. Б.Л. | 102 | ||
14. Ф.В. | 99 |
|
|
Правила ранжирования
- Меньшему значению начисляется меньший ранг.
Наименьшему значению начисляется ранг 1.
Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если n=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2.
- В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение тех рангов, которые они получили бы, если бы они не были равны.
Например, 3 наименьших значения равны 10 секундам.
Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2, и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг: (1+2+3)/3=6/3=2. Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг (4+5)/2=4,5.
- Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле: , где N – общее количество ранжируемых наблюдений. Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить ее.
При подсчете критерия U легче всего сразу приучить себя действовать по строгому алгоритму.
Подсчет критерия U Манна-Уитни
1. Проранжировать значения как единую выборку, приписывая меньшему значению меньший ранг. Всего рангов получится столько, сколько n1+ n2.
2. Вновь разбить показатели на две группы. Подсчитать сумму рангов отдельно (выборка 1 и выборка 2). Проверить, совпадает ли общая сумма рангов с расчетной.
3. Определить значение U. Для этого подсчитать
,
где
n1 – количество испытуемых в выборке 1;
n2 – количество испытуемых в выборке 2;
R1 и R2 –ранговые суммы групп.
- Определить критические значения U по таблице. Если Uэмп> Uкр(0,05), Н0 принимается. Если Uэмп£ Uкр(0,05), Н0 отвергается. Чем меньше значения U, тем достоверность различий выше.
Теперь проделаем эту работу на материале данного примера. В результате работы по 1-6 шагам построим таблицу
Таблица 2.4
Студенты-физики (14) | Студенты-психологи (12) | |||
Показатель невербального интеллекта | Ранг | Показатель невербального интеллекта | Ранг | |
127 | 26 | |||
| 123 | 25 | ||
| 122 | 24 | ||
| 117 | 23 | ||
116 | 22 | |||
115 | 20,5 | |||
115 | 20,5 | |||
| 114 | 19 | ||
| 113 | 18 | ||
| 112 | 17 | ||
111 | 15,5 | 111 | 15,5 | |
| 108 | 14 | ||
107 | 11,5 | 107 | 11,5 | |
107 | 11,5 | |||
107 | 11,5 | |||
106 | 9 | |||
| 105 | 8 | ||
104 | 6,5 | 104 | 6,5 | |
102 | 4,5 | 102 | 4,5 | |
99 | 3 | |||
95 | 2 | |||
90 | 1 | |||
Суммы | 1501 | 165 | 1338 | 186 |
Средние | 107,2 | 111,5 |
Общая сумма рангов: 165+186=351. Расчетная сумма рангов:
S (Ri) = N(N+1)/2 = 26(26+1)/2 = 351
Равенство реальной и расчетной сумм соблюдено.
Мы видим, что по уровню невербального интеллекта более «высоким» рядом оказывается выборка студентов-психологов. Именно на эту выборку приходится большая ранговая сумма: 186.
Теперь мы готовы сформулировать гипотезы:
Н0: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.
Н1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта. В соответствии со следующим шагом определяем эмпирическую величину U:
U1= (14*12)+12*(12+1)/2 – 186 = 60
U2= (14*12)+14*(14+1)/2 – 165 = 108
Для сопоставления с критическим значением выбираем меньшую величину U: Uэмп =60.
По таблице II Приложения 1 определяем критические значения для n1=14, n2=12:
|
|
Мы можем констатировать достоверные различия, если Uэмп£ Uкр