Непараметрические критерии для связных выборок

Нередко, сравнивая «на глазок» результаты «до» и «после» какого либо воздействия (например, тренинга), психолог видит тенденции повторного измерения — большинство показателей может увеличиваться или, напротив, уменьшаться. Наиболее простым путем оценки различий, казалось бы, является подсчет процентов в изменениях в ту или другую сторону «до» и «после» и сравнение полученных процентов между собой. На основе этого сравнения можно было бы придти к заключению, что если наблюдаются различия в процентах, то имеет место различие и в сравниваемых психологических характеристиках «до» и «после». Подобный подход категорически неприемлем, поскольку для процентов нельзя определить уровень достоверности в их различиях. Делать какие либо выводы из экспериментального материала возможно только на основе статистических процедур, специально сконструированных так, что на их основе можно определить уровень достоверности различий. Проценты, взятые сами по себе, не дают возможности делать статистически достоверные выводы. Поэтому, для того чтобы доказать эффективность какого-либо воздействия, необходимо выявить статистически значимую тенденцию в смещении (сдвиге) показателей.

Для решения подобных статистических задач психолог может использовать целый ряд критериев различия. Один из наиболее простых критериев различия — критерий знаков G. Этот критерий относится к непараметрическим и применяется только для связанных (зависимых) выборок. Критерий знаков G предназначен для установления общего на­правления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ос­лабления. Критерий знаков применяется к данным, полученным в ранговой, интервальной и шкале отношений.

Для применения критерия Gнеобходимо соблюдать следующие условия:

1. Измерение может быть проведено в шкале порядка, интервалов и отношений.

2. Выборка должна быть однородной и связной.

3. Число элементов в сравниваемых выборках должно быть равным.

4. С критерий знаков может применяться при величине типичного сдвига от 5 до 300 (на большую величину не рассчитана таблица достоверности).

5. При большом числе сравниваемых парных значений критерий знаков достаточно эффективен.

6. При равенстве типичных и нетипичных сдвигов критерий знаков неприменим, следует использовать другие критерии.

Пример расчета: Не секрет, что пропуски занятий не такое уж редкое явление среди студентов. Часть преподавателей смирилась с этим фактом, часть ищет способы повлиять на студентов. Один из преподавателей на каждом занятии проводил проверку посещаемости и в конце семестра составил список студентов с указанием того, сколько занятий в течение семестра каждый из них пропустил. В начале следующего семестра он объявил, что те студенты, которые пропустят меньше всего занятий, получат до пяти дополнительных баллов на экзамене. В конце семестра он вновь составил список студентов с указанием числа пропусков. Оба списка приведены в таблице 3.

Таблица 3

Число пропусков занятий в первом и втором семестрах

Студент Число пропусков Студент Число пропусков
семестр А семестр В семестр А семестр В
           
           
           
           
           
           
           
           
           
           

Можно ли на основании приведенных данных сказать, что во втором семе­ме пропусков занятий стало меньше?

В приведенном примере мы встречаемся с ситуацией «до и после». В принципе, в подобной ситуации ничто не мешает использовать по­пулярный параметрический тест Стьюдента, позволяющий сравнивать средние значения в зависимых и независимых выборках. Однако, во-первых, примене­ние этого теста становится некорректным при работе с малыми выборками. Вслучае малой выборки нет уверенности в том, что результаты подчиняются нормальному закону распределения. Во-вторых, тест Стьюдента связан с ис­пользованием шкал интервалов или отношений, в то время как часто приходится иметь дело с результатами, выраженными в шкале порядка. В-третьих, тест Стьюдента может оказаться нечувствительным к незначительным различиям между выборками (например, при использовании шкал, содержащих всего три значения).

Алгоритм работы: вбиваем данные посещаемости в семестре А и в семестре В в таблицу. Выбираем Анализ → Непараметрические критерии → Устаревшие диалоговые окна → Для двух связанных выборок. В открывшемся окне, удерживая кнопку Ctrl выбираем обе переменные, переносим их в правую часть. Ставим галочку на Критерий знаков. Жмем Ок (рис. 29).

Рисунок 29 – Диалоговое окно для расчета непараметрических критериев для двух связанных выборок

В появившихся таблицах содержаться перечень сдвигов (рис. 30). Нулевые сдвиги исключаются (количество уменьшается с 20 до 16), из оставшихся к нетипичным относятся те, которых меньше. В нашем случае положительных (4). По таблицам вероятности для биноминального теста находим, что при N=16 и числе нетипичных сдвигов Х=4 значение вероятности р=0,038. В нашей таблице мы получаем это значение в удвоенной версии (2-сторонняя) р=0,038*0,038=0,077. Это соответствует α=0,05, значит гипотеза подтвердилась и во втором семестре действительно пропусков стало меньше.

 
 

 


Рисунок 30 – Пример расчета G критерия знаков для двух зависимых выборок

 

 

Для решения задач, в которых осуществляется сравнение двух рядов чисел, кроме критерия знаков психолог может использовать парный критерий Т—Уилкоксона. Этот критерий является более мощным, чем критерий знаков, и применяется для оценки различий экспериментальных данных, полученных в двух разных условиях на одной и той же выборке испытуемых. Он позволяет выявить не только направленность изменений, но и их выраженность, т.е. он позволяет установить, насколько сдвиг показателей в каком-то одном направлении является более интенсивным, чем в другом.

Критерий Т основан на ранжировании абсолютных величин разности между двумя рядами выборочных значений в первом и втором эксперименте (например «до» и «после» какого-либо воздействия). Ранжирование абсолютных величин означает, что знаки разностей не учитываются, однако в дальнейшем наряду с общей суммой рангов находится отдельно сумма рангов как для положительных, так и для отрицательных сдвигов. Если интенсивность сдвига в одном из направлении оказывается большей, то и соответствующая сумма рангов также оказывается больше. Этот сдвиг, как и в случае критерия знаков, называется типичным, а противоположный, меньший по сумме рангов сдвиг — нетипичным. Как и для критерия знаков эти два сдвига оказываются дополнительными друг к другу. Критерий Уилкоксона базируется на величине нетипичного сдвига, который называется Т.

Для применения критерия Т-Уилкоксона необходимо соблюдать следующие условия:

1. Измерение может быть проведено во всех шкалах, кроме номинальной.

2. Выборки должны быть связными.

3. Число элементов в сравниваемых выборках должно быть равным.

4. Критерий Т— Уилкоксона может применяться при численности выборки от 5 до 50.

Пример расчета: Проблема избыточного веса, несомненно, является одной из наиболее ак­туальной для части населения. Для ее решения люди способны идти на любые жертвы, вплоть до рискованных операций по уменьшению размера желудка. Сторонники менее радикальных мер готовы истязать свое тело различными диетами во имя обретения желанных форм и охотно откликаются на призывы попробовать очередное «чудо-средство», направленное на снижение веса.

Одна из фирм, специализирующаяся на выпуске малокалорийных продук­тов питания, разработала специальную диету, гарантирующую, по заверению фирмы, снижение веса. Фирма набрала группу добровольцев, которые в тече­ние трех месяцев питались исключительно продуктами этой фирмы в соответ­ствии с разработанной диетой. В таблице представлен вес участников экс­перимента до его начала и после его завершения. Можно ли на основании приведенных данных сделать вывод о существенном снижении веса участников эксперимента?

Таблица 4

Вес участников эксперимента до и после диеты

Участник Вес «до» Вес «после» Участник Вес «до» Вес «после»
           
           
           
           
           
           
           
           
           
           

 

Мы вновь встречаемся с ситуацией «до и после». Как и в предыдущем случае, желание использовать параметрический тест Стьюдента наталкивается на факт маленькой выборки. Несомненно, здесь также возможно применение теста знаков, однако полученная с его помощью информация может оказаться не­достаточной. Тест знаков выявляет сдвиг результатов в ту или иную сторону, но ничего не говорит о том, насколько этот сдвиг выражен. Если студент в первом семестре пропустил 7 занятий, а во втором 6, то, формально, он стал пропускать меньше. Но вряд ли такой результат обрадует преподавателя. Аналогичная ситуация с весом. Если после трех месяцев диеты вес со 100 кг уменьшился до 99 кг, то формально человек похудел. Другое дело, нужна ли кому-нибудь диета, дающая такие результаты.

Алгоритм работы: вбиваем данные с весом до и после диеты в таблицу. Выбираем Анализ → Непараметрические критерии → Устаревшие диалоговые окна → Для двух связанных выборок. В открывшемся окне, удерживая кнопку Ctrl, выбираем обе переменные, переносим их в правую часть. Ставим галочку на Критерий Уилкоксона. Жмем Ок (рис. 29).

 

Рисунок 31 – Пример расчета Т критерия Уилкоксона знаков для двух зависимых выборок

 

Получаем результаты в виде двух таблиц: В первой таблице содержатся ранговые статистики: средние ранги (Mean Rank) и суммы рангов (Sum of Ranks) для отрицательных (Negative Ranks) и положительных (Positive Ranks) сдвигов, а также количество одинаковых ран­гов (Ties). Во второй таблице содержатся результаты проверки: эм­пирическое значение z-критерия (Z) и p-уровень значимости (Asymp. Sig. (2-tailed)). В данном случае уровень значимости предложен для двусторонней критической области. Для перехода к односторонней результат необходимо разделить на два. Получим: 0,001/2=0,0005. Эта цифра соответствует уровню значимости (то же самое мы можем найти в таблице Z-распределения. В ней находим, что для вычисленного Z=-3,30 р=0,0005). Это высокий уровень значимости. Что говорит о том, что гипотеза подтвердилась, т.е. произошло существенное снижение веса участников эксперимента.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: