Параметрические методы сравнения двух выборок
Параметрические и непараметрические методы сравнения двух выборок
При сравнении выборок используют параметрические и непараметрические методы. При решении вопроса о выборе параметрического или непараметрического метода сравнения необходимо иметь в виду, что параметрические методы обладают заведомо большей чувствительностью, чем их непараметрические аналоги. Поэтому исходной ситуацией является выбор параметрического метода (10).
Сравнение двух выборок по признаку, измеренному в метрической шкале, предполагает сравнение средних значений с использованием параметрического критерия t-Стьюдента.
В этом случае следует различать три ситуации по соотношению выборок между собой:
Ситуация 1. Критерий t-Стьюдента для одной выборки. Метод позволяет проверить гипотезу о том, что среднее значение изучаемого признака М отличается от некоторого известного значения А.
Ситуация 2. Критерий t-Стьюдента для независимых выборок. Метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлечены сравниваемые независимые выборки, отличаются друг от друга. Допущение независимости предполагает, что представители двух выборок не составляют пары коррелирующих значений признака.
|
|
Ситуация 3. Критерий t-Стьюдента для зависимых выборок. Метод позволяет проверить гипотезу о том, что средние значения двух генеральных совокупностей, из которых извлекаются сравниваемые зависимые выборки, отличаются друг от друга. Допущение о зависимости чаще всего значит, что признак измерен на одной и той же выборке дважды, например, до воздействия и после него.
Можно также проводить сравнение дисперсий двух выборок по критерию F -Фишера. Метод позволяет проверить гипотезу о том, что дисперсии двух генеральных совокупностей, из которых извлечены сравниваемые выборки, отличаются друг от друга. Как пишет А.Д.Наследов, «иногда этот метод приводит к ценным содержательным выводам, а в случае сравнения средних для независимых выборок сравнение дисперсий является обязательной процедурой» (10, с.162).
Решение о применении непараметрического метода становится оправданным, если не выполняются исходные предположения, лежащие в основе применения параметрического метода.
Применение непараметрических методов является оправданным при следующих условиях:
● есть основания считать, что распределение значений признака в генеральной совокупности не соответствует нормальному закону;
● есть сомнения в нормальности распределения признака в генеральной совокупности, но выборка слишком мала, чтобы по выборочному распределению судить о распределении в генеральной совокупности;
|
|
● не выполняется требование гомогенности дисперсии при сравнении средних значений для независимых выборок.
Как отмечает А.Д.Наследов, на практике преимущество непараметрических методов наиболее заметно, когда в данных имеются выбросы (экстремально большие или малые значения). Если размер выборки очень велик (больше 100), то непараметрические методы сравнения использовать нецелесообразно. С другой стороны, если объемы сравниваемых выборок очень малы (10 и меньше), то результаты применения непараметрических методов можно рассматривать лишь как предварительные (10).
● При сравнении двух независимых выборок используется критерий U-Манна-Уитни (Mann-WhitneyU).
● При сравнении двух зависимых выборок используется критерий Т-Вилкоксона (Wilcoxon signed-rank test).
● При сравнении более двух независимых выборок используется однофакторный дисперсионный анализ Краскала-Уоллеса (Kruskal-Wallis one-way analysis of variance).
● При сравнении более двух зависимых выборок используется критерий Фридмана (Friedman test).
Подводя итог сказанному, отметим, что в данном разделе мы не ставили перед собой задачу раскрыть все многообразие методов математической статистики. Основная цель – ориентация исследователя в тех методах, которые бы наиболее точно соответствовали цели и задачам исследования.
Таблицы для оценки достоверности различий приводятся во всех пособиях по математической статистике (см.также Приложение 1 и 2 настоящего издания), в учебнике «Экспериментальная психология» под авторством В.Н. Дружинина, а также в книге А.Д.Наследова «Математические методы психологического исследования. Анализ и интерпретация данных». В них же достаточно просто сформулированы правила, формулы вычисления среднего, моды и медианы, распределения, дисперсии. Обычно в психологических и педагогических исследованиях принимается достаточным 95% уровень достоверности различий. Кроме того, распространены компьютерные программы – «STATISTICA», «STADIA», «SPSS» и др., которые выполняют эти вычисления автоматически. Их использование значительно облегчает проведение корреляционного, факторного, кластерного и других видов анализа.