В психологических исследованиях чаще всего ссылаются на нормальное распределение.
Нормальное распределение характеризуется тем, что крайние значения признака в нем встречаются достаточно редко, а значения близкие к средней величине – часто. График нормального распределения представляет собой колоколообразную кривую.
Способы оценки нормальности распределения:
⇨ Графический
Самый простой графический способ проверки характера распределения данных — построение гистограммы. Если гистограмма имеет колоколообразный симметричный вид, можно сделать заключение о том, что анализируемая переменная имеет примерно нормальное распределение. Однако при интерпретации гистограмм следует соблюдать осторожность, поскольку их внешний вид может сильно зависеть как от числа наблюдений, так и от шага, выбранного для разбиения данных на классы.
⇨ Оценка описательных статистик (Аналитический способ)
это статистические методы обработки данных, их систематизации, наглядного представления в виде таблиц и графиков, а также количественное описание данных с помощью системы статистических показателей.
|
|
При описательном анализе данных качественную информацию представляют в виде частотных таблиц, таблиц сопряженности и графиков. Количественную информацию обобщают также с помощью графиков и системы статистических показателей: показателей среднего уровня (среднее значение, мода, медиана), процентилей, показателей вариации (размах вариации, межквартильный размах, дисперсия, стандартное отклонение, коэффициент вариации и др.), показателей формы распределения (асимметрия и эксцесс). При исследовании данных интерес представляют точечные и интервальные оценки статистических показателей.
Методы описательного анализа данных позволяют не только исследовать данные, но и выбрать метод дальнейшего углубленного их анализа (методы аналитической статистики), например, методы для проверки статистических гипотез, моделирования взаимосвязи.
⇨ Критерий Колмогорова- Смирнова
проверяет гипотезу о различии распределений двух количественных переменных (эмпирического и теоретического)
Если уровень значимости выше, чем 0,05, то это значит, что распределение данных является нормальным, и для обработки данных подходят параметрические методы. Если же этот показатель меньше либо равен 0,05, то эмпирическое распределение отличается от нормального, и для основной обработки необходимо использовать непараметрические методы.
40. Параметрические и непараметрические критерии статистического анализа данных.
В зависимости от проверяемой нулевой гипотезы статистические критерии делятся на группы,
|
|
Наряду с нулевой гипотезой, которая принимается или отвергается по результату анализа выборки, статистические критерии могут опираться на дополнительные предположения, которые априори предпологаются выполненными.
· Параметрические критерии предполагают, что выборка порождена распределением из заданного параметрического семейства. В частности, существует много критериев, предназначенных для анализа выборок из нормального распределения. Преимущество этих критериев в том, что они более мощные. Если выборка действительно удовлетворяет дополнительным предположениям, то параметрические критерии дают более точные результаты. Однако если выборка им не удовлетворяет, то вероятность ошибок (как I, так и II рода) может резко возрасти. Прежде чем применять такие критерии, необходимо убедиться, что выборка удовлетворяет дополнительным предположениям. Гипотезы о виде распределения проверяются с помощью критериев согласия.
· Непараметрические критерии не опираются на дополнительные предположения о распределении. В частности, к этому типу критериев относится большинство ранговых критериев.
Критерии согласия
Критерии согласия проверяют, согласуется ли заданная выборка с заданным фиксированным распределением, с заданным параметрическим семейством распределений, или с другой выборкой.
·Критерий Колмогорова-Смирнова
·Критерий хи-квадрат (Пирсона)
·Критерий омега-квадрат (фон Мизеса)
Критерии сдвига
Специальный случай двухвыборочных критериев согласия. Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.
·Критерий Стьюдента
·Критерий Уилкоксона-Манна-Уитни
Критерии нормальности
Критерии нормальности — это выделенный частный случай критериев согласия. Нормально распределённые величины часто встречаются в прикладных задачах, что обусловлено действием закона больших чисел. Если про выборки заранее известно, что они подчиняются нормальному распределению, то к ним становится возможно применять более мощные параметрические критерии. Проверка нормальность часто выполняется на первом шаге анализа выборки, чтобы решить, использовать далее параметрические методы или непараметрические. В справочнике А. И. Кобзаря приведена сравнительная таблица мощности для 21 критерия нормальности.
·Критерий Шапиро-Уилка
·Критерий асимметрии и эксцесса
Критерии однородности
Критерии однородности предназначены для проверки нулевой гипотезы о том, что две выборки (или несколько) взяты из одного распределения, либо их распределения имеют одинаковые значения математического ожидания, дисперсии, или других параметров.