Проверка нормальности распределения

 

Проверка нормальности распределения позволяет нам определиться с тем, какую статистику для окончательного анализа мы можем использовать: 1) если распределения сравниваемых признаков окажутся близки к нормальному, то мы можем использовать более мощную параметрическую статистику; 2) если распределение хотя бы одного из сравниваемых признаков окажется далеким от нормального, то при расчетах в дальнейшем нужно применять непараметрическую статистику. Проверить нормальность распределения мы можем одним из следующих способов.

Критерии асимметрии и эксцесса. Выбираем Анализ (Analyze) ® Описательные статистики (Descriptive Statistics) ® Описательные… (Descriptives).В окне диалога переносим из левого окна в правое интересующие нас переменные. Нажимаем кнопку Параметры (Options), ставим флажок ассиметрия (Kurtosis) ® эксцесс (Skewness), нажимаем продолжить (Continue), затем ОК. В таблице результатов стол­бцы содержат значения асимметрии (Kurtosis) и эксцесса (Skewness) и соответствующие им стандартные ошибки (Std. Error) (рис. 19). Распреде­ление соответствует нормальному виду, если для соответствующей переменной абсолютные значения (по модулю) асимметрии и эксцесса не превышают свои стандартные ошибки. В нашем примере (рис. 19) распределение результатов по шкале понимание соответствует нормальному (асимметрия и эксцесс по модулю не превышают своих стандартных ошибок), а по шкале авторитетность – нет (абсолютное значение эксцесса (0,799) выше своей стандартной ошибки (0,733)).

Рисунок 19 – Пример расчета асимметрии и эксцесса в файле «Вывод»

Графический способ. Данный способ является наименее точным.Анализ (Analyze) ® Описательные статистики (Descriptive Statistics) ® Графики РР... — графики накопленных ча­стот (или Графики QQ... — квантильные графики). Открывается диалог Р-Р Plots (или Q-Q Plots).Переносим из левого в правое окно интересующие нас пе­ременные. Нажимаем ОК. В окне результатов просматриваем графики Normal Р-Р Plot... (Normal Q-Q Plot...), на которых по горизонтальной оси отложены соответствующие эмпирические значения, а по вертикальной оси — теорети­ческие значения. Чем ближе точки графиков к прямой линии, тем меньше от­личие распределения от нормального вида.

Рисунок 20 – Вероятностный график РР… в файле «Вывод»

Критерий нормальности Колмогорова-Смирнова. Выбираем Анализ (Analyze) ® Непараметрические критерии (Nonparametric Tests) ® Устаревшие диалоговые овна ® Одновыборочный Колмогорова-Смирнова (1-SampIe K-S). Открывается диалог One-Sample Kolmogorov-Smirnov Test.Переносим из левого в правое окно интересующие нас пере­менные. Ставим флажок на «Нормальное» (рис. 21). Нажимаем ОК.

 
 


Рисунок 21 – Проверка нормальности распределения (критерий Колмогорова-Смирнова)

В соответствующем переменной столбце находим значение критерия (Test Statistic) и асимпт. знч. (двусторонняя) (Asymp. Sig. (2-tailed)), т.е.вероятность того, что распределение соответствует нормальному виду. Фраза «двустороння» в SPSS означает, что для нахождения стандартной вероятности данное число нужно разделить на 2. Если асимпт. знч. после деления на 2 меньше или равно 0,05, то распределение существенно отличает­ся от нормального вида; если - больше 0,05, то существенного от­личия от нормальности не обнаружено. В нашем примере (рис. 21) значение критерия равно 0,097, асимпт. знч. после деления на 2 равно 0,1 - это больше 0,05, поэтому распределение признака «Понимание» существенно не отличается от нормального.

Практическая работа. Определить нормальность распределения для переменной «возраст начала курения» всеми возможными способами. Сделать выводы.

 

Прежде чем приступить к описанию обработки данных с помощью математических критериев, необходимо упомянуть несколько особенностей:

1) описанный выше способ работы с программой, а именно – перетаскивание с помощью стрелки выбранных полей из левого просмотрового окна в «режиме» различных диалоговых окон – является постоянным;

2) уровень значимости обычно обозначается как асимпт. знч. (Asymp. Sig.). Если рядом с ним есть надпись «двусторонняя». (2-tailed), то нужно полученное значение разделить на 2, чтобы перейти к стандартным уровням значимости;

3) в статистических программах (не только в SPSS) часто используются не стандартные уровни статистической значимости (0,05, 0,01 и 0,001), а уровни, подсчитываемые непосредственно в процессе работы с конкретным статистическим методом (варьируют от 0 до 1, обозначаются в SPSS как «Sig.», то есть significance). При их интерпретации обычно исходят из величины 0,05 – если показатель «sig.» меньше 0,05, то результат статистически достоверен (обычно это означает, что между сравниваемыми распределениями обнаружены статистически значимые различия).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: