Проверка нормальности распределения позволяет нам определиться с тем, какую статистику для окончательного анализа мы можем использовать: 1) если распределения сравниваемых признаков окажутся близки к нормальному, то мы можем использовать более мощную параметрическую статистику; 2) если распределение хотя бы одного из сравниваемых признаков окажется далеким от нормального, то при расчетах в дальнейшем нужно применять непараметрическую статистику. Проверить нормальность распределения мы можем одним из следующих способов.
Критерии асимметрии и эксцесса. Выбираем Анализ (Analyze) ® Описательные статистики (Descriptive Statistics) ® Описательные… (Descriptives).В окне диалога переносим из левого окна в правое интересующие нас переменные. Нажимаем кнопку Параметры (Options), ставим флажок ассиметрия (Kurtosis) ® эксцесс (Skewness), нажимаем продолжить (Continue), затем ОК. В таблице результатов столбцы содержат значения асимметрии (Kurtosis) и эксцесса (Skewness) и соответствующие им стандартные ошибки (Std. Error) (рис. 19). Распределение соответствует нормальному виду, если для соответствующей переменной абсолютные значения (по модулю) асимметрии и эксцесса не превышают свои стандартные ошибки. В нашем примере (рис. 19) распределение результатов по шкале понимание соответствует нормальному (асимметрия и эксцесс по модулю не превышают своих стандартных ошибок), а по шкале авторитетность – нет (абсолютное значение эксцесса (0,799) выше своей стандартной ошибки (0,733)).
Рисунок 19 – Пример расчета асимметрии и эксцесса в файле «Вывод»
Графический способ. Данный способ является наименее точным.Анализ (Analyze) ® Описательные статистики (Descriptive Statistics) ® Графики РР... — графики накопленных частот (или Графики QQ... — квантильные графики). Открывается диалог Р-Р Plots (или Q-Q Plots).Переносим из левого в правое окно интересующие нас переменные. Нажимаем ОК. В окне результатов просматриваем графики Normal Р-Р Plot... (Normal Q-Q Plot...), на которых по горизонтальной оси отложены соответствующие эмпирические значения, а по вертикальной оси — теоретические значения. Чем ближе точки графиков к прямой линии, тем меньше отличие распределения от нормального вида.
Рисунок 20 – Вероятностный график РР… в файле «Вывод»
Критерий нормальности Колмогорова-Смирнова. Выбираем Анализ (Analyze) ® Непараметрические критерии (Nonparametric Tests) ® Устаревшие диалоговые овна ® Одновыборочный Колмогорова-Смирнова (1-SampIe K-S). Открывается диалог One-Sample Kolmogorov-Smirnov Test.Переносим из левого в правое окно интересующие нас переменные. Ставим флажок на «Нормальное» (рис. 21). Нажимаем ОК.
Рисунок 21 – Проверка нормальности распределения (критерий Колмогорова-Смирнова)
В соответствующем переменной столбце находим значение критерия (Test Statistic) и асимпт. знч. (двусторонняя) (Asymp. Sig. (2-tailed)), т.е.вероятность того, что распределение соответствует нормальному виду. Фраза «двустороння» в SPSS означает, что для нахождения стандартной вероятности данное число нужно разделить на 2. Если асимпт. знч. после деления на 2 меньше или равно 0,05, то распределение существенно отличается от нормального вида; если - больше 0,05, то существенного отличия от нормальности не обнаружено. В нашем примере (рис. 21) значение критерия равно 0,097, асимпт. знч. после деления на 2 равно 0,1 - это больше 0,05, поэтому распределение признака «Понимание» существенно не отличается от нормального.
Практическая работа. Определить нормальность распределения для переменной «возраст начала курения» всеми возможными способами. Сделать выводы.
Прежде чем приступить к описанию обработки данных с помощью математических критериев, необходимо упомянуть несколько особенностей:
1) описанный выше способ работы с программой, а именно – перетаскивание с помощью стрелки выбранных полей из левого просмотрового окна в «режиме» различных диалоговых окон – является постоянным;
2) уровень значимости обычно обозначается как асимпт. знч. (Asymp. Sig.). Если рядом с ним есть надпись «двусторонняя». (2-tailed), то нужно полученное значение разделить на 2, чтобы перейти к стандартным уровням значимости;
3) в статистических программах (не только в SPSS) часто используются не стандартные уровни статистической значимости (0,05, 0,01 и 0,001), а уровни, подсчитываемые непосредственно в процессе работы с конкретным статистическим методом (варьируют от 0 до 1, обозначаются в SPSS как «Sig.», то есть significance). При их интерпретации обычно исходят из величины 0,05 – если показатель «sig.» меньше 0,05, то результат статистически достоверен (обычно это означает, что между сравниваемыми распределениями обнаружены статистически значимые различия).