Одно из требований классической регрессионной модели заключается в нормальности распределения случайной величины
. Выполнимость или невыполнимость его не оказывает влияния на качество оценок параметров регрессии, но является достаточно важным. Оно позволяет использовать стандартные процедуры проверки статистических гипотез и построения доверительных интервалов.
Проверка на нормальность распределения без существенных вычислительных затрат может быть проведена с помощью стандартного теста, опирающегося на критерий Пирсона.
Второй способ тестирования имеет визуальный характер. Он ориентируется на характерные особенности графика плотности нормально распределенных случайных величин. Для этого строится гистограмма остатков и соединяются середины верхних сторон прямоугольников гистограммы. Если ломаная линия приближенно напоминает кривую плотности нормального распределения, то можно сделать грубый вывод о том, что остатки распределены по нормальному закону.
Применение визуального метода рекомендуется в случаях, когда число наблюдений сравнительно невелико (от 10 до 25) и невозможно применить критерий Пирсона хи-квадрат, где предполагается, что
.
Достаточно простым методом диагностики нормальности распределения остатков является тест Жарка-Бера. Идея метода состоит в том, что для совокупности остатков оценивается «скошенность» (асимметрия) и «вытянутость» (эксцесс) фактического распределения ряда остатков и сравнивается с нормальным. При этом за оценку «скошенности» распределения отвечает коэффициент асимметрии
, а за оценку «вытянутость» распределения – коэффициент эксцесса
.
Алгоритм теста Жарка-Бера следующий.
1) Выдвигается гипотеза
о нормальном распределении остатков выборки.
2) Вычисляется наблюдаемое значение критерия по формуле
.
3) По таблице критических точек распределения Пирсона (число степеней свободы 2) определяется критическое значение (на уровне значимости 0,05 оно равно 5,991).
4) Если
, то гипотеза
о нормальном распределении остатков отклоняется, т.е. распределение остатков не является нормальным. Если
, то гипотеза
о нормальном распределении остатков принимается.
Нахождение коэффициента асимметрии
и коэффициента эксцесса
можно осуществить с помощью вкладки «Описательная статистика» пакета «Анализ данных» Excel.