Проверка выполнения предпосылок регрессионного анализа

Проверка выполнения предпосылок регрессионного анализа выполняется на основе анализа остаточной компоненты. Анализ остатков позволяет получить представление, насколь­ко хорошо подобрана сама модель и насколько правильно вы­бран метод оценки коэффициентов. Согласно общим предполо­жениям регрессионного анализа остатки должны вести себя как независимые (в действительности почти независимые) одинаково распределенные случайные величины. В классических методах регрессионного анализа предполагается также нормальный закон распределения остатков. Исследование остатков полезно начинать с изучения их гра­фика. Он может показать наличие какой-то зависимости, не учтенной в модели. Скажем, при подборе простой линейной зависимости между У и X график остатков может показать необходимость перехода к нелинейной модели (квадратичной, полиномиальной, экспоненциальной) или включения в модель периодических компонент. График остатков хорошо показывает и резко отклоняющиеся от модели наблюдения — выбросы. Подобным аномальным набдениям надо уделять особо пристальное внимание, так как их присутствие может грубо искажать значения оценок. Устранение эффектов выбросов может проводиться либо с помощью удаления их точек из анализируемых данных (эта процедура называется цензурированием), либо с помощью применения методов оцени­вания параметров, устойчивых к подобным грубым отклонениям.

Независимость остатков проверяется с помощью критерия Дарбина—Уотсона.

Корреляционная зависимость между текущими уровнями не­которой переменной и уровнями этой же переменной, сдвину­тыми на несколько шагов, называется автокорреляцией.

Автокорреляция случайной составляющей нарушает одну из предпосылок нормальной линейной модели регрессии.

Наличие (отсутствие) автокорреляции в отклонениях проверя­ют с помощью критерия Дарбина—Уотсона. Численное значение коэффициента равно

Значение dw статистики близко к величине 2(1 - г(1)), где г(1) — выборочная автокорреляционная функция остатков первого порядка. Таким образом, значение статистики Дарбина—Уотсона распределено в интервале 0—4. Соответственно идеальное значе­ние статистики — 2 (автокорреляция отсутствует). Меньшие зна­чения критерия соответствуют положительной автокорреляции остатков, большие значения — отрицательной. Статистика учи­тывает только автокорреляцию первого порядка. Оценки, полу­чаемые по критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или отвергнуть гипотезу об отсутствии автокорреляции, зависят от количества уровней динамического ряда и числа неза­висимых переменных модели. Значения этих границ для уровня значимости α = 0,05 даны в специальных таблицах. При сравнении расчетного значения dw статистики с табличным могут возникнуть такие ситуации: d2 < dw < 2 — ряд остатков не коррелирован; dw < d} — остатки содержат автокорреляцию; d1 < dw < d2 — область неопределенности, когда нет оснований ни принять, ни отвергнуть гипотезу о существова­нии автокорреляции. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед сравнением с таб­личными значениями dwкритерий следует преобразовать по формуле dw' = 4 – dw.

Установив наличие автокорреляции остатков, переходят к улучшению модели. Если же ситуация оказалась неопределенной (d1 < dw < d2) применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции

Для принятия решения о наличии или отсутствии автокорре­ляции в исследуемом ряду фактическое значение коэффициента автокорреляции r(1) сопоставляется с табличным (критическим) значением для 5%-ного уровня значимости (вероятности до­пустить ошибку при принятии нулевой гипотезы о независимости уровней ряда). Если фактическое значение коэффициента авто­корреляции меньше табличного, то гипотеза об отсутствии ав­токорреляции в ряду может быть принята, а если фактическое значение больше табличного — делают вывод о наличии автокор­реляции в ряду динамики.

Обнаружение гетероскедастичности. Для обнаружения гетеро-скедастичности обычно используют три теста, в которых делают­ся различные предположения о зависимости между дисперсией случайного члена и объясняющей переменной: тест ранговой корреляции Спирмена, тест Голдфельда— Квандта и тест Глейзера.

При малом объеме выборки для оценки гетероскедастичности может использоваться метод Голдфельда— Квандта.

Данный тест используется для проверки такого типа гетеро­скедастичности, когда дисперсия остатков возрастает пропорци­онально квадрату фактора. При этом делается предположение, что случайная составляющая распределена нормально.

Чтобы оценить нарушение гомоскедастичности по тесту Голд­фельда— Квандта, необходимо выполнить следующие шаги.

1. Упорядочение п наблюдений по мере возрастания перемен­ной х.

2. Разделение совокупности на две группы (соответственно с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии.

3. Определение остаточной суммы квадратов для первой регрессии  и второй регрессии

4. Вычисление отношений (или наоборот) в числителе д.б. сумма квадратов. Полученное отношение имеет F распределение со степенями свободы k1=n1–m и k2=n–n1–m (где m – число оцениваемых парметров в уравнении регрессии).

Если , то гетероскедастичность имеет место.

Чем больше величина F превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин.

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: