Методы тестирования на автокорреляцию

Существует несколько подходов к тестированию регрессионных остатков на автокорреляцию. Во многих статистических пакетах решение задач по построению регрессии дополняется графическим представлением результатов моделирования. В том числе предоставляется возможность визуализации поведения отклонений во времени. Как правило, строятся либо последовательно-временные графики, либо графики зависимости от .

В первом случае по оси абсцисс откладывается либо время, в которое было получено статистическое наблюдение, либо номер наблюдения, а по оси ординат – отклонение , величина которого становится известной после построения уравнения регрессии.

Рис. 3.1. Зависимость остатков от времени

Анализ графиков, представленных на рис. 3.1, показывает, что в случае а) и б) изменение остатков подчиняется некоторой закономерности и можно предположить, что они автокоррелированы. Случай в) свидетельствует об отсутствии какой-либо зависимости, и предположение о возможной автокоррелированности несостоятельно.

Во втором случае по оси абсцисс откладывается , а по оси ординат – . Тогда, если график будет иметь вид, представленный на рис. 3.2, то есть все основания считать, что остатки автокоррелированы. Причем, так как большинство точек на этом графике расположены в первой и третьей четвертях декартовой системы координат, то можно с уверенностью говорить о положительной зависимости в среднем между соседними отклонениями.

К сожалению, графики остатков не всегда выглядят так убедительно, как на приведенных рисунках. Поэтому, кроме графических, применяются и аналитические методы тестирования на автокорреляцию остатков.

Рис. 3.2. Авторегрессионная зависимость остатков

Метод рядов. Этот метод состоит в следующем. После построения уравнения регрессии последовательно определяются знаки отклонений , например,

(+ + + +) (- - - - - - - -) (+ + + + +) (- - -) (+ + + +) (-),

т.е. 4 «+», 8 «-», 5 «+», 3 «-», 4 «+», 1 «-» получено при построении модели по выборке из 25 наблюдений.

Будем называть рядом непрерывную последовательность одинаковых знаков. Количество знаков в ряду принято называть длиной ряда.

Интуитивно понятно, что если есть ряды, то, скорее всего, между остатками есть зависимость. Причем, если рядов слишком мало по сравнению с количеством наблюдений, то вполне вероятна положительная автокорреляция, если же рядов слишком много, то вероятна отрицательная автокорреляция. Для более обоснованного вывода предлагается следующая процедура.

Введем обозначения:

– объем выборки;

– общее количество знаков «+» при наблюдениях (количество положительных отклонений );

– общее количество знаков «–» при наблюдениях (количество отрицательных отклонений );

– количество рядов.

При достаточно большом количестве наблюдений ( >10, >10) и отсутствии автокорреляции доказано, что случайная величина имеет асимптотически нормальное распределение с

; . (3.111)

Тогда, если окажется, что удовлетворяет неравенству

, (3.112)

то гипотеза об отсутствии автокорреляции не отклоняется ( – -квантиль стандартного нормального распределения). В противном случае – в остатках наблюдается автокорреляция.

Критерий Дарбина – Уотсона. Этот критерий по сравнению с другими используется гораздо чаще. В его основу положена простая идея, в соответствии с которой, если корреляция случайной составляющей регрессии не равна 0, то она должна присутствовать и в остатках регрессии , получающихся в результате обычного МНК. В тесте Дарбина – Уотсона для оценки автокорреляции используется статистика

. (3.113)

Подробности применения этого критерия были рассмотрены в предыдущей главе. Корректное использование статистики возможно при выполнении следующих условий:

1) модель, для которой возникает необходимость применения этого критерия, должна содержать свободный член;

2) предполагается, что случайная составляющая модели определяется в соответствии с авторегрессионной схемой первого порядка;

3) наблюдения, используемые для построения модели, имеют одинаковую периодичность, т.е. в них нет пропусков;

4) критерий нельзя применять, если в регрессионной модели в число объясняющих переменных входит зависимая переменная с лагом в один период. Такое ограничение связано с тем, что распределение статистики зависит не только от числа наблюдений, но и от значений самих регрессоров. А это означает, что тест перестает играть роль критерия в том смысле, что нельзя указать критическую область, которая позволяла бы принимать решение об отсутствии автокорреляции в тех случаях, когда в эту область попадают наблюдаемые значения статистики .

Критерий на основе h-статистики Дарбина. Этот критерий разработан для обнаружения автокоррелированности остатков в моделях, содержащих авторегрессионные члены. Тестирование осуществляется с помощью h- статистики Дарбина, которая вычисляется по формуле

, (3.114)

где – оценка коэффициента авторегрессии;

– число наблюдений;

– выборочная дисперсия коэффициента при лаговой переменной уравнения регрессии

. (3.115)

При большом объеме выборке и справедливости нулевой гипотезы статистика h имеет стандартизованное нормальное распределение (). Это позволяет по заданному уровню значимости определить критическую точку из условия и сравнить h -статистику с . Если , то нулевая гипотеза об отсутствии автокорреляции отклоняется.

Значение рассчитывается с помощью статистики Дарбина – Уотсона по формуле

, (3.116)

а представляет собой квадрат стандартной ошибки оценки .

Таким образом, статистика h легко вычисляется на основе данных оцененной регрессии (3.115). Единственная проблема, которая может возникнуть связана с тем, что вполне возможен случай, когда .

Тест серий (Бреуша – Голдфри). Идея этого теста основана на проверки значимости коэффициента авторегрессионной модели

, (3.117)

где – остатки регрессии, коэффициенты которой получены с помощью обычного МНК.

Схема практической реализации этого теста довольно проста, и поэтому не вызывает затруднений. Преимущество теста серий перед тестом Дарбина – Уотсона в том, что он не содержит зону неопределенности. Кроме того, с помощью критерия Бреуша – Голдфри можно выявлять автокорреляцию не только между соседними, но и между отдаленными наблюдениями, т.е. проверять значимость коэффициентов в авторегрессионных моделях первого, второго и более высоких порядков

. (3.118)