Линейная модель множественной регрессии с гетероскедастичными остатками

Достаточно часто при построении регрессии анализируемые объекты неоднородны, например, при исследовании структуры потребления домохозяйств естественно ожидать, что колебания в структуре будут выше для богатых, чем для бедных домохозяйств. В этой ситуации предположение (3.3) о постоянстве дисперсии случайной ошибки (имеется в виду возможное поведение случайного члена до того, как сделана выборка) оказывается не соответствующим действительности. В случаях, когда дисперсия одинакова в каждый момент времени или для каждого значения Х, существуют определенные ограничения (в некоторой полосе) для расположения точек на графике Х и , согласно которым отчетливой тенденции к увеличению или уменьшению дисперсии по мере роста н е наблюдается.

На рис. 4.1 приводятся примеры изменения разброса (гетероскедастичности) случайной ошибки регрессии.

На рис. 4.1а изображена ситуация, когда значения дисперсии растут по мере увеличения значений регрессора Х. На рис. 4.1б дисперсия ошибки достигает максимальной величины при средних значениях Х, уменьшаясь по мере приближения к крайним значениям. Наконец, на рис. 4.1в дисперсия ошибки оказывается наибольшей при малых значениях Х; быстро уменьшается и становится однородной по мере увеличения независимой переменной Х.

Рис. 4.1. Примеры гетероскедастичности

Гетероскедастичность дисперсии случайного члена означает, что

т.е. нарушается предположение (3.3) в КЛММР, и необходимо рассматривать ОЛММР с нулевой ковариацией случайных ошибок (ср. (4.5) и (4.8)).

Основные последствия гетероскедастичности проявляются в получении неэффективных оценок МНК и занижении стандартных ошибок коэффициентов регрессии, что завышает -статистику и даёт неправильное представление о точности уравнения регрессии.

Поэтому для оценивания регрессии с гетероскедастичными случайными ошибками применяется ОМНК.

Предположим, что известны значения величин , . Разделим уравнение (4.3) :

и получим регрессию с постоянной (гомоскедастичной) дисперсией случайного члена. Действительно

Для получения оценок неизвестных дисперсий , будем предполагать, что они пропорциональны некоторым числам, т.е.

, где - - некоторая константа.

I

Принимая различные гипотезы относительно характера гетероскедастичности, будем иметь соответствующие значения ..

Если дисперсия случайного члена пропорциональна квадрату регрессора , так что , то .

Если дисперсия случайного члена пропорциональна Х, так что , то . Например, для случая одной объясняющей переменной имеем в этом случае систему уравнений ОМНК вида

Поскольку значения , являются фактически весами, которые устраняют неоднородность дисперсии, то ОМНК для системы с гетероскедастичностью часто называют методом взвешенных наименьших квадратов.

Существуют также и другие методы коррекции модели на гетероскедастичность, в частности состоятельное оценивание стандартных ошибок.

Рассмотрим вопрос тестирования выборки на наличие гомоскедастичности. Возможности такой проверки зависят от природы исходных данных.

Если имеется обширная выборка, то можно воспользоваться стандартным критерием однородности дисперсии Бартлетта.

Расчленяя выборку на т независимых групп (каждой из них соответствует единственное значение переменной ), вычислим величины

причем ,где - число наблюдений в группе, - дисперсия ошибки в -ойгруппе. Величина будет приближенно удовлетворять распределению с степенями свободы. Если вычисленное по выборке значение меньше критического, то гипотеза об однородности выборочной дисперсии принимается, в противном случае отклоняется.

В случаях малого количества наблюдений в выборке, когда группировка данных невозможна, используется тест Голдфельда-Квандта. Он предусматривает осуществление следующих шагов:

1. Упорядочить наблюдения по убыванию той независимой переменной, относительно которой есть подозрение на гетероскедастичность.

2. Опустить наблюдений, оказавшихся в центре (число должно быть примерно равно четверти общего количества наблюдений ).

3. Оценить отдельно обыкновенным методом наименьших квадратов регрессии на первых наблюдениях и на последних наблюдениях при условии, что больше числа оцениваемых параметров .

4. Пусть и - суммы квадратов остатков от первой и второй регрессий соответственно. Тогда статистика будет удовлетворять - распределению с степенями свободы. При гипотеза об однородности выборочной дисперсии принимается, в противном случае (с ростом величины ) отклоняется.

Очевидно, что решающим для этого теста является выбор величины . Слишком большое значение уменьшает надежность теста. Экспериментально установлено, что для одной объясняющей переменной оптимальное при и при

Кроме перечисленных, могут использоваться тесты на гетероскедастичность Уайта, Бреуша-Пегана и др.

Пример. Проверим по критерию Бартлетта данные из примера 1 раздела 3. Будем иметь табл. 4.1. В табл. 4.1 учтено, что среднее значение равно 0, а значит, Примем . Тогда:

При одной степени свободы критическое значение при 5% уровне значимости равно 3,84 и, следовательно, гипотеза об однородности выборочной дисперсии принимается.

Для тех же данных применим тест Гольдфельда-Квандта. В рассматриваемом случае число объясняющих переменных ,количество исходных данных в выборке . Упорядочим наблюдения по убыванию независимой переменной - расстояние перевозки, относительно которой есть подозрение на гетероскедастичность. Опустим 4 наблюдения, оказавшихся в центре, т.е. При значении получим суммы квадратов остатков от первой и второй регрессий соответственно и Статистика удовлетворяет -распределению с степенями свободы. и гипотеза об однородности выборочной дисперсии должна быть отвергнута

Так как тесты дают противоположные результаты, то лучше согласиться с наихудшим вариантом, т.е. предположить наличие гетероскедастичности.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: