Обобщенный метод наименьших квадратов, теорема Айткена

 

Применение обычного метода наименьших квадратов при нарушении условия гомоскедастичности приводит к следующим отрицательным последствиям:

1. оценки неизвестных коэффициентов β неэффективны, то есть существуют другие оценки, которые являются несмещенными и имеют меньшую дисперсию.

2. стандартные ошибки коэффициентов регрессии будут занижены, а, следовательно, t -статистики – завышены, и будет получено неправильное представление о точности уравнения регрессии.

Обобщенный метод наименьших квадратов

Рассмотрим метод оценивания при нарушении условия гомоскедастичности, матрица имеет вид β= (ХТ Ω-1 Х)-1 ХТ Ω-1у

Расчёт неизвестных коэффициентов регрессии по данной формуле называют обобщённым методом наименьших квадратов (ОМНК).

Теорема Айткена: при нарушении предположения гомоскедастичности оценки, полученные обобщенным методом наименьших квадратов, являются несмещенными и наиболее эффективными (имеющими наименьшую вариацию). На практике матрица Ω практически никогда не известна. Поэтому часто пытаются каким-либо методом оценить оценки матрицы Ω и использовать их для оценивания. Этот метод носит название доступного обобщенного метода наименьших квадратов.



Тесты на гетероскедастичность: Спирмена, Бреуша-Пагана, Уайта, Голдфельда-Квандта

 

Ранговая корреляция. Тест ранговой корреляции Спирмена

• Ранг наблюдения переменной - номер наблюдения переменной в упорядоченной по возрастанию последовательности.

• Тест ранговой корреляции Спирмена тест на гетероскедастичность, устанавливающий, что стандартное отклонение остаточного члена регрессии имеет нестрогую линейную зависимость с объясняющей переменной.

При выполнении теста ранговой корреляции Спирмена предполагается, что дисперсия случайного члена будет либо увеличиваться, либо уменьшаться по мере увеличения x, и поэтому в регрессии, оцениваемой с помощью МНК, абсолютные величины остатков и значения х будут коррелированны. Данные по х и остатки упорядочиваются. Если предположить, что соответствующий коэффициент корреляции генеральной совокупности равен нулю, т.е. гетероскедастичность отсутствует, то коэффициент ранговой корреляции имеет нормальное распределение с математическим ожиданием 0 и дисперсией 1/(n - 1) в больших выборках.

Тест Голдфелда-Квандта

• Наиболее популярным формальным критерием является критерий, предложенный С. Голдфелдом и Р. Квандтом.

• При проведении проверки по этому критерию предполагается, что стандартное отклонение распределения вероятностей u пропорционально значению х в этом наблюдении.

• Предполагается также, что случайный член распределен нормально и не подвержен автокорреляции.

• Иными словами тест Голдфелда- Квандта - тест на гетероскедастичность, устанавливающий, что стандартное отклонение остаточного члена регрессии растет, когда растет объясняющая переменная.

• Все n наблюдений в выборке упорядочиваются по величине х, после чего оцениваются отдельные регрессии для первых n’ и для последних n’ наблюдений;

• Средние (n- 2n’) наблюдений отбрасываются.

• Если предположение относительно природы гетероскедастичности верно, то дисперсия и в последних n’ наблюдениях будет больше, чем в первых n’, и это будет отражено в сумме квадратов остатков в двух указанных "частных" регрессиях.

• Обозначим суммы квадратов остатков в регрессиях для первых n’ и последних n’ наблюдений соответственно через RSS1, и RSS2,

• рассчитаем отношение RSS2/RSS1, которое имеет распределение F с (n’ - k - 1) и (n’ - k - 1) степенями свободы, где k -число объясняющих переменных в регрессионном уравнении.

• Метод Голдфелда-Квандта может также использоваться для проверки на гетероскедастичность при предположении, что σ, обратно пропорционально х,.

• Используется та же процедура, что и описанная выше, но тестовой статистикой теперь является показатель RSS1/RSS2, который вновь имеет F-распределение с (n’- k - 1) и (n’ - k -1) степенями свободы.

• Обозначим суммы квадратов остатков в регрессиях для первых n’ и последних n’ наблюдений соответственно через RSS1, и RSS2,

• рассчитаем отношение RSS2/RSS1, которое имеет распределение F с (n’ - k - 1) и (n’ - k - 1) степенями свободы, где k -число объясняющих переменных в регрессионном уравнении

• Таким образом, тест Голдфелда-Квандта состоит из трех этапов:

1. все наблюдения в выборке упорядочиваются по возрастанию х.

2. берутся первые и последние n наблюдений (треть от всех), оцениваются две различные регрессии и находятся RSS1 и RSS2

3. Для отношения RSS2/RSS1, проводят тест Фишера с (n’ - k - 1) верхними и (n’ - k - 1) нижними степенями свободы, где k - количество объясняющих переменных в регрессиях.

Тест Бреуш-Пагана

Тест применим в предположении, что: Дисперсии зависят от некоторых дополнительных переменных:

1. Строится уравнение регрессии: и вычисляются остатки:

2. Вычисляют оценку дисперсии остатков:

3. Строят вспомогательное уравнение регрессии

4. Для вспомогательного уравнения регрессии определяют объясненную часть вариации RSS.

5. Находим тестовую статистику:

6. Если верна гипотеза H0: гомоскедастичность остатков, то статистика BP имеет распределение. Т.е. о наличии гетероскедастичности остатков на уровне значимости a свидетельствует:

Замечания

При гетероскедастичность может быть скорректирована:

Тест Уайта

Предполагается, что дисперсии связаны с объясняющими переменными в виде:

Т.к. дисперсии неизвестны, то их заменяют оценками квадратов отклонений ei2.

Алгоритм применения (на примере трех переменных)

1. Строится уравнение регрессии: и вычисляются остатки.

2. Оценивают вспомогательное уравнение регрессии:

3. Определяют из вспомогательного уравнения тестовую статистику

4. Проверяют общую значимость уравнения с помощью критерия c2.

Замечания

Тест Уайта является более общим чем тест Голдфелда-Квандта.

Неудобство использования теста Уайта: Если отвергается нулевая гипотеза о наличии гомоскедастичности то неясно, что делать дальше.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: