Гетероскедастичность. Последствия гетероскедастичности

Одно из условий Гаусса-Маркова требует постоянства дисперсии случайного члена εi во всех наблюдениях:

E (ei²) =s², i=1,2,...,n.

Это случай гомоскедастичности, при которой разброс точек наблюдений по вертикали в среднем не меняется с ростом номера наблюдений(Рис 1).

Если дисперсия случайного члена меняется от наблюдения к наблюдению, то мы имеем дело с гетероскедастичностью (рис2). При гетероскедастичности оценки коэффициентов регрессии будут несмещенными, но эффективными.

Вследствие этого могут оказаться завышенными t-статистики оценок коэффициентов, и будут сделаны ложные выводы о значимости коэффициентов регрессии.

Это явление возникает, когда не выполняется условие постоянства дисперсии ошибок ei в разных наблюдениях:

E (ei²) =si², i=1,2,...,n.

Это значит, что нарушается условие V(e)=s²In классической модели множественной линейной регрессии. Ковариационная матрица при гетероскедастичности будет диагональной:

(s²1 0 … 0)

V(e)= (0 s²2 … 0)

(………….)

(0 0 … s²n).

Остальные условия Гаусса-Маркова считаются выполненными. В частности, возмущения в разных наблюдениях предполагаются некоррелированными. Поэтому элементы вне главной диагонали ковариационной матрицы равны нулю. Обозначим Ω= V(e).

Если в условиях гетероскедастичности к модели множественной линейной регрессии y=Xβ+e применить метод наименьших квадратов, то оценка вектора коэффициентов βˆols=(X´X)‾ˡX´y также будет несмещенной:

E(βˆols)=E((X´X)‾ˡX´(Xβ+e))=β+(X´X)‾ˡX´E(e)=β.

Ковариационная матрица

V (βˆols)=V((X´X)‾ˡX´(Xβ+e))=(X´X)‾ˡX´ΩX(X´X)‾ˡ.

Но оценка ковариационной матрицы V (βˆols) по методу наименьших квадратов оказывается смещенной. Действительно,

V ˆ (βˆols)=e´e/n-k(X´X)‾ˡ.

Найдем математическое ожидание этой оценки:

E(V ˆ (βˆols))=E(e´e)/n-k(X´X)‾ˡ=tr(V(e))/n-k(X´X)‾ˡ.

Учитывая, что

V(e)=V(My)=V(M(Xβ+e))=MV(e)M´=MΩM´, получим

E(V ˆ (βˆols))=tr(MΩ)/n-k(X´X)‾ˡ.

Видно, что, вообще говоря, E(V ˆ (βˆols))≠ V (βˆols), т.е. оценка

V ˆ (βˆols) ковариационной матрицы V (βˆols) смещенная. В частности, для ее диагональных элементов E(s² βˆj) ≠βˆj=var(βˆj).

Оценка дисперсии оцененного по методу наименьших квадратов коэффициента βˆj оказывается смещенной. Тогда t-статистики

βˆi-βiº/ s βˆI, i=1,2,…,n,

будут неправильными, что может привести к ошибочным выводам о значимости коэффициентов регрессии.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: