Одно из условий Гаусса-Маркова требует постоянства дисперсии случайного члена εi во всех наблюдениях:
E (ei²) =s², i=1,2,...,n.
Это случай гомоскедастичности, при которой разброс точек наблюдений по вертикали в среднем не меняется с ростом номера наблюдений(Рис 1).
Если дисперсия случайного члена меняется от наблюдения к наблюдению, то мы имеем дело с гетероскедастичностью (рис2). При гетероскедастичности оценки коэффициентов регрессии будут несмещенными, но эффективными.
Вследствие этого могут оказаться завышенными t-статистики оценок коэффициентов, и будут сделаны ложные выводы о значимости коэффициентов регрессии.
Это явление возникает, когда не выполняется условие постоянства дисперсии ошибок ei в разных наблюдениях:
E (ei²) =si², i=1,2,...,n.
Это значит, что нарушается условие V(e)=s²In классической модели множественной линейной регрессии. Ковариационная матрица при гетероскедастичности будет диагональной:
(s²1 0 … 0)
V(e)= (0 s²2 … 0)
(………….)
(0 0 … s²n).
Остальные условия Гаусса-Маркова считаются выполненными. В частности, возмущения в разных наблюдениях предполагаются некоррелированными. Поэтому элементы вне главной диагонали ковариационной матрицы равны нулю. Обозначим Ω= V(e).
Если в условиях гетероскедастичности к модели множественной линейной регрессии y=Xβ+e применить метод наименьших квадратов, то оценка вектора коэффициентов βˆols=(X´X)‾ˡX´y также будет несмещенной:
E(βˆols)=E((X´X)‾ˡX´(Xβ+e))=β+(X´X)‾ˡX´E(e)=β.
Ковариационная матрица
V (βˆols)=V((X´X)‾ˡX´(Xβ+e))=(X´X)‾ˡX´ΩX(X´X)‾ˡ.
Но оценка ковариационной матрицы V (βˆols) по методу наименьших квадратов оказывается смещенной. Действительно,
V ˆ (βˆols)=e´e/n-k(X´X)‾ˡ.
Найдем математическое ожидание этой оценки:
E(V ˆ (βˆols))=E(e´e)/n-k(X´X)‾ˡ=tr(V(e))/n-k(X´X)‾ˡ.
Учитывая, что
V(e)=V(My)=V(M(Xβ+e))=MV(e)M´=MΩM´, получим
E(V ˆ (βˆols))=tr(MΩ)/n-k(X´X)‾ˡ.
Видно, что, вообще говоря, E(V ˆ (βˆols))≠ V (βˆols), т.е. оценка
V ˆ (βˆols) ковариационной матрицы V (βˆols) смещенная. В частности, для ее диагональных элементов E(s² βˆj) ≠ s² βˆj=var(βˆj).
Оценка дисперсии оцененного по методу наименьших квадратов коэффициента βˆj оказывается смещенной. Тогда t-статистики
βˆi-βiº/ s βˆI, i=1,2,…,n,
будут неправильными, что может привести к ошибочным выводам о значимости коэффициентов регрессии.