Оценки коэффициентов уравнения регрессии должны отвечать таким критериям, как несмещенность, состоятельность и эффективность.
Несмещенность оценки коэффициента означает равенство ее математического ожидания «истинному» значению коэффициента (т.е. равенство математического ожидания остатков е нулю):
.
Эффективность оценки коэффициента означает, что оценка коэффициента имеет наименьшую из возможных дисперсию:
.
Состоятельность оценки коэффициента означает увеличение ее точности с увеличением числа наблюдений:
при ,
где - заданная погрешность.
Поскольку обычный МНК позволяет вычислить оценки коэффициентов регрессионного уравнения на основе минимизации суммы квадратов остатков е, для получения несмещенных, состоятельных и эффективных оценок коэффициентов уравнения регрессии, необходимо, чтобы остатки обладали следующими свойствами:
- имели случайный характер;
- имели нулевое математическое ожидание (среднее значение);
- были гомоскедастичными, т.е. имели одинаковую дисперсию во всех N наблюдениях;
- были независимыми друг от друга, т.е. неавтокоррелированными;
- были подчинены нормальному закону распределения.
При нарушении свойства гомоскедастичности (т.е. при гетероскедастичности остатков) и при наличии у них автокорреляции, для получения несмещенных, состоятельных и эффективных оценок коэффициентов уравнения используют обобщенный метод наименьших ква дратов (ОМНК).
Рассмотрим использование ОМНК при гетероскедастичности остатков. Гетероскедастичность остатков означает, что в различных наблюдениях для независимого фактора остатки (t = 1, 2, …, N) имеют различную дисперсию:
; или .
Величина Кt, может меняться при переходе от одного значения фактора хt к другому.
Задача вычисления оценок коэффициентов уравнения регрессии, решаемая в подобной ситуации, состоит в определении величины Кt и внесении поправки в исходные переменные.
При уравнение регрессии примет вид:
.
В новом уравнении остатки гетероскедастичны. Предполагая отсутствие их автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные на . Тогда дисперсия остатков станет величиной постоянной, т. е . Иными словами, от регрессии переменных у и х необходимо перейти к регрессии для новых переменных и :
.
По отношению к обычной регрессии уравнение с новыми, преобразованными переменными, представляет собой взвешенную регрессию, в которой переменные у и х взяты с весами .
Оценки коэффициентов нового уравнения с преобразованными переменными являются оценками взвешенного (обобщенного) метода наименьших квадратов.
Аналогичный подход к построению уравнения применим и для уравнений множественной регрессии.
Коэффициенты взвешенной модели зависят от предположений относительно коэффициента пропорциональности Кt. В эконометрических исследованиях довольно часто выдвигается гипотеза, что остатки пропорциональны значениям какой-либо независимой переменной. Например, если предположить, что остатки пропорциональны переменной х 1, то для уравнения можно составить новое уравнение множественной регрессии вида:
.
Следует иметь в виду, что новые преобразованные переменные получают новое экономическое содержание, а новое уравнение регрессии имеет иной смысл по сравнению с уравнением регрессии, построенным по исходным данным.
Чтобы убедиться в необходимости использования обобщенного МНК, обычно проводят визуальную проверку гетероскедастичности (строят поле корреляции для значений и ) или проводят ее эмпирическую проверку.
При малом объеме фактических данных для оценки гетероскедастичности используется параметрический тест Гольдфельда-Квандта, который включает в себя следующие шаги.
1. Упорядочение N наблюдений по возрастанию значений переменной x.
2. Исключение из рассмотрения С центральных наблюдений (например, при N =20 C =4; N =30 C =8; N =60 C =16 и т.п.). При этом (N-С): 2 > n, где n - число оцениваемых коэффициентов.
3. Разделение совокупности из (N-С) наблюдений на две группы (соответственно с малыми и большими значениями фактора х) и построение для каждой из групп уравнений регрессии.
4. Определение суммы квадратов остатков для первой (S 1) и второй (S 2) групп и нахождение их отношения: R = S 1: S 2.
При выполнении гипотезы о гомоскедастичности остатков отношение R будет удовлетворять F -критерию с (N - С -2 n)/ 2 степенями свободы для каждой суммы квадратов остатков. Чем больше величина R превышает табличное значение F -критерия, тем больше нарушена предпосылка о равенстве дисперсий остаточных величин.
При построении регрессионных моделей чрезвычайно важно соблюдение предпосылки МНК об отсутствия автокорреляции остатков, т. е. о распределении значений остатков независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущего (t -го) и предыдущего (t –1)-го наблюдения. Коэффициент корреляции между et и еt-1 (где еt — остатки текущих наблюдений, еt-1 — остатки предыдущих наблюдений) может быть определен по обычной формуле линейного коэффициента корреляции:
.
Если этот коэффициент существенно отличен от нуля, то остатки считают автокоррелированными.