Классическая линейная модель множественной регрессии
Рассмотрим обобщение линейной регрессионной модели для случая более двух переменных.
Всякий раз, когда изучаемый процесс или явление является результатом совместного действия нескольких факторов, у исследователя возникает потребность в оценке влияния каждого фактора в отдельности. Один из стандартных методов[3], позволяющий успешно решить эту задачу, суть множественная регрессия.
Пусть мы располагаем выборочными наблюдениями над k переменными Yi и , j =1,..., k, i =1,2,…, n, где n – количество наблюдений:
… | i | … | n | ||
Y1, | Y2, | … | Yi, | … | Yn |
X11, | X12, | … | X1i, | … | X1n |
… | … | … | … | … | … |
Xk1, | Xk2, | … | Xki, | … | Xkn |
Предположим, что существует линейное соотношение между результирующей переменной Y и k объясняющими переменными X 1, X 3,..., X k. Тогда с учетом случайной ошибки u i запишем уравнение:
(3.1)
В (3.1) неизвестны коэффициенты , j =0,2,…, k и параметры распределения ui. Задача состоит в оценивании этих неизвестных величин. Модель (3.1) называется классической линейной моделью множественной регрессии (КЛММР). Заметим, что часто имеют в виду, что переменная X 0 при b 0 равна единице для всех наблюдений i =1,2,…, n.
|
|
Относительно переменных модели в уравнении (3.1) примем следующие основные гипотезы:
E(ui)=0; (3.2)
(3.3)
X1, X3,..., Xk – неслучайные переменные; (3.4)
Не должно существовать строгой линейной
зависимости между переменными X 1, X 3,..., X k. (3.5)
Первая гипотеза (3.2) означает, что переменные u i имеют нулевую среднюю.
Суть гипотезы (3.3) в том, что все случайные ошибки u i имеют постоянную дисперсию, то есть выполняется условие гомоскедастичности дисперсии (см. подробнее раздел 4).
Согласно (3.4) в повторяющихся выборочных наблюдениях источником возмущений Y являются случайные колебания u i, а значит, свойства оценок и критериев обусловлены объясняющими переменными X 1, X 3,..., X k.
Последняя гипотеза (3.5) означает, в частности, что не существует линейной зависимости между объясняющими переменными, включая переменную X 0, которая всегда равна 1.
Понятно, что условия (3.2)-(3.4) соответствуют своим аналогам для случая двух переменных в п.2.2.