Спецификация модели и отбор факторов при построении множественной регрессии

Парная регрессия дает хорошие результаты при моделировании, если влиянием всех других факторов, кроме того, который включен в модель, можно пренебречь. Если это сделать невозможно, то строят уравнение множественной регрессии. Цель построения такой модели – определить влияние каждого из независимых факторов, а также их совокупное воздействие, на зависимый показатель у.

Эконометрическая модель множественной регрессии имеет вид:

где = (x ₁ _t, x ₂ _t, ..., x_nt) - вектор значений объясняющих переменных, влияющих на объясняемую переменную у_t; = (a ₀, a ₁, ..., a_n) – вектор коэффициентов модели.

Задача построения регрессионной модели в случае множественной связи переменных формулируется аналогично случаю парной регрессии.

На первом шаге эконометрического исследования, как и в случае парной регрессии, рассматривают линейную модель, т.е. линейную функцию взаимосвязи зависимой переменной y с n независимыми переменными:

Каждый коэффициент a_i (кроме свободного члена a₀) уравнения множественной регрессии характеризует степень влияния на результирующий показатель y соответствующего этому коэффициенту фактора x_i.

Все включаемые в модель факторы должны объяснять изменения зависимой переменной у. При построении уравнения с n независимыми факторами для него рассчитывается коэффициент детерминации , характеризующий долю дисперсии зависимой переменной у, которая объясняется влиянием факторов х, включенных в уравнение регрессии, в общей дисперсии зависимой переменной у. При включении в уравнение нового, (n +1)-го фактора, значение коэффициента детерминации R ² должно возрастать. Если этого не происходит, то включаемый в модель фактор является лишним.

Факторы, включаемые в уравнение множественной регрессии, должны отвечать следующим требованиям: 1) они должны быть количественно измеримыми; 2) независимые факторы не должны коррелировать (быть взаимосвязанными) и не должны находиться в функциональной связи.

Для исключения из уравнения регрессии коррелированных объясняющих факторов строится матрица коэффициентов парной корреляции вида: ,

элементы которой можно вычислить по формулам:

; ;

; .

Если какой-либо элемент матрицы парной корреляции , то считается, что переменные и коллинеарны, т.е. находятся между собой в линейной зависимости. В такой ситуации из модели исключают тот из двух факторов, связь которого с фактором у меньше, чем у другого фактора.

Если более чем два фактора уравнения связаны между собой, то говорят о мультиколлинеарности факторов уравнения множественной регрессии. В этой ситуации оценить влияние каждого объясняющего фактора х на результирующую переменную у в отдельности практически невозможно. Кроме того, оценки коэффициентов уравнения с мультиколлинеарными переменными имеют большие стандартные ошибки, что делает уравнение непригодным для решения задач анализа и прогнозирования.

Для проверки факторов уравнения множественной регрессии на мультиколлинеарность рассчитывают определитель матрицы коэффициентов парной корреляции и по его величине судят о силе межфакторной корреляции. Чем ближе определитель матрицы коэффициентов парной корреляции к нулю, тем сильнее мультиколлинеарность факторов и ненадежнее результаты построения уравнения множественной регрессии.

Самым простым подходом к устранению мультиколлинеарности факторов является исключение из уравнения одного или нескольких мультиколлинеарных факторов.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: