Проблема мультиколлинеарности в моделях множественной регрессии. Признаки и последствия мультиколлинеарности

Множественная регрессия позволяет построить и проверить модель линейной связи между зависимой (эндогенной) и несколькими независимыми (экзогенными) переменными: y = f(x1,...,xр), где у - зависимая переменная (результативный признак); х1,...,хр - независимые переменные (факторы).

Множественная линейная регрессионная модель имеет вид:

y=a+b1x1+b2x2+…+bpxp

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1. быть количественно измеримы. При включении качественного фактора нужно придать ему количественную определенность

2. не должны быть коррелированы между собой и тем более и годиться в точной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией, когда ryx1 < rx1x2 может повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии.

Поскольку одним из условий построения уравнения множественной регрессии является независимость действия факторов, коллинеарность факторов нарушает это условие. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: