Сущность и признаки мультиколлинеарности, ее последствия

Наибольшие затруднения в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторных переменных, когда более чем два фактора связаны между собой линейной зависимостью.

Мультиколлинеарностью для линейной множественной регрессии называется наличие линейной зависимости между факторными переменными, включёнными в модель.

Мультиколлинеарность – нарушение одного из основных условий, лежащих в основе построения линейной модели множественной регрессии.

Виды мультиколлинеарности

1. Строгая (perfect) мультиколлинеарность – наличие линейной функциональной связи между независимыми переменными (иногда также и зависимой).

2. Нестрогая (imperfect) мультиколлинеарность – наличие сильной линейной корреляционной связи между независимыми переменными (иногда также и зависимой).

Основные причины возникновения

1. ошибочное включение в уравнение 2х или более линейно зависимых переменных

2. две или более объясняющие переменные, в нормальной ситуации слабо коррелированные, становятся в конкретных условиях выборки сильно коррелированными.

3. в модель включается переменная, сильно коррелирующая с зависимой переменной.

Последствия мультиколлинеарности

1. Оценки коэффициентов остаются несмещенными. В результате оценки могут перейти через нуль и оказаться по другую сторону от нуля. Если это происходит, возникает неправильный знак коэффициента.

2. Стандартные ошибки коэффициентов увеличиваются

3. Вычисленные t-статистики занижены.

4. Оценки становится очень чувствительными к изменению спецификации и изменению отдельных наблюдений.

5. Общее качество уравнения, а также оценки переменных, не связанных мультиколлинеарностью, остаются незатронутыми.

6. Чем ближе мультиколлинеарность к совершенной (строгой), тем серьезнее ее последствия.

Наиболее характерные признаки мультиколлинеарности:

ü Небольшое изменение исходных данных (например, добавление новых наблюдений) приводит к существенному изменению коэффициентов модели.

ü Оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой и обладает хорошей объясняющей способностью (хорошие значения F-статистики и R2).

ü Оценки коэффициентов имеют неправильные с точки зрения теории (и логики) знаки или неоправданно большие значения. Коэффициенты, которые по логике должны быть значимы, оказываются незначимыми.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: