В реальности мы имеем дело с данными, имеющими стохастический характер, поэтому случай полной мультиколлинеарности на практике встречается крайне редко. На практике мы имеем дело с частичной мультиколлинеарностью.
Частичная мультиколлинеарность характеризуется коэффициентами парной корреляции между регрессорами, которые так же носят стохастический характер и, по значениям которых судят о степени коррелированности.
Для определения степени коррелированности строят матрицу взаимных корреляций регрессоров R={rij}, I,j=1,2,…,k.
Если между регрессорами имеется корреляционная связь, соответствующий коэффициент корреляции будет близок к единице rij ≈1
Матрица (XTX)-1 будет иметь полный ранг, но близка к вырожденной, т.е det(XTX)-1 ≈0
В этом случае, формально можно получить оценки параметров модели, их точностные показатели, но все они будут неустойчивыми.
Последствия частичной мультиколлинеарности следующие:
· Увеличение дисперсий оценок параметров (снижение точности)
· Уменьшение значений t-статистик для параметров, что приводит к неправильному выводу о их статистической значимости
|
|
· Неустойчивость оценок МНК-параметров и их дисперсий
· Возможность получения неверного (с точки зрения теории) знака у оценки параметра
Точные количественные критерии для обнаружения частичной мультиколлинеарности отсутствуют
В качестве признаков ее наличия используют следующие:
· Модуль парного коэффициента корреляции между регрессорами Хi и Xj больше 0.75
· Близость к нулю определителя матрицы (XTX)-1
· Большое количество статистически незначимых параметров в модели