Оценка мультиколлинеарности факторов

Факторы, включаемые в уравнение регрессии, не должны быть мультиколлинеарны (коррелированы) и тем более находиться в функциональной связи между собой. Для оценки мультиколлинеарности может использоваться определитель матрицы парных коэффициентов корреляции между факторами (матрица межфакторной корреляции).

Хуйня:

  r12 r1m
    r2m
   
rm  

Если факторы не коррелируют между собой, то данная матрица является единичной и её определитель равен единице. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.

Коэффициенты множественной детерминации

Через коэффициенты множественной детерминации можно найти переменные, ответственные за мультиколлинеарность факторов. Для этого в качыестве зависимой переменной поочередно рассматривается каждый из факторов. Чем ближе значения коэффициентов множественной детерминации к единице, тем сильнее проявляется мультиколлинеарность факторов. Сравнивая между собой коэффициенты множественной детерминации факторов.

Хуйня: R2x1|x2 x3…xm;

Можно выделять и исключать из модели факторы, ответственные за мультиколлинеарность. Исключение проводится, пока среди коэффициентов множественной детерминации остаются статистически значимые по F-критерию.

F1 = ((R12)/(1- R12))*((n-m)/(m-1))

n – число коэффициентов;

m – число факторов.

Способы преодоления мультиколлинеарности

Наличие мультиколлинеарности между факторами приводит к слабой обусловленности матрицы XTX (икс транспонировано на икс) (близости к нулю её определителя) и, как следствие, к высоким значениям стандартных ошибок параметров регрессии.

В методе «ридж-регрессии» («гребневая регрессия») к диагональным элементам матрицы добавляют некоторое небольшое положительное число λ, что устраняет слабую обусловленность матрицы XTX, приводит к смещенным, но, более точным оценкам параметров регрессии.

В методе главных компонент, используя собственные числа матрицы XTX, переходят кот исходных факторов к их линейным комбинациям – главным компонентам, не коррелированным друг с другом. Число главных компонент равно числу исходных факторов, однако, с помощью собственных чисел матрицы XTX можно выделить главноые компоненты, объясняющие большую часть дисперсии зависимой переменной и посттроить по ним уравнение регрессии.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: