Факторы, включаемые в уравнение регрессии, не должны быть мультиколлинеарны (коррелированы) и тем более находиться в функциональной связи между собой. Для оценки мультиколлинеарности может использоваться определитель матрицы парных коэффициентов корреляции между факторами (матрица межфакторной корреляции).
Хуйня:
r12 | … | r1m | |
… | r2m | ||
… | … | ||
rm | … | … |
Если факторы не коррелируют между собой, то данная матрица является единичной и её определитель равен единице. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.
Коэффициенты множественной детерминации
Через коэффициенты множественной детерминации можно найти переменные, ответственные за мультиколлинеарность факторов. Для этого в качыестве зависимой переменной поочередно рассматривается каждый из факторов. Чем ближе значения коэффициентов множественной детерминации к единице, тем сильнее проявляется мультиколлинеарность факторов. Сравнивая между собой коэффициенты множественной детерминации факторов.
|
|
Хуйня: R2x1|x2 x3…xm;
Можно выделять и исключать из модели факторы, ответственные за мультиколлинеарность. Исключение проводится, пока среди коэффициентов множественной детерминации остаются статистически значимые по F-критерию.
F1 = ((R12)/(1- R12))*((n-m)/(m-1))
n – число коэффициентов;
m – число факторов.
Способы преодоления мультиколлинеарности
Наличие мультиколлинеарности между факторами приводит к слабой обусловленности матрицы XTX (икс транспонировано на икс) (близости к нулю её определителя) и, как следствие, к высоким значениям стандартных ошибок параметров регрессии.
В методе «ридж-регрессии» («гребневая регрессия») к диагональным элементам матрицы добавляют некоторое небольшое положительное число λ, что устраняет слабую обусловленность матрицы XTX, приводит к смещенным, но, более точным оценкам параметров регрессии.
В методе главных компонент, используя собственные числа матрицы XTX, переходят кот исходных факторов к их линейным комбинациям – главным компонентам, не коррелированным друг с другом. Число главных компонент равно числу исходных факторов, однако, с помощью собственных чисел матрицы XTX можно выделить главноые компоненты, объясняющие большую часть дисперсии зависимой переменной и посттроить по ним уравнение регрессии.