Определение мультиколлинеарности

Способ

Для выявления мультиколлинеарности используют матрицу парных коэффициентов.

Пример:

  y x1 x2 x3
y        
x1 0,8      
x2 0,7 0,8    
x3 0,6 0,5 0,2  

Т.к. , то существует линейная зависимость между x1 и x2, т.е. x1 и x2 одновременно в модели присутствовать не могут. Предпочтение отдается не фактору, тесно связанному с результативным признаком, а фактору, который при достаточно тесной связи с результативным признаком имеет наименьшую тесноту связи с другими факторами.

Способ

Для выявления мультиколлинеарности используют определитель матрицы парных коэффициентов.

Необходимо дозаполнить матрицу парных коэффициентов.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции была бы единичной матрицей. Определитель единичной матрицы равен единице. Следовательно, чем ближе определитель матрицы парных коэффициентов корреляции к единице, тем меньше коррелируют факторы; чем ближе определитель матрицы парных коэффициентов корреляции к нулю, тем сильнее мультиколлинерность и ненадежнее результаты множественной регрессии.

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции.

Для линейной зависимости:

Для нелинейной зависимости:

;

Качество построенной модели в целом оценивает коэффициент детерминации: коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции.

Скорректированный индекс множественной корреляции на число степеней свободы:

, n – число наблюдений, m – число факторов

Значимость уравнения множественной регрессии в целом оценивается с помощью f критерия Фишера.

Рассчитанное значение сравнивают с табличным . Если , то уравнение значимо.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: