Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.
Парные коэффициенты корреляции рассчитываются по формулам:
; .
Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого:
1) в главном меню последовательно выберите пункты Сервис / Анализ данных / Корреляция. Щелкните по кнопке ОК;
2) заполнит диалоговое окно ввода данных и параметров вывода (рисунок 1.3);
3) результаты вычислений – матрица коэффициентов парной корреляции – представлены на рисунке 1.4.
Рисунок 1.3 - Диалоговое окно ввода параметров инструмента Корреляция
Рисунок 1.4 – Матрица коэффициентов парной корреляции
Из матрицы можно заметить, что факторы и , и мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,75. Таким образом, можно сказать, что они дублируют друг друга.
При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: и .
Построим новое уравнение множественной регрессии с информативными факторами.