Множественный корреляционный анализ

 

Как правило, экономический процесс описывается числом показателей, более двух, т.е. вектором случайных величин:

 

X=(X1, X2…, X j,…, Xn)

 

где j - номер показателя (фактора)

 

2.4.1. Корреляционная матрица

 

Пусть совокупность {X j } имеет совместный нормальный закон распределения. Тогда, как и ранее, взаимосвязь между двумя показателями X i и X j можно описать коэффициентом парной линейной корреляции rij. Множество всех возможных сочетаний{ rij }, i,j =  образует квадратную корреляционную матрицу:

                                    (2.11)

 

Отметим важные свойства корреляционной матрицы

 

1). Все диагональные элементы этой матрицы равны единице:

 

daig K = rji = 1, i=j.

 

2). Корреляционная матрица – симметричная, т.е. ее элементы, симметричные относительно главной диагонали, равны друг другу:

rij = r ji,

так как произведение в формуле (2.4) для rij не зависит от порядка следования сомножителей.

 

2.4.2. Выборочный линейный коэффициент множественной корреляции

Линейный коэффициент множественной корреляции (или совокупный коэффициент корреляции) определяет тесноту связи одного показателя с совокупностью остальных (n-1) показателей при их одновременном действии:.

 

                                             (2.12)

K jj – алгебраическое дополнение элемента rjj матрицы К.

Коэффициент множественной корреляции изменяется от 0 до +1, т.е. всегда неотрицателен. Заметим, что совокупный коэффициент корреляции может быть определен без построения регрессионной модели с использование лишь парных линейных коэффициентов корреляции.

 

2.4.3. Частный коэффициент корреляции

 

Частный коэффициент корреляции служит количественной мерой связи случайных величин Xi и Xj при условии исключения влияния других случайных (m-2) величин, т.е. при их фиксации.

Выборочная оценка коэффициента частной корреляции определяется по формуле:

                                                                                               (2.13)

где K ij, K jj – алгебраическое дополнение соответствующих элементов матрицы К.

Частный коэффициент корреляции так же, как и парный коэффициент линейной парной корреляции, изменяется от -1 до + 1, т.е. может быть отрицательным.

Гипотеза о значимости частного коэффициента корреляции проверяется так же, как и для парного коэффициента корреляции:

 

H0: tr < tтаб(a; N-2)?

2.4.4. Коэффициент детерминации

 

Коэффициент детерминации равен квадрату множественного коэффициента корреляции и применительно к корреляционному анализу показывает: какую долю общей дисперсии исследуемого показателя Xj объясняет (формирует) вариация всех остальных (n-1) показателей X1,X2,…,Xn при их совместном действии:

 

                                                                                                   (2.14)

                                                                                                         

2.4.5. Оценка значимости множественного коэффициента детерминации

 

Используется F – статистика Фишера для R2:

 

                                                                                          (2.15)

 

где, n – число компонент вектора ; N – число опытов.

Проверяется нуль гипотеза:

H0: F = 0;

если  то коэффициент множественной корреляции незначим (гипотеза Н0 принимается);

если  то R2 значим (гипотеза Н0 отвергается);

n1– число степеней свободы для числителя; n2 – число степеней свободы для знаменателя (n1=n-1; n2=N-n) дроби (2.15).

 

2.4.6. Индекс корреляции при нелинейной связи двух случайных величин

 

Слово «индекс» здесь понимается в смысле «отношения» [1]. Поэтому употребляется и другой термин для этой числовой меры: «корреляционное отношение».

Пусть две случайные величины X и Y связаны в среднем нелинейным функциональным уравнением вида:

                                                                                                                   (2.16)

Пример:

                                                                  

 

Функция f (x) должна быть априори известна.

                                   (2.16)

 

Тогда выборочная оценка индекса корреляции равна:

 

                                              (2.17)

 

Практическая формула для индекса корреляции [  ]:

 

                                       (2.18)

 

Здесь:

 – дисперсия остатков уравнения регрессии;

 – общая дисперсия как мера разброса наблюдений вокруг среднего.

Заметим, что при подстановке  и  под корень в уравнении (2.18) и условии (N-n)»(N-1) при больших N степени свободы  и их можно сократить, откуда следует упрощенная приближенная расчетная формула:

 

                                                                     (2.20)

 

Эта формула допускает наглядное толкование: чем сильнее стохастическая связь в уравнении (2.16), тем меньше доля дисперсии   по отношению к общей дисперсии  и больше индекс корреляции .

 

2.4.7. Индекс множественной корреляции

 

Пусть построено нелинейное по независимым переменным уравнение множественной регрессии:

 

                                                                                            (2.20)

Тогда использую простую формулу (2.20), можно получить индекс множественной корреляции

                                                             (2.21)

 

Соответственно квадрат этого индекса даст множественный индекс детерминации в нелинейном случае.

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: