Коэффициент корреляции

Наиболее точный способ определения тесноты и характера корреляционной связи - нахождение коэффициента корреляции. Коэффициент корреляции есть число определяемое по формуле:

где rху— коэффициент корреляции;

xi—значения первого признака;

уi—значения второго признака;

—средняя арифметическая значений первого признака

средняя арифметическая значений второго признака

Для пользования формулой (32) построим таблицу, которая обеспечит необходимую последовательность в подготовке чисел для нахождения числителя и знаменателя коэффициента корреляции.

Как видно из формулы (32), последовательность действий такая: находим средние арифметические обоих признаков х и у, находим разность между значениями признака и его средней (хі- ) и уі- ), затем находим их произведение (хі- ) (уі- ) – суммa пocлeдних дает числитель коэффициента корреляции. Для нахождения его знаменателя следует разности (xi)и (уі - ) возвести в квадрат, найти их суммы и извлечь корень квадратный из их произведения.

Так для примера 31 нахождение коэффициента корреляции в соответствии с формулой (32) можно представить следующим образом (табл. 50).

Полученное число коэффициента корреляции дает возможность установить наличие, тесноту и характер связи.

1. Если коэффициент корреляции равен нулю, связь между признаками отсутствует.

2. Если коэффициент корреляции равен единице, связь между признаками столь велика, что превращается в функциональную.

3. Абсолютная величина коэффициента корреляции не выходит за пределы интервала от нуля до единицы:

0<|rxy|<1.

Это дает возможность ориентироваться на тесноту связи: чем величина коэффициента ближе к нулю, тем связь слабее, а чем ближе к единице, тем связь теснее.

4. Знак коэффициента корреляции «плюс» означает прямую корреляцию, знак «минус»—обратную.

Таблица 50

хі уі і- ) і- ) і- )(уі- ) і- )2 і- )2
14,00 12,10 —1,70 —2,30 +3,91 2,89 5,29
14,20 13,80 —1,50 —0,60 +0,90 2,25 0,36
14,90 14,20 —0,80 —0,20 +0,16 0,64 0,04
15,40 13,00 —0,30 —1,40 +0,42 0,09 1,96
16,00 14,60 +0,30 +0,20 +0,06 0,09 0,04
17,20 15,90 +1,50 +1,50 +2,25 2,25 2,25
18,10 17,40 +2,40 +2,00 +4,80 5,76 4,00
109,80 101,00     12,50 13,97 13,94

Таким образом, вычисленный в примере 31 коэффициент корреляции rxy = +0,9. позволяет сделать такие выводы: существует корреляционная связь между величиной мышечной силы правой и левой кистей у исследуемых школьников (коэффициент rxy =+0,9 отличен от нуля), связь очень тесная (коэффициент rxy =+0,9 близок к единице), корреляция прямая (коэффициент rxy = +0,9 положителен), т. е. с увеличением мышечной силы одной из кистей увеличивается сила другой кисти.

При вычислении коэффициента корреляции и пользовании его свойствами следует учесть, что выводы дают корректные результаты в том случае, когда признаки распределены нормально и когда рассматривается взаимосвязь между большим количеством значений обоих признаков.

В рассмотренном примере 31 анализированы только 7 значений обоих признаков, что, конечно, недостаточно для подобных исследований. Напоминаем здесь еще раз, что примеры, в данной книге вообще и в этой главе в частности, носят характер иллюстрации методов, а не подробного изложения каких-либо научных экспериментов. Вследствие этого рассмотрено небольшое число значений признаков, измерения округлены — все это делается для того, чтобы громоздкими вычислениями не затемнять идею метода.

Особое внимание следует обратить на существо рассматриваемой взаимосвязи. Коэффициент корреляции не может привести к верным результатам исследования, если анализ взаимосвязи между признаками проводится формально. Возвратимся еще раз к примеру 31. Оба рассмотренных признака представляли собой значения мышечной силы правой и левой кистей. Представим себе, что под признаком xi в примере 31 (14,0; 14,2; 14,9......18,1) мы понимает длину случайно пойманных рыб в сантиметрах, а под признаком уі (12,1; 13,8; 14,2......17,4) —вес приборов в лаборатории в килограммах. Формально воспользовавшись аппаратом вычислений для нахождения коэффициента корреляции и получив в этом случае также rxy =+0>9, мы должны были заключить, что между длиной рыб и весом приборов существует тесная связь прямого характера. Бессмысленность такого вывода очевидна.

Чтобы избежать формального подхода к пользованию коэффициентом корреляции, следует любым другим методом — математическим, логическим, экспериментальным, теоретическим — выявить возможность существования корреляционной связи между признаками, то есть обнаружить органическое единство признаков. Только после этого можно приступать к пользованию корреляционным анализом и устанавливать величину и характер взаимосвязи.

В математической статистике существует еще понятие множественной корреляции — взаимосвязи между тремя и более признаками. В этих случаях пользуются коэффициентом множественной корреляции, состоящим из парных коэффициентов корреляции, описанных выше.

Например, коэффициент корреляции трех признаков—хі, уі, zі — есть:

где Rxyz—коэффициент множественной корреляции, выражающий, как признак хi зависит от признаков уі и zi;

rxy —коэффициент корреляции между признаками xi и yi;

rxz—коэффициент корреляции между признаками Xi и Zi;

ryz коэффициент корреляции между признаками yi, zi



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: