Наиболее точный способ определения тесноты и характера корреляционной связи - нахождение коэффициента корреляции. Коэффициент корреляции есть число определяемое по формуле:
где rху— коэффициент корреляции;
xi—значения первого признака;
уi—значения второго признака;
—средняя арифметическая значений первого признака
средняя арифметическая значений второго признака
Для пользования формулой (32) построим таблицу, которая обеспечит необходимую последовательность в подготовке чисел для нахождения числителя и знаменателя коэффициента корреляции.
Как видно из формулы (32), последовательность действий такая: находим средние арифметические обоих признаков х и у, находим разность между значениями признака и его средней (хі- ) и уі- ), затем находим их произведение (хі- ) (уі- ) – суммa пocлeдних дает числитель коэффициента корреляции. Для нахождения его знаменателя следует разности (xi— )и (уі - ) возвести в квадрат, найти их суммы и извлечь корень квадратный из их произведения.
|
|
Так для примера 31 нахождение коэффициента корреляции в соответствии с формулой (32) можно представить следующим образом (табл. 50).
Полученное число коэффициента корреляции дает возможность установить наличие, тесноту и характер связи.
1. Если коэффициент корреляции равен нулю, связь между признаками отсутствует.
2. Если коэффициент корреляции равен единице, связь между признаками столь велика, что превращается в функциональную.
3. Абсолютная величина коэффициента корреляции не выходит за пределы интервала от нуля до единицы:
0<|rxy|<1.
Это дает возможность ориентироваться на тесноту связи: чем величина коэффициента ближе к нулю, тем связь слабее, а чем ближе к единице, тем связь теснее.
4. Знак коэффициента корреляции «плюс» означает прямую корреляцию, знак «минус»—обратную.
Таблица 50
хі | уі | (хі- ) | (уі- ) | (хі- )(уі- ) | (хі- )2 | (уі- )2 |
14,00 | 12,10 | —1,70 | —2,30 | +3,91 | 2,89 | 5,29 |
14,20 | 13,80 | —1,50 | —0,60 | +0,90 | 2,25 | 0,36 |
14,90 | 14,20 | —0,80 | —0,20 | +0,16 | 0,64 | 0,04 |
15,40 | 13,00 | —0,30 | —1,40 | +0,42 | 0,09 | 1,96 |
16,00 | 14,60 | +0,30 | +0,20 | +0,06 | 0,09 | 0,04 |
17,20 | 15,90 | +1,50 | +1,50 | +2,25 | 2,25 | 2,25 |
18,10 | 17,40 | +2,40 | +2,00 | +4,80 | 5,76 | 4,00 |
109,80 | 101,00 | 12,50 | 13,97 | 13,94 |
Таким образом, вычисленный в примере 31 коэффициент корреляции rxy = +0,9. позволяет сделать такие выводы: существует корреляционная связь между величиной мышечной силы правой и левой кистей у исследуемых школьников (коэффициент rxy =+0,9 отличен от нуля), связь очень тесная (коэффициент rxy =+0,9 близок к единице), корреляция прямая (коэффициент rxy = +0,9 положителен), т. е. с увеличением мышечной силы одной из кистей увеличивается сила другой кисти.
При вычислении коэффициента корреляции и пользовании его свойствами следует учесть, что выводы дают корректные результаты в том случае, когда признаки распределены нормально и когда рассматривается взаимосвязь между большим количеством значений обоих признаков.
|
|
В рассмотренном примере 31 анализированы только 7 значений обоих признаков, что, конечно, недостаточно для подобных исследований. Напоминаем здесь еще раз, что примеры, в данной книге вообще и в этой главе в частности, носят характер иллюстрации методов, а не подробного изложения каких-либо научных экспериментов. Вследствие этого рассмотрено небольшое число значений признаков, измерения округлены — все это делается для того, чтобы громоздкими вычислениями не затемнять идею метода.
Особое внимание следует обратить на существо рассматриваемой взаимосвязи. Коэффициент корреляции не может привести к верным результатам исследования, если анализ взаимосвязи между признаками проводится формально. Возвратимся еще раз к примеру 31. Оба рассмотренных признака представляли собой значения мышечной силы правой и левой кистей. Представим себе, что под признаком xi в примере 31 (14,0; 14,2; 14,9......18,1) мы понимает длину случайно пойманных рыб в сантиметрах, а под признаком уі (12,1; 13,8; 14,2......17,4) —вес приборов в лаборатории в килограммах. Формально воспользовавшись аппаратом вычислений для нахождения коэффициента корреляции и получив в этом случае также rxy =+0>9, мы должны были заключить, что между длиной рыб и весом приборов существует тесная связь прямого характера. Бессмысленность такого вывода очевидна.
Чтобы избежать формального подхода к пользованию коэффициентом корреляции, следует любым другим методом — математическим, логическим, экспериментальным, теоретическим — выявить возможность существования корреляционной связи между признаками, то есть обнаружить органическое единство признаков. Только после этого можно приступать к пользованию корреляционным анализом и устанавливать величину и характер взаимосвязи.
В математической статистике существует еще понятие множественной корреляции — взаимосвязи между тремя и более признаками. В этих случаях пользуются коэффициентом множественной корреляции, состоящим из парных коэффициентов корреляции, описанных выше.
Например, коэффициент корреляции трех признаков—хі, уі, zі — есть:
где Rxyz—коэффициент множественной корреляции, выражающий, как признак хi зависит от признаков уі и zi;
rxy —коэффициент корреляции между признаками xi и yi;
rxz—коэффициент корреляции между признаками Xi и Zi;
ryz — коэффициент корреляции между признаками yi, zi