double arrow

Сущность корреляционного анализа


Корреляционный анализ дает возможность точной количественной оценки степени согласованности изменений(варьирования) двух и более признаков. Степень согласованности изменений характеризует теснота связи — абсолютная величина коэффициента корреляции. В случае прямо пропорциональной зависимости одного признака от другого коэффициент корреляции равен единице. Последний может принимать значения от -1 до +1. Отрицательный коэффициент корреляции свидетельствует о разной направленности варьирования признаков: при увеличении одного другой уменьшается, или наоборот: приуменьшении одного другой увеличивается. Нулевая величина коэффициента корреляции говорит об отсутствии взаимосвязи между признаками.

Например, если мы измерим на репрезентативной выборке два параметра — рост человека и вес его тела есть, а затем подсчитаем корреляцию между этими параметрами, то, вероятно, она окажется положительной. Она не может быть равна единице. Иначе это означало бы, что измерять у человека и рост, и вес излишне. Достаточно измерить что-нибудь одно. Далее с помощью простой формулы или таблицы пересчета мы всегда можем точно определить второй параметр. Мало вероятно, чтобы между этими параметрами не было бы никакой связи, то есть коэффициент корреляции был бы равен нулю. Ведь чем длиннее тело, тем больше его размеры и, следовательно, вес. Или, наоборот, зная вес человека, мы хотя и очень приблизительно, но можем назвать его рост.




Предположим, мы затруднимся назвать рост человека, зная его вес. Предположим далее, что нам облегчат задачу, и предъявят два ряда чисел — вес в килограммах и рост в сантиметрах. Попросят поставить в соответствие нескольким разным весам разные длины тела. Вряд ли мы будем долго сомневаться и, скорее всего самому тяжелому человеку припишем самый большой рост, человеку более легкому и рост поменьше и так до самого маленького веса. Этим ранжированием мы продемонстрируем, что у нас есть интуитивные представления о том, что эти две величины изменяются в той или иной мере согласованно, что между ними есть некоторая связь.

Если есть два ряда значений, то можно не только строить предположения о наличии или отсутствии связи между ними, но и подсчитать коэффициент корреляции. Он и покажет нам, насколько согласованы изменения двух параметров, как тесно они связаны, положительной или отрицательной связью.

Коэффициент корреляции ничего не сообщает о причинных связях. Человек высокий не потому, что он тяжелый и, наоборот, тяжелый не потому что высокий. Некорректно говорить о влиянии роста на вес или веса на рост. Один параметр не является причиной другого. И тот и другой, их проявленность, их величина причинно обусловлены наследственностью, индивидуальными характеристиками обменных процессов в организме, питанием, числом и спецификой перенесенных болезней, факторами среды, особенностями образа жизни и т.д.







Сейчас читают про: