Коэффициент линейной корреляции Пирсона

Наиболее популярный критерий (Пирсона-Бравэ). Он вычисляется по формуле:

rxy=

Величина в числителе – ковариация. Недостаток понятия ковариации в том, что он зависит от масштаба признаков, единиц их измерения. Для устранения этого недостатка в формуле для корреляции, отклонения нормируются на свои среднеквадратичные отклонения (стандартные отклонения).

Коэффициент линейной корреляции может принимать значения в пределах [-1≤rху≤1]. Чем сильнее связь между признаками, тем ближе значение коэффициента корреляции к «+1», либо к «-1». При полной независимости признаков rxy=0.

В практике наиболее часто применяют следующие модификации формул:

rxy=

или

rxy=

Число степеней свободы df=n-2, где n – объем выборки.

Коэффициент корреляции, вычисленный на выборке, как и любой другой выборочный показатель, служит оценкой своего генерального параметра, который обозначается как ρ.

Выборочное оценивание коэффициента корреляции сопровождается ошибкой репрезентативности (Sr).

,

Где, r- коэффициент корреляции, n – объем выборки.

При увеличении объема выборки n→∞, статистическая ошибка Sr→0

При вычислении коэффициента корреляции Пирсона важно соблюдать следующие условия:

1. Нормальность распределения переменных в выборке;

2. Связь между переменными должна быть линейной;

3. Для получения представительной оценки генерального параметра ρ необходимо чтобы объем выборки n>30;

4. Данные должны быть представлены в количественной шкале


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: