Наиболее популярный критерий (Пирсона-Бравэ). Он вычисляется по формуле:
rxy=
Величина в числителе – ковариация. Недостаток понятия ковариации в том, что он зависит от масштаба признаков, единиц их измерения. Для устранения этого недостатка в формуле для корреляции, отклонения нормируются на свои среднеквадратичные отклонения (стандартные отклонения).
Коэффициент линейной корреляции может принимать значения в пределах [-1≤rху≤1]. Чем сильнее связь между признаками, тем ближе значение коэффициента корреляции к «+1», либо к «-1». При полной независимости признаков rxy=0.
В практике наиболее часто применяют следующие модификации формул:
rxy=
или
rxy=
Число степеней свободы df=n-2, где n – объем выборки.
Коэффициент корреляции, вычисленный на выборке, как и любой другой выборочный показатель, служит оценкой своего генерального параметра, который обозначается как ρ.
Выборочное оценивание коэффициента корреляции сопровождается ошибкой репрезентативности (Sr).
,
Где, r- коэффициент корреляции, n – объем выборки.
|
|
При увеличении объема выборки n→∞, статистическая ошибка Sr→0
При вычислении коэффициента корреляции Пирсона важно соблюдать следующие условия:
1. Нормальность распределения переменных в выборке;
2. Связь между переменными должна быть линейной;
3. Для получения представительной оценки генерального параметра ρ необходимо чтобы объем выборки n>30;
4. Данные должны быть представлены в количественной шкале