Назначение и описание коэффициента корреляции Пирсона

Точную формулу ля подсчета коэффициента корреляции разработал ученик Френсиса Гальтона – Карл Пирсон. Коэффициент корреляции Пирсона характеризует наличие только линейной связи между признаками, обозначаемыми, как правило, символами X и Y. Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. В случае с криволинейной корреляцией могут получиться отличные результаты, поэтому всегда необходима графическая интерпретация.

Ограничения применения коэффициента корреляции Пирсона

1) Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.

2) Распределения переменных X и Y должны быть близки к нормальному.

3) Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.

4) Таблицы уровней значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам осуществляется при числе степеней свободы v = n – 2.

 

Формула для подсчета коэффициента корреляции такова:

,    (Ф3)

где   хi – значения, принимаемые переменной X;

  yi – значения, принимаемые переменной Y.

 

Обобщённая "ось значимости".

Пример 2:

20 школьникам были даны тесты на определение преобладания наглядного или вербального мышления. Измерялось среднее время решения заданий теста в секундах. Психолога интересует вопрос: существует ли взаимосвязь между временем решения наглядно-образных задач и вербальных заданий? Переменная X обозначает среднее время решения наглядно-образных задач, а переменная Y – среднее время решения вербальных заданий тестов.

Решение

Представим исходные данные в виде таблицы 4.1, в которой введены дополнительные столбцы, необходимые для расчета коэффициента корреляции Пирсона.

Таблица 4.1.

№ испытуемых

Среднее время решения наглядно-образных заданий Среднее время решения вербальных заданий

X ×Y

X ×X

Y ×Y

X Y
1 19 17 323 361 289
2 32 7 224 1024 49
3 33 17 561 1089 289
4 44 28 1232 1936 784
5 28 27 756 784 729
6 35 31 1085 1225 961
7 39 20 780 1521 400
8 39 17 663 1521 289
9 44 35 1540 1936 1225
10 44 43 1892 1936 1849
11 24 10 240 576 100
12 37 28 1036 1369 784
13 29 13 377 841 169
14 40 43 1720 1600 1849
15 42 45 1890 1764 2025
16 32 24 768 1024 576
17 48 45 2160 2304 2025
18 42 26 1092 1764 676
19 33 16 528 1089 256
20 47 26 1222 2209 676
Сумма 731 518 20089 27873 16000

 

Гипотезы к задаче

Н0: Корреляция между временем решения наглядно-образных задач и вербальных заданий не отличается от нуля.

Н1: Корреляция между временем решения наглядно-образных задач и вербальных заданий статистически значимо отличается от нуля.

Рассчитываем эмпирическую величину коэффициента корреляции Пирсона по формуле (Ф3):

(Ф3)

При нахождении критических значений для вычисленного коэффициента линейной корреляции Пирсона число степеней свободы рассчитывается как v = n - 2. В нашем случае n = 20, поэтому n – 2 = 20 – 2 = 18. По таблице XVIII, Приложения1 находим:

«Ось значимости»

Ответ:

rxy эмп = 0,669. Ввиду того, что величина расчетного коэффициента корреляции попала в «зону значимости», гипотеза H0 отвергается и принимается гипотеза H1 (при a£0,01). Корреляция между временем решения наглядно-образных заданий и вербальных задач статистически значимо отличается от нуля. Полученная положительная зависимость говорит о том, что чем выше среднее время решения наглядно-образных задач, тем выше среднее время решения вербальных заданий, и наоборот.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: