Точную формулу ля подсчета коэффициента корреляции разработал ученик Френсиса Гальтона – Карл Пирсон. Коэффициент корреляции Пирсона характеризует наличие только линейной связи между признаками, обозначаемыми, как правило, символами X и Y. Формула расчета коэффициента корреляции построена таким образом, что, если связь между признаками имеет линейный характер, коэффициент Пирсона точно устанавливает тесноту этой связи. В случае с криволинейной корреляцией могут получиться отличные результаты, поэтому всегда необходима графическая интерпретация.
Ограничения применения коэффициента корреляции Пирсона
1) Сравниваемые переменные должны быть получены в интервальной шкале или шкале отношений.
2) Распределения переменных X и Y должны быть близки к нормальному.
3) Число варьирующих признаков в сравниваемых переменных X и Y должно быть одинаковым.
4) Таблицы уровней значимости для коэффициента корреляции Пирсона рассчитаны от n = 5 до n = 1000. Оценка уровня значимости по таблицам осуществляется при числе степеней свободы v = n – 2.
|
|
Формула для подсчета коэффициента корреляции такова:
, (Ф3)
где хi – значения, принимаемые переменной X;
yi – значения, принимаемые переменной Y.
Обобщённая "ось значимости".
Пример 2:
20 школьникам были даны тесты на определение преобладания наглядного или вербального мышления. Измерялось среднее время решения заданий теста в секундах. Психолога интересует вопрос: существует ли взаимосвязь между временем решения наглядно-образных задач и вербальных заданий? Переменная X обозначает среднее время решения наглядно-образных задач, а переменная Y – среднее время решения вербальных заданий тестов.
Решение
Представим исходные данные в виде таблицы 4.1, в которой введены дополнительные столбцы, необходимые для расчета коэффициента корреляции Пирсона.
Таблица 4.1.
№ испытуемых | Среднее время решения наглядно-образных заданий | Среднее время решения вербальных заданий | X ×Y | X ×X | Y ×Y |
X | Y | ||||
1 | 19 | 17 | 323 | 361 | 289 |
2 | 32 | 7 | 224 | 1024 | 49 |
3 | 33 | 17 | 561 | 1089 | 289 |
4 | 44 | 28 | 1232 | 1936 | 784 |
5 | 28 | 27 | 756 | 784 | 729 |
6 | 35 | 31 | 1085 | 1225 | 961 |
7 | 39 | 20 | 780 | 1521 | 400 |
8 | 39 | 17 | 663 | 1521 | 289 |
9 | 44 | 35 | 1540 | 1936 | 1225 |
10 | 44 | 43 | 1892 | 1936 | 1849 |
11 | 24 | 10 | 240 | 576 | 100 |
12 | 37 | 28 | 1036 | 1369 | 784 |
13 | 29 | 13 | 377 | 841 | 169 |
14 | 40 | 43 | 1720 | 1600 | 1849 |
15 | 42 | 45 | 1890 | 1764 | 2025 |
16 | 32 | 24 | 768 | 1024 | 576 |
17 | 48 | 45 | 2160 | 2304 | 2025 |
18 | 42 | 26 | 1092 | 1764 | 676 |
19 | 33 | 16 | 528 | 1089 | 256 |
20 | 47 | 26 | 1222 | 2209 | 676 |
Сумма | 731 | 518 | 20089 | 27873 | 16000 |
Гипотезы к задаче
Н0: Корреляция между временем решения наглядно-образных задач и вербальных заданий не отличается от нуля.
|
|
Н1: Корреляция между временем решения наглядно-образных задач и вербальных заданий статистически значимо отличается от нуля.
Рассчитываем эмпирическую величину коэффициента корреляции Пирсона по формуле (Ф3):
(Ф3)
При нахождении критических значений для вычисленного коэффициента линейной корреляции Пирсона число степеней свободы рассчитывается как v = n - 2. В нашем случае n = 20, поэтому n – 2 = 20 – 2 = 18. По таблице XVIII, Приложения1 находим:
«Ось значимости»
Ответ:
rxy эмп = 0,669. Ввиду того, что величина расчетного коэффициента корреляции попала в «зону значимости», гипотеза H0 отвергается и принимается гипотеза H1 (при a£0,01). Корреляция между временем решения наглядно-образных заданий и вербальных задач статистически значимо отличается от нуля. Полученная положительная зависимость говорит о том, что чем выше среднее время решения наглядно-образных задач, тем выше среднее время решения вербальных заданий, и наоборот.