Сила связи | Величина коэффициента при наличии | |
прямой корреляции | обратной корреляции | |
Малая (низкая, слабая) Средняя Большая (высокая, сильная) | от 0 до +0,3 от 0,3 до +0,7 от 0,7 до +1,0 | от 0 до –0,3 от –0,3 до –0,7 от –0,7 до –1,0 |
Таким образом, корреляционные коэффициенты своей величиной и знаком показывают степень или силу связи и ее направление.
Необходимо помнить о том, что вычисление коэффициентов корреляции целесообразно лишь в том случае, если специалисты, изучающие сущность какой-либо проблемы предполагают наличие связи между явлениями. А сама по себе статистика не решает вопрос о том, возможна ли связь между явлениями или нет.
МЕТОДИКА ВЫЧИСЛЕНИЯ КОЭФФИЦИЕНТА
ЛИНЕЙНОЙ КОРРЕЛЯЦИИ
Для его вычисления следует пользоваться алгоритмом, приведенным в табл. 4 и правилами, перечисленными ниже.
Таблица 4
Алгоритмы расчета коэффициента линейной корреляции (rху), его ошибки (mr) и коэффициента достоверности (tr)
|
|
Vx | Vу | dx (X-Mx) | dү (Y-My) | dx×dү | dх2 | dу² | Формулы |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Σ V x | Σ V y | ||||||
Σdx×dү | Σdx2 | Σdy2 |
1. Записать исходные данные в виде двух вариационных рядов (графы 1 и 2)
2. Найти суммы вариант в каждом вариационном ряду (åх и åу) и определить средние арифметические величины (Мх и Му) – графы 1 и 2.
3. Найти dx и dу – отклонения каждой варианты от средних величин (графы 3 и 4).
4. Полученные отклонения перемножить попарно (dх × dу) и найти сумму полученных произведений (ådх × dу) – графа 5.
5. Каждое отклонение в обоих рядах возвести в квадрат и определить сумму квадратов отклонений ряда Vх (графа 6) и ряда Vу (графа 7).
6. Определить произведение åd²х × åd²у и из произведения извлечь квадратный корень åd²х × åd²у
7. Подставить полученные данные в формулу и рассчитать коэффициент корреляции (Rху) – графа 8.
8. Подставить необходимые данные в формулу и рассчитать среднюю ошибку (mr) коэффициента корреляции – графа 8.
9. Подставить необходимые данные в формулу и рассчитать коэффициент достоверности (tr) – графа 8.
При наличии вычислительной техники расчет коэффициента линейной корреляции производится по следующей схеме (табл.5.)
Таблица 5
Алгоритм расчета (на ЭВМ) коэффициента корреляции (Rху)
Vx | Vy | Vx ∙ Vy | Vx2 | Vy2 | Формула |
åVx | åVy | åVx×Vy | åVx2 | åVy2 |
Для примера вычислим коэффициент корреляции между температурой тела и частотой пульса в минуту у 5 больных (табл. 6). Для этого воспользуемся алгоритмами, приведенными в табл. 4 и 5.
|
|
Таблица 6
Пример определения rху между температурой
тела и частотой пульса в минуту
Температура тела(˚C), х | Частота пульса (удары в минуту), y | dx (X-Mx) | dү (Y-My) | dx×dү | dх2 | dу² |
36 | 60 | -2 | -20 | 40 | 4 | 400 |
36 | 70 | -2 | -10 | 20 | 4 | 100 |
38 | 80 | 0 | 0 | 0 | 0 | 0 |
40 | 90 | +2 | +10 | 20 | 4 | 100 |
40 | 100 | +2 | +20 | 40 | 4 | 400 |
∑x =190 | ∑y =400 |
Подставим полученные данные в формулу и рассчитаем коэффициент корреляции:
Рассчитаем среднюю ошибку (mr) коэффициента достоверности:
Рассчитаем коэффициент достоверности tr:
Оценим критерий tr по специальным таблицам (табл. 7 и 8), в которой слева показано число наблюдений (n), а сверху – степень вероятности безошибочного прогноза (р).
Таблица 7
Значение критерия tr для трех степеней вероятности
(по Н.А. Плохинскому)
p n | 95% | 99% | 99,9% | p n | 95% | 99% | 99,9% |
1 | 12,7 | 63,7 | 37,0 | 10 | 2,2 | 3,2 | 4,6 |
2 | 4,3 | 9,9 | 31,6 | 11 | 2,2 | 3,1 | 4,4 |
3 | 3,2 | 5,8 | 12,9 | 12 | 2,2 | 3,1 | 4,3 |
4 | 2,8 | 4,6 | 8,6 | 13 | 2,2 | 3,0 | 4,1 |
5 | 2,6 | 4,0 | 6,9 | 14-15 | 2,1 | 3,0 | 4,1 |
6 | 2,4 | 3,7 | 6,0 | 16-17 | 2,1 | 2,9 | 4,0 |
7 | 2,4 | 3,5 | 5,3 | 18-20 | 2,1 | 2,9 | 3,9 |
8 | 2,3 | 3,4 | 5,0 | 21-24 | 2,1 | 2,8 | 3,8 |
9 | 2,3 | 3,3 | 4,8 | 25-29 | 2,0 | 2,8 | 3,7 |
Таблица 8
Стандартные коэффициенты корреляции, которые считаются достоверными (по Л.С. Каменскому)
Число степеней свободы, n′ (n – 2) | Уровень вероятности Р (в %) | Число степеней свободы, n′ (n – 2) | Уровень вероятности Р (в %) | ||||
95,0 | 98,0 | 99,0 | 95,0 | 98,0 | 99,0 | ||
1 | 0,997 | 0,999 | 0,999 | 12 | 0,532 | 0,612 | 0,661 |
2 | 0,950 | 0,980 | 0,990 | 13 | 0,514 | 0,592 | 0,641 |
3 | 0,878 | 0,934 | 0,959 | 14 | 0,497 | 0,574 | 0,623 |
4 | 0,811 | 0,882 | 0,917 | 15 | 0,482 | 0,558 | 0,606 |
5 | 0,754 | 0,833 | 0,874 | 16 | 0,468 | 0,542 | 0,590 |
6 | 0,707 | 0,789 | 0,834 | 17 | 0,456 | 0,528 | 0,575 |
7 | 0,666 | 0,750 | 0,798 | 18 | 0,444 | 0,516 | 0,561 |
8 | 0,632 | 0,716 | 0,765 | 19 | 0,433 | 0,503 | 0,549 |
9 | 0,602 | 0,685 | 0,735 | 20 | 0,423 | 0,492 | 0,537 |
10 | 0,576 | 0,658 | 0,708 | 25 | 0,381 | 0,445 | 0,487 |
11 | 0,553 | 0,634 | 0,684 | 30 | 0,349 | 0,409 | 0,449 |
Вывод. Коэффициент корреляции, равный 0,949, достоверен с вероятностью безошибочного прогноза р >95%, так как при n =3 (5 – 2) полученный нами критерий t будет больше tтабл. =3,2 (р =95%) и меньше tтабл. =5,8 (р =99%). Материалы выборочного исследования позволяют утверждать, что в генеральной совокупности существует сильная прямая связь между температурой тела и частотой пульса.
Оценка достоверности коэффициента корреляции может осуществляется по специальной таблице (при малых выборках) без предварительных расчетов m и t. Необходимо лишь сравнить rху со стандартным коэффициентом корреляции, рассчитанным и представленным в таблице для различной степени вероятности и различного числа наблюдений (см. табл. 8).
По данным оценки достоверности полученного коэффициента корреляции с помощью приведенной выше таблицы можно говорить о том, что коэффициент, равный 0,949, достоверен с вероятностью безошибочного прогноза р >98%, так как при n =3, он больше 0,934 и меньше 0,959.
При наличии вычислительной техники расчет коэффициента корреляции производится по следующей схеме (табл. 9)
Таблица 9
Пример определения rху
(с помощью вычислительной техники)
между температурой тела и частотой пульса в минуту
№ п/п | Vx | Vy | Vx×Vy | Vx2 | Vy2 | Расчет по формуле |
1 | 36 | 60 | 2160 | 1296 | 3600 | |
2 | 36 | 70 | 2520 | 1296 | 4900 | |
3 | 38 | 80 | 3040 | 1444 | 6400 | |
4 | 40 | 90 | 3600 | 1600 | 8100 | |
5 | 40 | 100 | 4000 | 1600 | 10000 | |
190 | 400 | 15320 | 7236 | 33000 |
Вывод. Между температурой тела и частотой пульса имеется прямая и сильная связь.