Коэффициент корреляции Спирмена (rs) вычисляют по формуле:
где: N – объем выборки,
Rx - R y – разность между рангами по первому (x) и второму (y)
переменному каждого объекта
Последовательность шагов алгоритма вычислений:
1. Составляют ранжированный ряд по признаку «x», проводят преобразование баллов или чисел в ранги (Rx).
2. В исходной не ранжированной выборке объектов заменяют баллы или числа на ранги (Rx).
3. Составляют ранжированный ряд по признаку «y», проводят преобразование баллов или чисел в ранги (Ry).
4. В исходной не ранжированной выборке объектов заменяют баллы или числа на ранги (Ry).
5. Строят дополнительную таблицу, в которой имеются ранги по обоим переменным каждого объекта, далее вычисляют разности рангов по каждому объекту (Rx - Ry), эти разности возводят в квадрат и суммируют: Σ (Rx - Ry)2.
6. Вычисляют значение коэффициента корреляции Спирмена по выше указанной формуле.
Достоверность коэффициента корреляции Спирмена оценивают по величине критерия Стьюдента (t), используя следующую формулу:
|
|
Далее по таблице (приложение 2.3) определяют значение t 05 при числе степеней свободы df = N -2. Нулевая гипотеза состоит в том, что связь между переменными отсутствует.
Если t > tst, нулевая гипотеза отклоняется, то есть, связь между признаками достоверна. Если t < tst, нулевая гипотеза принимается, то есть, связь между признаками недостоверна.
Пример 2. У 12 сеянцев черешни были получены следующие данные о высоте двухлетнего сеянца «х»,см, и длине листовой пластинки «у», в мм:
Вариация 12 двухлетних сеянцев черешни по сочетанию признаков «высота сеянца» (х, см)и «длина листовой пластинки» (у, мм)
признак «х» | 172 | 175 | 163 | 165 | 161 | 174 | 159 | 154 | 163 | 172 | 164 | 172 |
признак «у» | 81 | 90 | 74 | 78 | 70 | 86 | 80 | 70 | 79 | 81 | 77 | 81 |
Необходимо определить есть ли корреляция между высотой сеянца и длиной листовой пластинки у черешни, а также оценить достоверность вычисленных коэффициентов ранговой корреляции, степень и направление связи.
Решение: 1. Ранжируем исходные данные по признаку «х», переводим значение признака в ранги, заменяем в исходном ряду значения признаков на ранги:
Преобразование признака «высота сеянца» (х)в ранги
Порядковый номер | Ранжированный ряд по признаку «х» | Ri | Исходный ряд по признаку «х» | Исходный ряд в рангах |
1 | 154 | 1 | 172 | 9 |
2 | 159 | 2 | 175 | 12 |
3 | 161 | 3 | 163 | 4,5 |
4 | 163 | 4,5 | 165 | 7 |
5 | 163 | 4,5 | 161 | 3 |
6 | 164 | 6 | 174 | 11 |
7 | 165 | 7 | 159 | 2 |
8 | 172 | 9 | 154 | 1 |
9 | 172 | 9 | 163 | 4,5 |
10 | 172 | 9 | 172 | 9 |
11 | 174 | 11 | 164 | 6 |
12 | 175 | 12 | 172 | 9 |
Σ=78 | Σ=78 | Σ=78 |
2. Ранжируем данные по признаку «у», переводим значение признака в ранги, заменяем в исходном ряду значение признака на ранги:
|
|
Преобразование признака «длина листовой пластинки» (y) в ранги
Порядковый номер | Ранжированный ряд по признаку «у» | Ранжиров. ряд в рангах | Исходный ряд по признаку «у» | Исходный ряд в рангах |
1 | 70 | 1,5 | 81 | 9 |
2 | 70 | 1,5 | 90 | 12 |
3 | 74 | 3 | 74 | 3 |
4 | 77 | 4 | 78 | 5 |
5 | 78 | 5 | 70 | 1,5 |
6 | 79 | 6 | 86 | 11 |
7 | 80 | 7 | 80 | 7 |
8 | 81 | 9 | 70 | 1,5 |
9 | 81 | 9 | 79 | 6 |
10 | 81 | 9 | 81 | 9 |
11 | 86 | 11 | 77 | 4 |
12 | 90 | 12 | 81 | 9 |
Σ=78 | Σ=78 | Σ=78 |
3. Представим исходную выборку из 12 сеянцев черешни в рангах по обеим признакам «x» и «y»:
Исходная выборка из 12 сеянцев черешни в рангах по признакам «x» и «y»
№ сеянца | Rх | Rу |
1 | 9 | 9 |
2 | 12 | 12 |
3 | 4,5 | 3 |
4 | 7 | 5 |
5 | 3 | 1,5 |
6 | 11 | 11 |
7 | 2 | 7 |
8 | 1 | 1,5 |
9 | 4,5 | 6 |
10 | 9 | 9 |
11 | 6 | 4 |
12 | 9 | 9 |
Σ=78 | Σ=78 | Σ=78 |
4. Вычислим коэффициент ранговой корреляции между признаками «х» и «у»:
Таблица 5.8. Вычисление разностей между рангами по признакам «x» и «y»
Rх | Rу | Rx-Ry | (Rx-Ry)2 |
9 | 9 | 0 | 0 |
12 | 12 | 0 | 0 |
4,5 | 3 | 1,5 | 2,25 |
7 | 5 | 2,0 | 4 |
3 | 1,5 | 1,5 | 2,25 |
11 | 11 | 0 | 0 |
2 | 7 | -5,0 | 25,00 |
1 | 1,5 | -0,5 | 0,25 |
4,5 | 6 | -1,5 | 2,25 |
9 | 9 | 0 | 0 |
6 | 4 | 2,0 | 4,00 |
9 | 9 | 0 | 0 |
| Σd2=40 |
5. Оценим достоверность коэффициента корреляции:
t05 (df=N-2)=10 = 2,23
t =2,60> t 05
6. Статистический вывод: нулевая гипотеза отклоняется, корреляция между признаками «высота сеянца» и «длина листовой пластинки» у черешни - достоверная, прямая и сильная.
Практическое задание 6.2. У 10 сеянцев персика были измерены масса плода «х» (г) и диаметр плода «у» (мм):
х | 91 | 86 | 94 | 95 | 104 | 92 | 98 | 84 | 96 | 99 |
у | 42 | 23 | 40 | 53 | 67 | 45 | 59 | 32 | 45 | 48 |
Вычислите коэффициент корреляции Спирмена и оцените его достоверность.
Решение: