Коэффициент корреляции рангов (Спирмена) r (ро) – рассчитывается по формуле: ,
где 6 – постоянный коэффициент,
n – число коррелируемых пар,
d – разность рангов (между порядковыми номерами рядов),
Σ – знак суммы.
Условиями использования коэффициента ранговой корреляции являются:
1) небольшое число коррелируемых пар;
2) нет необходимости в точных результатах;
3) признаки имеют не только количественные, но и атрибутивные значения (описательные).
Методика вычисления коэффициента ранговой корреляции:
I этап – присвоение рангов (порядковых номеров) по каждому ряду числовых значений признака. При наличии нескольких одинаковых значений изучаемого признака, ранги присваиваются одни и те же и соответствуют они средней их порядковых номеров.
II этап – вычисление разности между рангами в каждой паре коррелируемых признаков.
III этап – рассчитывается квадрат разности рангов и определяется их сумма.
IV этап – рассчитывают коэффициент ранговой корреляции.
Пример: Измерение корреляции между смертностью от рака молочной железы и от рака шейки матки методом рангов (на 100000 женщин в 5 районах).
|
|
Таблица 2
Матрица расчета коэффициента ранговой корреляции Спирмена (ρ)
Районы | А | Б | В | Г | Д | n=5 | |
Рак молочной железы | 28,6 | 23,6 | 21,1 | 5,8 | 3,3 | ||
Рак шейки матки | 14,9 | 13,4 | 16,0 | 16,0 | 19,1 | ||
Ранги (порядковые номера) по размеру смертности | мол. жел. | ||||||
шейки матки | 2,5 | 2,5 | |||||
d – разность рангов | 0,5 | 1,5 | |||||
d2 | 0,25 | 2,25 | ∑d2=36,5 |
При присвоении рангов (в примере от большей смертности к меньшей) при одинаковых величинах явления в ряду, ранги берутся в среднем из суммы их очередных порядковых номеров. Так 19,1 – 1 ранг, 16,0 – 2-ой, следующий тоже 16,0 – 3-ий, так как значения одинаковые, берем: (2+3)/2=5/2=2,5 и каждому одинаковому уровню присваиваются одинаковые ранги равные среднему значению. В нашем примере – 2,5.
По выше приведенной формуле вычисляем коэффициент рангов: r=-0,8
Для определения достоверности коэффициента корреляции рангов вычисляется его ошибка по формуле:
mρ»±0,4
Достоверность коэффициента корреляции рангов определяется по формуле:
Доверительный коэффициент t должен быть равен или больше 3, что соответствует вероятности 99%, то есть корреляционная связь существенна, если t меньше 3-х – несущественна.
При числе наблюдений n<9 существенность полученного коэффициента рангов оценивается по таблице (В.Ю. Урбаха). (Приведена в сокращенном виде).
Таблица 3
Критические значения коэффициента корреляции рангов (ρ)
n | ||||||||||
за 95% против 5% (ρ≈0,05) | 0,94 | 0,85 | 0,78 | 0,72 | 0,66 | 0,64 | 0,61 | 0,58 | 0,56 | 0,54 |
за 99% против 1% (ρ<0,01) | – | – | 0,94 | 0,88 | 0,83 | 0,79 | 0,76 | 0,73 | 0,70 | 0,68 |
Если число наблюдений (n) равно 9 и более существенность полученного коэффициента можно оценивать по таблице t-критерия (Стьюдента) для числа степеней свободы n' = n – 2, t определяется по вышеприведенной или по следующей формуле:
|
|
;
Вывод. В рассматриваемом примере при n=5, t=2, ρ=-0,8 нельзя утверждать, что между смертностью от рака молочной железы и смертностью от рака шейки матки существует какая-то зависимость, так как ρ=-0,8 меньше критического уровня =0,94 при n=5 по таблице В.Ю. Урбаха и t=2 меньше 3-х.