Коэффициенты корреляции

Коэффициент корреляции рангов (Спирмена) r (ро) – рассчитывается по формуле: ,

где 6 – постоянный коэффициент,

n – число коррелируемых пар,

d – разность рангов (между порядковыми номерами рядов),

Σ – знак суммы.

Условиями использования коэффициента ранговой корреляции являются:

1) небольшое число коррелируемых пар;

2) нет необходимости в точных результатах;

3) признаки имеют не только количественные, но и атрибутивные значения (описательные).

Методика вычисления коэффициента ранговой корреляции:

I этап – присвоение рангов (порядковых номеров) по каждому ряду числовых значений признака. При наличии нескольких одинаковых значений изучаемого признака, ранги присваиваются одни и те же и соответствуют они средней их порядковых номеров.

II этап – вычисление разности между рангами в каждой паре коррелируемых признаков.

III этап – рассчитывается квадрат разности рангов и определяется их сумма.

IV этап – рассчитывают коэффициент ранговой корреляции.

Пример: Измерение корреляции между смертностью от рака молочной железы и от рака шейки матки методом рангов (на 100000 женщин в 5 районах).

Таблица 2

Матрица расчета коэффициента ранговой корреляции Спирмена (ρ)

Районы А Б В Г Д n=5
Рак молочной железы 28,6 23,6 21,1 5,8 3,3  
Рак шейки матки 14,9 13,4 16,0 16,0 19,1  
Ранги (поряд­ковые номера) по размеру смертности мол. жел.            
шейки матки     2,5 2,5    
d – разность рангов     0,5 1,5    
d2     0,25 2,25   ∑d2=36,5

При присвоении рангов (в примере от большей смертности к меньшей) при одинаковых величинах явления в ряду, ранги берутся в среднем из суммы их очередных порядковых номеров. Так 19,1 – 1 ранг, 16,0 – 2-ой, следующий тоже 16,0 – 3-ий, так как значения одинаковые, берем: (2+3)/2=5/2=2,5 и каждому одинаковому уровню присваиваются одинаковые ранги равные среднему значению. В нашем примере – 2,5.

По выше приведенной формуле вычисляем коэффициент рангов: r=-0,8

Для определения достоверности коэффициента корреляции рангов вычисляется его ошибка по формуле:

mρ»±0,4

Достоверность коэффициента корреляции рангов определяется по формуле:

Доверительный коэффициент t должен быть равен или больше 3, что соответствует вероятности 99%, то есть корреляционная связь существенна, если t меньше 3-х – несущественна.

При числе наблюдений n<9 существенность полученного коэффициента рангов оценивается по таблице (В.Ю. Урбаха). (Приведена в сокращенном виде).

Таблица 3

Критические значения коэффициента корреляции рангов (ρ)

n                    
за 95% против 5% (ρ≈0,05) 0,94 0,85 0,78 0,72 0,66 0,64 0,61 0,58 0,56 0,54
за 99% против 1% (ρ<0,01) 0,94 0,88 0,83 0,79 0,76 0,73 0,70 0,68

Если число наблюдений (n) равно 9 и более существенность полученного коэффициента можно оценивать по таблице t-критерия (Стьюдента) для числа степеней свободы n' = n – 2, t определяется по вышеприведенной или по следующей формуле:

;

Вывод. В рассматриваемом примере при n=5, t=2, ρ=-0,8 нельзя утверждать, что между смертностью от рака молочной железы и смертностью от рака шейки матки существует какая-то зависимость, так как ρ=-0,8 меньше критического уровня =0,94 при n=5 по таблице В.Ю. Урбаха и t=2 меньше 3-х.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: