Корреляционной называют зависимость, при которой изменения одной из величин повлекут за собой изменения среднего значения другой величины. Для оценки корреляционной зависимости используется коэффициент ранговой корреляции Спирмена, Кендалла, изменяющийся в диапазоне -1<=r<=1, если r=1 – зависимость линейная, если r=0 – переменные независимы, r>1 – прямая связь, r<0 – обратная связь. Чем больше абсолютное значение коэффициента, тем сильнее связь между признаками.
Метод вычисления коэффициента корреляции зависит от вида шкалы, которой относятся переменные. Процедуру присвоения рангов можно выполнять для порядковых и интервальных шкал. Для номинальных шкал она неосуществима. При вычислении коэффициентов ранговой корреляции каждому наблюдению (т.е. респонденту) ставится в соответствие величина, называемая рангом. Ранг имеет смысл порядкового номера ответа респондента после того, как ответы всех респондентов расположили в порядке возрастания исследуемого признака. Поясним на примере: Пусть были получены следующие ответы на некоторый вопрос:
|
|
Номер респондента 1 2 3 4 5 6 7 8 9
Ответ 10 7 4 8 6 2 25 15 17
Расположим ответы в порядке возрастания:
Номер респондента 6 3 5 2 4 1 8 9 7
Ответ 2 4 6 7 8 10 15 17 25
Теперь запишем вместо ответов порядковые номера ответов.
Это и будут ранги:
Номер респондента 6 3 5 2 4 1 8 9 7
Ранг 1 2 3 4 5 6 7 8 9
Например, ранг 2-го респондента будет равен 4. Коэффициент линейной корреляции Пирсона R служит для измерения силы связи двух признаков, каждый из которых измеряется по интервальной шкале. В остальном его свойства схожи с коэффициентами ранговой корреляции. Диапазон его изменения - от -1 до 1, притом значение ~0 означает отсутствие связи между ответами на изучаемые вопросы (т.е. то, что признаки независимы). Значение R~1 означает, что чем больше у респондента значение 1-го фактора, тем больше у него ожидаемое значение 2-го фактора. Наоборот, R~ -1 означает, что чем больше значение 1-го фактора, тем меньше ожидаемое значение 2-го фактора.
Рассмотрим вычисление коэффициента корреляции на следующем примере. Пусть студенты сдавали математику и информатику и получили следующие оценки:
Оценка по математике 5 4 2 4 5 3 2 4 4
Оценка по информатике 4 4 3 5 5 3 3 5 4
Требуется проверить, связаны ли оценки по математике и информатике.