Коэффициенты корреляции используются для оценки силы связи между двумя признаками (в том числе при проверке того, есть ли эта связь вообще). Коэффициенты ранговой корреляции Спирмена и Кендалл а, о которых будет рассказано в этом разделе – это коэффициенты корреляции для проверки связи признаков, измеряемых по порядковым шкалам.
При вычислении коэффициентов ранговой корреляции каждому наблюдению (т.е. респонденту) ставится в соответствие величина, называемая рангом. Ранг имеет смысл порядкового номера ответа респондента после того, как ответы всех респондентов расположили в порядке возрастания исследуемого признака. Поясним на примере: Пусть были получены следующие ответы на некоторый вопрос:
Номер респондента | |||||||||
Ответ |
Расположим ответы в порядке возрастания:
Номер респондента | |||||||||
Ответ |
Теперь запишем вместо ответов порядковые номера ответов. Это и будут ранги:
|
|
Номер респондента | |||||||||
Ранг |
Например, ранг 2-го респондента будет равен 4.
Процедуру присвоения рангов можно сделать и несколько иным образом. Сначала найдем среди ответов самый маленький (это ответ 2). Присвоим ему ранг 1. Теперь ищем самый маленький ответ среди оставшихся ответов (ответ 4). Присваиваем ему ранг 2. И так далее, до тех пор, пока все наблюдения не получат ранги.
Видно, что процедуру присвоения рангов можно выполнять для порядковых и интервальных шкал. Для номинальных шкал она неосуществима.
Как вычислить коэффициент ранговой корреляции Спирмена?.
Данные для его вычисления должны быть представлены в виде ответов респондентов на два вопроса. Скорее всего, это будут две строки или два столбца чисел, хотя вместо чисел могут быть и нечисловые ответы по порядковой шкале. Приведем пример данных:
Ответ на 1 вопрос | ||||||||
Ответ на 2 вопрос |
Первым делом по каждому вопросу найдем ранги:
Ответ на 1 вопрос | ||||||||
РАНГ по 1 вопросу | ||||||||
Ответ на 2 вопрос | ||||||||
РАНГ по 2 вопросу |
В результате мы имеем данные уже в виде рангов:
РАНГ по 1 вопросу | ||||||||
РАНГ по 2 вопросу |
На следующем этапе мы вычисляем разности рангов:
Разности рангов | -1 | -2 | -1 |
Возводим их в квадрат и суммируем:
|
|
Формула для коэффициента корреляции Спирмена выглядит так: .
В ней кроме только что вычисленной суммы квадратов разностей рангов фигурирует еще число респондентов N, которое в нашем примере равно 8. Подставляем и вычисляем: .
Коэффициент корреляции Спирмена может принимать значения от -1 до 1. Если коэффициент примерно равен 0, то связи нет. Если ρ~1, то связь положительная: чем больше ранг 1-го ответа, тем больше ожидаемый ранг 2-го ответа. Если ρ~-1, то связь есть, но отрицательная: чем больше ранг 1-го ответа, тем меньше ожидаемый ранг 2-го ответа. Тот же смысл имеет и коэффициент ранговой корреляции Кендалла, о вычислении которого будет рассказано далее на том же примере.
Значима ли величина коэффициента ранговой корреляции Спирмена?
Для этого требуется проверить гипотезу: «коэффициент ранговой корреляции Спирмена равен 0». Альтернативная гипотеза будет такая: «коэффициент ранговой корреляции Спирмена отличен от 0». Принятие альтернативной гипотезы означает, что между исследуемыми признаками существует связь, а принятие основной гипотезы - что этой связи нет.
Проверка осуществляется следующим образом. Сначала мы выбираем уровень значимости гипотезы, например, α=0,05. Затем вычисляем число степеней свободы для данного примера. Оно на 2 меньше, чем число наблюдений: d=N-2. В рассмотренном нами примере число степеней свободы d=8-2=6.
Далее, по таблице t-распределения Стьюдента с d=6 степенями свободы находим для наших данных критическое значение tкрит, соответствующее выбранному уровню значимости α. Обычно критическим значением (или критической точкой) называют граничное значение, с которым мы сравниваем коэффициент, чтобы определить, значим ли он. Пользователи Excel могут воспользоваться функцией СТЬЮДРАСПОБР. В нашем случае СТЬЮДРАСПОБР(0,05;6)= 2,446914.
Далее по полученному нами значению ρ находим экспериментальное значение tэксп по следующей формуле:
В нашем примере
Сравниваем полученный в эксперименте коэффициент tэксп (точнее, его модуль) с его критическим значением. Поскольку tэксп=3,37756 больше, чем критическое значение tкрит=2,446914, мы отвергаем гипотезу о том, что коэффициент корреляции Спирмена равен 0 и утверждаем, что признаки связаны.
При использовании Excel возможно с помощью функции СТЬЮДРАСП найти по экспериментальному значению tэксп уровень значимости α и сравнивать его с выбранным значением, например, 0.05. В нашем примере αкрит=0,014903 < 0,05.