Вопрос 8. Корреляция. Применения корреляции в измерении. Коэффициент ранговой корреляции Спирмена

Коэффициенты корреляции используются для оценки силы связи между двумя признаками (в том числе при проверке того, есть ли эта связь вообще). Коэффициенты ранговой корреляции Спирмена и Кендалл а, о которых будет рассказано в этом разделе – это коэффициенты корреляции для проверки связи признаков, измеряемых по порядковым шкалам.

При вычислении коэффициентов ранговой корреляции каждому наблюдению (т.е. респонденту) ставится в соответствие величина, называемая рангом. Ранг имеет смысл порядкового номера ответа респондента после того, как ответы всех респондентов расположили в порядке возрастания исследуемого признака. Поясним на примере: Пусть были получены следующие ответы на некоторый вопрос:

Номер респондента                  
Ответ                  

Расположим ответы в порядке возрастания:

Номер респондента                  
Ответ                  

Теперь запишем вместо ответов порядковые номера ответов. Это и будут ранги:

Номер респондента                  
Ранг                  

Например, ранг 2-го респондента будет равен 4.

Процедуру присвоения рангов можно сделать и несколько иным образом. Сначала найдем среди ответов самый маленький (это ответ 2). Присвоим ему ранг 1. Теперь ищем самый маленький ответ среди оставшихся ответов (ответ 4). Присваиваем ему ранг 2. И так далее, до тех пор, пока все наблюдения не получат ранги.

Видно, что процедуру присвоения рангов можно выполнять для порядковых и интервальных шкал. Для номинальных шкал она неосуществима.

Как вычислить коэффициент ранговой корреляции Спирмена?.

Данные для его вычисления должны быть представлены в виде ответов респондентов на два вопроса. Скорее всего, это будут две строки или два столбца чисел, хотя вместо чисел могут быть и нечисловые ответы по порядковой шкале. Приведем пример данных:

Ответ на 1 вопрос                
Ответ на 2 вопрос                

Первым делом по каждому вопросу найдем ранги:

Ответ на 1 вопрос                
РАНГ по 1 вопросу                
Ответ на 2 вопрос                
РАНГ по 2 вопросу                

В результате мы имеем данные уже в виде рангов:

РАНГ по 1 вопросу                
РАНГ по 2 вопросу                

На следующем этапе мы вычисляем разности рангов:

Разности рангов -1         -2   -1

Возводим их в квадрат и суммируем:

Формула для коэффициента корреляции Спирмена выглядит так: .

В ней кроме только что вычисленной суммы квадратов разностей рангов фигурирует еще число респондентов N, которое в нашем примере равно 8. Подставляем и вычисляем: .

Коэффициент корреляции Спирмена может принимать значения от -1 до 1. Если коэффициент примерно равен 0, то связи нет. Если ρ~1, то связь положительная: чем больше ранг 1-го ответа, тем больше ожидаемый ранг 2-го ответа. Если ρ~-1, то связь есть, но отрицательная: чем больше ранг 1-го ответа, тем меньше ожидаемый ранг 2-го ответа. Тот же смысл имеет и коэффициент ранговой корреляции Кендалла, о вычислении которого будет рассказано далее на том же примере.

Значима ли величина коэффициента ранговой корреляции Спирмена?

Для этого требуется проверить гипотезу: «коэффициент ранговой корреляции Спирмена равен 0». Альтернативная гипотеза будет такая: «коэффициент ранговой корреляции Спирмена отличен от 0». Принятие альтернативной гипотезы означает, что между исследуемыми признаками существует связь, а принятие основной гипотезы - что этой связи нет.

Проверка осуществляется следующим образом. Сначала мы выбираем уровень значимости гипотезы, например, α=0,05. Затем вычисляем число степеней свободы для данного примера. Оно на 2 меньше, чем число наблюдений: d=N-2. В рассмотренном нами примере число степеней свободы d=8-2=6.

Далее, по таблице t-распределения Стьюдента с d=6 степенями свободы находим для наших данных критическое значение tкрит, соответствующее выбранному уровню значимости α. Обычно критическим значением (или критической точкой) называют граничное значение, с которым мы сравниваем коэффициент, чтобы определить, значим ли он. Пользователи Excel могут воспользоваться функцией СТЬЮДРАСПОБР. В нашем случае СТЬЮДРАСПОБР(0,05;6)= 2,446914.

Далее по полученному нами значению ρ находим экспериментальное значение tэксп по следующей формуле:

В нашем примере

Сравниваем полученный в эксперименте коэффициент tэксп (точнее, его модуль) с его критическим значением. Поскольку tэксп=3,37756 больше, чем критическое значение tкрит=2,446914, мы отвергаем гипотезу о том, что коэффициент корреляции Спирмена равен 0 и утверждаем, что признаки связаны.

При использовании Excel возможно с помощью функции СТЬЮДРАСП найти по экспериментальному значению tэксп уровень значимости α и сравнивать его с выбранным значением, например, 0.05. В нашем примере αкрит=0,014903 < 0,05.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: