5. Коэффициент ранговой корреляции τ Кендалла.
Назначение и описание коэффициента корреляции τ Кендалла.
Коэффициент корреляции τ «тау» Кендалла имеет те же свойства, что и коэффициент Спирмена (изменяется от –1 до +1, для независимых слу- чайных величин равен нулю), однако он считается более информативным.
Первым этапом расчета коэффициента τ Кендалла является ранжирование рядов переменных (одинаковым значениям ряда присваивают среднее ранговое число). Первая переменная должна быть упорядочена по возрастанию рангов.
Коэффициент корреляции τ Кендалла определяется по формуле:
(Ф4)
где n – объем выборки (число сопоставляемых пар);
Ri – число рангов во втором вариационном ряду, бóльших, чем данное ранговое число и расположенных ниже него.
Проверка гипотезы о значимости коэффициента ранговой корреляции Кендалла заключается в сопоставлении вычисленного значения коэффициента «тау» по модулю с критическими значениями:
(Ф5)
где n – объем выборки,
z 1– α /2 – квантили нормированного нормального распределения
(z 1– α /2 = 1,960 для α = 0,05; z 1– α /2 = 2,576 для α = 0,01).
Гипотезы:
Н0: Корреляция между переменными X и Y не отличается от нуля (не существует).
Н1: Корреляция между переменными X и Y достоверно отличается от нуля (существует).
Ограничения коэффициента ранговой корреляции τ Кендалла
Нулевая гипотеза τ = 0 не отвергается, если значение коэффициента
корреляции Кендалла (по модулю) попадает в область допустимых значе- ний: | τ | ≤ τ 0,05(n).
Корреляция считается значимой, если модуль коэффициента «тау»
попадает в критическую область: | τ | > τ 0,01(n).
Проверка гипотезы о значимости коэффициента ранговой корреляции Кендалла заключается в сопоставлении вычисленного значения коэффициента «тау» по модулюс критическими значениями:
1,960 для α = 0,05;
2,576 для α = 0,01
АЛГОРИТМ
Подсчёта коэффициента ранговой корреляции τ Кендалла
1. Значения Х ранжируются в порядке возрастания или убывания.
2. Значения Y располагаются в порядке, соответствующем значениям Х.
3. Для каждого ранга Y определяется число следующих за ним значений рангов, превышающих его величину. Суммируя таким образом числа определяется величина, как мера соответствия последовательностей рангов по Х и Y и учитывается со знаком (+).
4. Для каждого ранга Y определяется число следующих за ним значений рангов, меньших его величины и фиксируется знаком (-).
5. Определяется сумма баллов по всем членам ряда.
6. Коэффициент корреляции τ Кендалла определяется по формуле:
(Ф4)
где n – объем выборки (число сопоставляемых пар);
Ri – число рангов во втором вариационном ряду, бóльших, чем данное ранговое число и расположенных ниже него.
7. Проверка гипотезы о значимости коэффициента ранговой корреляции Кендалла заключается в сопоставлении вычисленного значения коэффициента «тау» по модулю с критическими значениями:
(Ф5)
где n – объем выборки,
z 1– α /2 – квантили нормированного нормального распределения
(z 1– α /2 = 1,960 для α = 0,05; z 1– α /2 = 2,576 для α = 0,01).
Пример 3:
Требуется оценить корреляционную связь между скоростью чтения первоклассников и их усидчивостью. Скорость чтения первоклассников замерялась секундомером (слов/мин), усидчивость – с помощью экспертного оценивания по специально разработанной пятиточечной шкале: очень высокий (ОВ) – высокий (В) – средний (С) – низкий (Н) – очень низкий (ОН) уровни. Учителю предъявлялись карточки с описанием уровня проявления усидчивости, которые он должен был соотнести с поведением каждого ученика. Результаты измерений приведены в таблице 5.1.
Решение. Скорость чтения первоклассников (переменная X) измерена в реляционной шкале, а их усидчивость (переменная Y) – в порядковой, поэтому определить связь между ними можно с помощью ранговой корреляции, проранжировав обе переменные. Решим задачу рассчитав коэффициенты ранговой корреляции Кендалла.
Гипотезы:
Н0: Скоростью чтения первоклассников не отличается от нуля, т.е. не связана с их усидчивостью.
Н1: Скоростью чтения первоклассников достоверно отличается от нуля, т.е. связана с их усидчивостью.
Таблица 5.1.
Ф.И. | X | Y | Rx | Ry |
1. Аня К. | 12,0 | Н | 9 | 8,5 |
2. Боря Л. | 18,8 | ОН | 6 | 10 |
3. Вася Р. | 11,0 | В | 10 | 2,5 |
4. Даша В. | 29,0 | С | 2 | 5,5 |
5. Зина С. | 17,5 | Н | 7 | 8,5 |
6. Игорь М. | 23,4 | ОВ | 4 | 1 |
7. Катя Г. | 35,6 | С | 1 | 5,5 |
8. Лёня А. | 15,4 | С | 8 | 5,5 |
9. Маша Д. | 26,1 | В | 3 | 2,5 |
10. Яша Б. | 20,7 | С | 5 | 5,5 |
Для расчета коэффициента корреляции Кендалла необходимо расчетную таблицу перегруппировать по возрастанию рангов первой переменной. Последний столбец (R) заполняется следующим образом: ниже Кати Г. (Ry = 5,5) имеется 3 ранга Ry, бóльших, чем у Кати (5,5); ниже Даши В. (Ry = 5,5) имеется 3 ранга Ry, бóльших, чем у Даши (5,5); ниже Маши Д. (Ry = 2,5) имеется 5 рангов Ry, бóльших, чем у Маши (2,5).
Таблица 5.2.