Значимость коэффициента ранговой корреляции Спирмена
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе Hi. p ≠ 0, надо вычислить критическую точку:
где n - объем выборки; p - выборочный коэффициент ранговой корреляции Спирмена: t(α, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n-2.
Если |p| < Тkp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > Tkp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.
По таблице Стьюдента находим t(α, k):
t(α, k) = (13;0.05) = 1.771
Поскольку Tkp > p, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - не значим и ранговая корреляционная связь между оценками по двум тестам незначимая.
|
|
Проверим гипотезу H0: гетероскедастичность отсутсвует.
Поскольку 2.16 > 0.45, то гипотеза об отсутствии гетероскедастичности принимается.
3. Тест Голдфелда-Квандта.
В данном случае предполагается, что стандартное отклонение σi = σ(εi) пропорционально значению xi переменной X в этом наблюдении, т.е. σ2i = σ2x2i, i = 1,2,…,n.
Тест Голдфелда-Квандта состоит в следующем:
1. Все n наблюдений упорядочиваются по величине X.
2. Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k.
3. Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки (k последних наблюдений).
4. Для сравнения соответствующих дисперсий строится соответствующая F-статистика:
F = S3/S1
Построенная F-статистика имеет распределение Фишера с числом степеней свободы v1 = v2 = n – m - 1.
5. Если F > Fkp, то гипотеза об отсутствии гетероскедастичности отклоняется.
Этот же тест может использоваться при предположении об обратной пропорциональности между σi и значениями объясняющей переменной. При этом статистика Фишера имеет вид:
F = S1/S3
1. Упорядочим все значения по величине X.
2. Находим размер подвыборки k = 15/3 = 6.
3. Оценим регрессию для первой подвыборки.
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0n + a1∑x = ∑y
a0∑x + a1∑x2 = ∑y•x
Для наших данных система уравнений имеет вид:
6a0 + 64.6a1 = 7.29
64.6a0 + 696.44a1 = 78.43
Из первого уравнения выражаем а0 и подставим во второе уравнение
|
|
Получаем a0 = -0.0668, a1 = 1.93
x | y | x2 | y2 | x • y | y(x) | (y-y(x))2 |
10.3 | 1.25 | 106.09 | 1.56 | 12.88 | 1.25 | |
10.5 | 1.13 | 110.25 | 1.28 | 11.87 | 1.23 | 0.0105 |
10.6 | 1.29 | 112.36 | 1.66 | 13.67 | 1.23 | 0.004 |
10.7 | 1.22 | 114.49 | 1.49 | 13.05 | 1.22 | |
1.28 | 1.64 | 14.08 | 1.2 | 0.0064 | ||
11.5 | 1.12 | 132.25 | 1.25 | 12.88 | 1.17 | 0.0021 |
64.6 | 7.29 | 696.44 | 8.88 | 78.43 | 7.29 | 0.023 |
Здесь S1 = 0.023
Оценим регрессию для третьей подвыборки.
Находим параметры уравнения методом наименьших квадратов.
Система уравнений МНК:
a0n + a1∑x = ∑y
a0∑x + a1∑x2 = ∑y•x
Для наших данных система уравнений имеет вид:
6a0 + 85.1a1 = 6.1
85.1a0 + 1215.37a1 = 85.52
Из первого уравнения выражаем а0 и подставим во второе уравнение
Получаем a0 = -0.12, a1 = 2.7
x | y | x2 | y2 | x • y | y(x) | (y-y(x))2 |
12.6 | 1.15 | 158.76 | 1.32 | 14.49 | 1.2 | 0.003 |
1.13 | 1.28 | 14.69 | 1.16 | 0.0007 | ||
13.9 | 1.17 | 193.21 | 1.37 | 16.26 | 1.05 | 0.0143 |
14.4 | 0.95 | 207.36 | 0.9 | 13.68 | 0.99 | 0.0016 |
15.2 | 231.04 | 15.2 | 0.9 | 0.0108 | ||
0.7 | 0.49 | 11.2 | 0.8 | 0.0101 | ||
85.1 | 6.1 | 1215.37 | 6.36 | 85.52 | 6.1 | 0.0405 |
Здесь S3 = 0.0405
Число степеней свободы v1 = v2 = n – m - 1 = 15 - 1 - 1 = 13
Fkp(1,13) = 4.67
Строим F-статистику:
F = 0.0405/0.023 = 1.76
Поскольку F < Fkp = 4.67, то гипотеза об отсутствии гетероскедастичности принимается.