Оценка коэффициента ранговой корреляции Спирмена

Значимость коэффициента ранговой корреляции Спирмена

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента ранговой корреляции Спирмена при конкурирующей гипотезе H_i. p ≠ 0, надо вычислить критическую точку:

где n - объем выборки; p - выборочный коэффициент ранговой корреляции Спирмена: t(α, к) - критическая точка двусторонней критической области, которую находят по таблице критических точек распределения Стьюдента, по уровню значимости α и числу степеней свободы k = n-2.

Если |p| < Т_kp - нет оснований отвергнуть нулевую гипотезу. Ранговая корреляционная связь между качественными признаками не значима. Если |p| > T_kp - нулевую гипотезу отвергают. Между качественными признаками существует значимая ранговая корреляционная связь.

По таблице Стьюдента находим t(α, k):

t(α, k) = (13;0.05) = 1.771

Поскольку T_kp > p, то принимаем гипотезу о равенстве 0 коэффициента ранговой корреляции Спирмена. Другими словами, коэффициент ранговой корреляции статистически - не значим и ранговая корреляционная связь между оценками по двум тестам незначимая.

Проверим гипотезу H₀: гетероскедастичность отсутсвует.

Поскольку 2.16 > 0.45, то гипотеза об отсутствии гетероскедастичности принимается.

3. Тест Голдфелда-Квандта.

В данном случае предполагается, что стандартное отклонение σ_i = σ(ε_i) пропорционально значению x_i переменной X в этом наблюдении, т.е. σ²_i = σ²x²_i, i = 1,2,…,n.

Тест Голдфелда-Квандта состоит в следующем:

1. Все n наблюдений упорядочиваются по величине X.

2. Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k,(n-2k),k.

3. Оцениваются отдельные регрессии для первой подвыборки (k первых наблюдений) и для третьей подвыборки (k последних наблюдений).

4. Для сравнения соответствующих дисперсий строится соответствующая F-статистика:

F = S₃/S₁

Построенная F-статистика имеет распределение Фишера с числом степеней свободы v₁ = v₂ = n – m - 1.

5. Если F > F_kp, то гипотеза об отсутствии гетероскедастичности отклоняется.

Этот же тест может использоваться при предположении об обратной пропорциональности между σ_i и значениями объясняющей переменной. При этом статистика Фишера имеет вид:

F = S₁/S₃

1. Упорядочим все значения по величине X.

2. Находим размер подвыборки k = 15/3 = 6.

3. Оценим регрессию для первой подвыборки.

Находим параметры уравнения методом наименьших квадратов.

Система уравнений МНК:

a₀n + a₁∑x = ∑y

a₀∑x + a₁∑x² = ∑y•x

Для наших данных система уравнений имеет вид:

6a₀ + 64.6a₁ = 7.29

64.6a₀ + 696.44a₁ = 78.43

Из первого уравнения выражаем а₀ и подставим во второе уравнение

Получаем a₀ = -0.0668, a₁ = 1.93

x	y	x²	y²	x • y	y(x)	(y-y(x))²
10.3	1.25	106.09	1.56	12.88	1.25
10.5	1.13	110.25	1.28	11.87	1.23	0.0105
10.6	1.29	112.36	1.66	13.67	1.23	0.004
10.7	1.22	114.49	1.49	13.05	1.22
	1.28		1.64	14.08	1.2	0.0064
11.5	1.12	132.25	1.25	12.88	1.17	0.0021
64.6	7.29	696.44	8.88	78.43	7.29	0.023

Здесь S₁ = 0.023

Оценим регрессию для третьей подвыборки.

Находим параметры уравнения методом наименьших квадратов.

Система уравнений МНК:

a₀n + a₁∑x = ∑y

a₀∑x + a₁∑x² = ∑y•x

Для наших данных система уравнений имеет вид:

6a₀ + 85.1a₁ = 6.1

85.1a₀ + 1215.37a₁ = 85.52

Из первого уравнения выражаем а₀ и подставим во второе уравнение

Получаем a₀ = -0.12, a₁ = 2.7

x	y	x²	y²	x • y	y(x)	(y-y(x))²
12.6	1.15	158.76	1.32	14.49	1.2	0.003
	1.13		1.28	14.69	1.16	0.0007
13.9	1.17	193.21	1.37	16.26	1.05	0.0143
14.4	0.95	207.36	0.9	13.68	0.99	0.0016
15.2		231.04		15.2	0.9	0.0108
	0.7		0.49	11.2	0.8	0.0101
85.1	6.1	1215.37	6.36	85.52	6.1	0.0405

Здесь S₃ = 0.0405

Число степеней свободы v1 = v2 = n – m - 1 = 15 - 1 - 1 = 13

Fkp(1,13) = 4.67

Строим F-статистику:

F = 0.0405/0.023 = 1.76

Поскольку F < F_kp = 4.67, то гипотеза об отсутствии гетероскедастичности принимается.

2 3 4 5 6 7 8

Подборка статей по вашей теме: