Проверить гипотезу о наличии гомоскедастичности, устранить ее и построить уравнений линейной регрессии.
x | y | x | y | x | y | x | y | x | y |
75,5 | 80,5 | 85,5 | |||||||
75,5 | 88,5 | 93,5 | 105,5 | ||||||
77,5 | 84,5 | 97,5 | |||||||
78,5 | 110,5 | ||||||||
85,5 | 102,5 | ||||||||
86,5 | 118,5 |
Уравнение регрессии имеет вид . Мы видим, что с ростом x разброс значений y увеличивается. Например, при размах вариации переменной y равен , а при размах вариации переменной y равен . Поэтому можно ожидать наличие гетероскедастичности.
Проверим с помощью теста Голдфелда-Квандта гипотезу о наличии гетероскедастичности. Возьмем . Доверительная вероятность , тогда , с помощью функции FРАСПОБР(0,05;10;10) находится граничная точка . m ¾ это количество факторов модели, в нашем случае m = 1.
Теперь воспользуемся Пакетом анализа и заполним таблицу:
x | y | x | y | ||||
75,5 | ¾1,15 | 1,32 | ¾7,03 | 49,35 | |||
75,5 | ¾1,15 | 1,32 | 93,5 | ¾6,53 | 42,58 | ||
77,5 | 0,85 | 0,72 | 97,5 | ¾2,53 | 6,38 | ||
78,5 | 1,85 | 3,42 | ¾1,03 | 1,05 | |||
3,35 | 11,22 | 102,5 | 2,47 | 6,13 | |||
4,35 | 18,92 | 4,97 | 24,75 | ||||
80,5 | ¾3,94 | 15,54 | ¾5,82 | 33,83 | |||
¾2,94 | 5,96 | 105,5 | ¾2,32 | 5,37 | |||
84,5 | 0,06 | ¾0,82 | 0,67 | ||||
0,56 | 0,31 | 110,5 | 2,68 | 7,2 | |||
85,5 | 1,06 | 1,12 | 7,18 | 51,6 | |||
86,5 | 2,06 | 4,24 | 118,5 | 10,68 | 114,13 | ||
Сумма | 64,11 | Сумма | 343,03 | ||||
85,5 | ¾6,73 | 45,34 | |||||
88,5 | ¾3,73 | 13,94 | |||||
¾2,23 | 4,99 | ||||||
¾1,23 | 1,52 | ||||||
2,77 | 7,65 | ||||||
3,77 | 14,19 |
Столбец ¾ это столбец Остатки из блока Вывод остатка.
|
|
Суммы квадратов отклонений соответственно равны: , . Значения из середины таблицы при в вычислении сумм не используются.
Статистика определяется формулой . Так как 5,35 > 2,98, то на уровне значимости 5% принимается гипотеза о наличии гетероскедастичности.
Устраним гетероскедастичность. Предположим, что неизвестные дисперсии отклонений неизвестны и пропорциональны .
Уравнений линейной регрессии имеет вид . Разделим обе части этого уравнения на . Тогда получаем , откуда . Обозначим , . Получаем уравнение . Заполним таблицу:
x | y | x | y | ||||
75,5 | 0,01 | 0,76 | 0,0025 | 0,23 | |||
75,5 | 0,01 | 0,76 | 93,5 | 0,0025 | 0,23 | ||
77,5 | 0,01 | 0,78 | 97,5 | 0,0025 | 0,24 | ||
78,5 | 0,01 | 0,79 | 0,0025 | 0,25 | |||
0,01 | 0,8 | 102,5 | 0,0025 | 0,26 | |||
0,01 | 0,81 | 0,0025 | 0,26 | ||||
80,5 | 0,005 | 0,4 | 0,002 | 0,2 | |||
0,005 | 0,41 | 105,5 | 0,002 | 0,21 | |||
84,5 | 0,005 | 0,42 | 0,002 | 0,21 | |||
0,005 | 0,43 | 110,5 | 0,002 | 0,22 | |||
85,5 | 0,005 | 0,43 | 0,002 | 0,23 | |||
86,5 | 0,005 | 0,43 | 118,5 | 0,002 | 0,24 | ||
85,5 | 0,003 | 0,29 | |||||
88,5 | 0,003 | 0,3 | |||||
0,003 | 0,3 | ||||||
0,003 | 0,3 | ||||||
0,003 | 0,32 | ||||||
0,003 | 0,32 |
По данным столбцов и с помощью пакета анализа находим коэффициенты и . Тогда уравнение регрессии имеет вид .
|
|