Тест на выбор «длинной» или «короткой» регрессии

Данный тест используется для отбора наиболее существенных объясняющих переменных. Например, переход от большого числа исходных показателей состояния анализируемой системы к меньшему числу наиболее информативных переменных может быть обусловлен дублированием информации, доставляемой сильно взаимосвязанными признаками или неинформативностью признаков, мало меняющихся при переходе от одного объекта к другому. Так, если две какие-либо объясняющие переменные сильно коррелированы с результирующим показателем и друг с другом, то часто бывает достаточно включения в модель одной из них, а дополнительным вкладом от включения другой можно пренебречь.

Пусть . Предположим, что модель не зависит от последних объясняющих переменных и их можно исключить из модели. Это соответствует гипотезе

,

т.е. последние коэффициентов равны .

Тест по проверке данной гипотезы состоит в следующем:

1. Построить по МНК «длинную» (unrestricted) регрессию по всем параметрам и найти для нее .

2. Используя МНК, построить «короткую» (restricted) регрессию по первым параметрам и найти для нее .

3. Вычислить F -статистику:

4. Найти критическую точку распределения Фишера при выбранном уровне значимости : .

5. Если , то гипотеза отвергается, т.е. следует использовать «длинную» модель.

Если , то гипотеза принимается, т.е. лучше «короткая» модель.

Пример 2. По данным, представленным в таблице, изучается зависимость индекса человеческого развития от переменных:

- ВВП 1997 г., % к 1990 г.;

- суточная калорийность питания населения, ккал на душу населения;

- ожидаемая продолжительность жизни при рождении 1997 г.,

число лет;

- расходы на конечное потребление в текущих ценах, % к ВВП;

- расходы домашних хозяйств, % к ВВП;

- валовое накопление, % к ВВП.

Данные приведены в таблице 2.

Таблица 2.

Страна
Австрия 0,904     77,0 75,5 56,1 25,2
Австралия 0,922     78,2 78,5 61,8 21,8
Белоруссия 0,763     68,0 78,4 59,1 25,7
Бельгия 0,923     77,2 77,7 63,3 17,8
Великобритания 0,918     77,2 84,4 64,1 15,9
Германия 0,906     77,2 75,9 57,0 22,4
Дания 0,905     75,7 76,0 50,7 20,6
Индия 0,545     62,6 67,5 57,1 25,2
Испания 0,894     78,0 78,2 62,0 20,7
Италия 0,900     78,2 78,1 61,8 17,5
Канада 0,932     79,0 78,6 58,6 19,7
Казахстан 0,740     67,6 84,0 71,7 18,5
Китай 0,701     69,8 59,2 48,0 42,4
Латвия 0,744     68,4 90,2 63,9 23,0
Нидерланды 0,921     77,9 72,8 59,1 20,2
Норвегия 0,927     78,1 67,7 47,5 25,2
Польша 0,802     72,5 82,6 65,3 22,4
Россия 0,747     66,6 74,4 53,2 22,7
США 0,927     76,7 83,3 67,9 18,1
Украина 0,721     68,8 83,7 61,7 20,1
Финляндия 0,913     76,8 73,8 52,9 17,3
Франция 0,918     78,1 79,2 59,9 16,8
Чехия 0,833 99,2   73,9 71,5 51,5 29,9
Швейцария 0,914     78,6 75,3 61,2 20,3
Швеция 0,923     78,5 79,0 53,1 14,1

Отчет по «длинной» регрессии приведен в таблице 3, а по «короткой» - представлен в таблице 4.

В результате посчитана F -статистика

Таблица 3a.

  df SS MS F Значимость F
Регрессия   0.2375 0.0396 81.0051 4.86777E-12
Остаток   ESSUR = 0.0088 0.0005    
Итого   0.2463      

Таблица 3б.

  Коэффи-циенты Стандарт-ная ошибка t-стати-стика P-Значение Нижние 95% Верхние 95%
-0.63627 0.15485 -4.10892 0.00066 -0.96160 -0.31094
-0.00048 0.00023 -2.08803 0.05128 -0.00095 0.00000
0.00004 0.00002 2.11404 0.04873 0.00000 0.00009
0.01854 0.00159 11.65416 0.00000 0.01519 0.02188
0.00131 0.00146 0.89470 0.38276 -0.00176 0.00438
-0.00141 0.00123 -1.14140 0.26866 -0.00400 0.00118
0.00015 0.00139 0.10685 0.91609 -0.00277 0.00307

Таблица 4a.

  df SS MS F Значимость F
Регрессия   0.2368 0.0789 174.7949 0.0000
Остаток   ESSR = 0.0095 0.0005    
Итого   0.2463      

Таблица 4б.

  Коэффи-циенты Стандарт-ная ошибка t-стати-стика P-Значение Нижние 95% Верхние 95%
-0.62115 0.06739 -9.21774 0.00000 -0.76128 -0.48101
-0.00054 0.00014 -3.69691 0.00134 -0.00084 -0.00023
0.00004 0.00002 2.24223 0.03587 0.00000 0.00008
0.01873 0.00128 14.63733 0.00000 0.01607 0.02139

Табличное значение F-статистики находится следующим образом:

FРАСПОБР (0.05;3;18) = 3.1599[1]

Так как , то гипотеза принимается, и, следовательно, выбирается «короткая» модель:

.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: