Данный тест используется для отбора наиболее существенных объясняющих переменных. Например, переход от большого числа исходных показателей состояния анализируемой системы к меньшему числу наиболее информативных переменных может быть обусловлен дублированием информации, доставляемой сильно взаимосвязанными признаками или неинформативностью признаков, мало меняющихся при переходе от одного объекта к другому. Так, если две какие-либо объясняющие переменные сильно коррелированы с результирующим показателем и друг с другом, то часто бывает достаточно включения в модель одной из них, а дополнительным вкладом от включения другой можно пренебречь.
Пусть . Предположим, что модель не зависит от последних объясняющих переменных и их можно исключить из модели. Это соответствует гипотезе
,
т.е. последние коэффициентов равны .
Тест по проверке данной гипотезы состоит в следующем:
1. Построить по МНК «длинную» (unrestricted) регрессию по всем параметрам и найти для нее .
2. Используя МНК, построить «короткую» (restricted) регрессию по первым параметрам и найти для нее .
|
|
3. Вычислить F -статистику:
4. Найти критическую точку распределения Фишера при выбранном уровне значимости : .
5. Если , то гипотеза отвергается, т.е. следует использовать «длинную» модель.
Если , то гипотеза принимается, т.е. лучше «короткая» модель.
Пример 2. По данным, представленным в таблице, изучается зависимость индекса человеческого развития от переменных:
- ВВП 1997 г., % к 1990 г.;
- суточная калорийность питания населения, ккал на душу населения;
- ожидаемая продолжительность жизни при рождении 1997 г.,
число лет;
- расходы на конечное потребление в текущих ценах, % к ВВП;
- расходы домашних хозяйств, % к ВВП;
- валовое накопление, % к ВВП.
Данные приведены в таблице 2.
Таблица 2.
Страна | |||||||
Австрия | 0,904 | 77,0 | 75,5 | 56,1 | 25,2 | ||
Австралия | 0,922 | 78,2 | 78,5 | 61,8 | 21,8 | ||
Белоруссия | 0,763 | 68,0 | 78,4 | 59,1 | 25,7 | ||
Бельгия | 0,923 | 77,2 | 77,7 | 63,3 | 17,8 | ||
Великобритания | 0,918 | 77,2 | 84,4 | 64,1 | 15,9 | ||
Германия | 0,906 | 77,2 | 75,9 | 57,0 | 22,4 | ||
Дания | 0,905 | 75,7 | 76,0 | 50,7 | 20,6 | ||
Индия | 0,545 | 62,6 | 67,5 | 57,1 | 25,2 | ||
Испания | 0,894 | 78,0 | 78,2 | 62,0 | 20,7 | ||
Италия | 0,900 | 78,2 | 78,1 | 61,8 | 17,5 | ||
Канада | 0,932 | 79,0 | 78,6 | 58,6 | 19,7 | ||
Казахстан | 0,740 | 67,6 | 84,0 | 71,7 | 18,5 | ||
Китай | 0,701 | 69,8 | 59,2 | 48,0 | 42,4 | ||
Латвия | 0,744 | 68,4 | 90,2 | 63,9 | 23,0 | ||
Нидерланды | 0,921 | 77,9 | 72,8 | 59,1 | 20,2 | ||
Норвегия | 0,927 | 78,1 | 67,7 | 47,5 | 25,2 | ||
Польша | 0,802 | 72,5 | 82,6 | 65,3 | 22,4 | ||
Россия | 0,747 | 66,6 | 74,4 | 53,2 | 22,7 | ||
США | 0,927 | 76,7 | 83,3 | 67,9 | 18,1 | ||
Украина | 0,721 | 68,8 | 83,7 | 61,7 | 20,1 | ||
Финляндия | 0,913 | 76,8 | 73,8 | 52,9 | 17,3 | ||
Франция | 0,918 | 78,1 | 79,2 | 59,9 | 16,8 | ||
Чехия | 0,833 | 99,2 | 73,9 | 71,5 | 51,5 | 29,9 | |
Швейцария | 0,914 | 78,6 | 75,3 | 61,2 | 20,3 | ||
Швеция | 0,923 | 78,5 | 79,0 | 53,1 | 14,1 |
Отчет по «длинной» регрессии приведен в таблице 3, а по «короткой» - представлен в таблице 4.
|
|
В результате посчитана F -статистика
Таблица 3a.
df | SS | MS | F | Значимость F | |
Регрессия | 0.2375 | 0.0396 | 81.0051 | 4.86777E-12 | |
Остаток | ESSUR = 0.0088 | 0.0005 | |||
Итого | 0.2463 |
Таблица 3б.
Коэффи-циенты | Стандарт-ная ошибка | t-стати-стика | P-Значение | Нижние 95% | Верхние 95% | |
-0.63627 | 0.15485 | -4.10892 | 0.00066 | -0.96160 | -0.31094 | |
-0.00048 | 0.00023 | -2.08803 | 0.05128 | -0.00095 | 0.00000 | |
0.00004 | 0.00002 | 2.11404 | 0.04873 | 0.00000 | 0.00009 | |
0.01854 | 0.00159 | 11.65416 | 0.00000 | 0.01519 | 0.02188 | |
0.00131 | 0.00146 | 0.89470 | 0.38276 | -0.00176 | 0.00438 | |
-0.00141 | 0.00123 | -1.14140 | 0.26866 | -0.00400 | 0.00118 | |
0.00015 | 0.00139 | 0.10685 | 0.91609 | -0.00277 | 0.00307 |
Таблица 4a.
df | SS | MS | F | Значимость F | |
Регрессия | 0.2368 | 0.0789 | 174.7949 | 0.0000 | |
Остаток | ESSR = 0.0095 | 0.0005 | |||
Итого | 0.2463 |
Таблица 4б.
Коэффи-циенты | Стандарт-ная ошибка | t-стати-стика | P-Значение | Нижние 95% | Верхние 95% | |
-0.62115 | 0.06739 | -9.21774 | 0.00000 | -0.76128 | -0.48101 | |
-0.00054 | 0.00014 | -3.69691 | 0.00134 | -0.00084 | -0.00023 | |
0.00004 | 0.00002 | 2.24223 | 0.03587 | 0.00000 | 0.00008 | |
0.01873 | 0.00128 | 14.63733 | 0.00000 | 0.01607 | 0.02139 |
Табличное значение F-статистики находится следующим образом:
FРАСПОБР (0.05;3;18) = 3.1599[1]
Так как , то гипотеза принимается, и, следовательно, выбирается «короткая» модель:
.