Теоретические основы

Выполнение условий Гаусса-Маркова гарантирует получение с помощью метода наименьших квадратов (МНК) при выборе надлежащей спецификации оценок параметров, удовлетворяющих требованиям состоятельности, эффективности и несмещенности. Рассмотрим нарушение условия, касающегося постоянства дисперсии остатков (D(е)¹const). В этом случае применение МНК не гарантирует эффективность получаемых оценок параметров уравнения регрессии.

Эффект потери эффективности в особенности проявляется при относительно больших по отношению к зависимой переменной (у) значениях остатков. Для визуального выявления наличия непостоянства дисперсии целесообразно построить диаграмму зависимости остатков от переменной х, а для множественной регрессии зависимость остатков (е) от результативного показателя (у). Гетероскедастичность в уравнении регрессии может быть как по одной объясняющей переменной, так и по нескольким, поэтому важно ее выявление по всем переменным.

Основными причинами появления гетероскедастичности являются: неправильная функциональная спецификация модели, значительные ошибки в исходной информации, а также отсутствие в модели переменной, существенно влияющей на результативный показатель. Такой переменной при получении модели по выборке, полученной за большой временной интервал может быть время.

При наличии подозрений на наличие гетероскедастичности целесообразно воспользоваться тестами. Тест ранговой корреляции Спирмена используется при относительно больших выборках и предположении, что дисперсия остатков будет либо уменьшаться, либо увеличиваться по мере увеличения х.

Очевидно, в этом случае абсолютные значения остатков (е=(уii)) и и значения объясняющей переменной (хi) будут коррелированы.

Тестирование целесообразно проводить в следующем порядке:

1. Упорядочить (по возрастанию или убыванию х) выборочные данные.

2. Построить уравнение регрессии и получить значения остатков (еi) для каждого х.

3. Вычислить ранги модулей остатков и найти разности между рангами независимой переменной (хi) и рангами модулей остатков

4. Вычислить коэффициент корреляции r (х, е) между рангами переменной (х) и рангами модулей остатков (еi).

r (х, е) =1 – (6 ,

где Di – разность между рангом (х) и рангом модуля (е);

n – объем выборки.

Вычислить стандартизованную переменную r(х,е)· и в предположении, что при больших n указанная переменная имеет стандартное нормальное распределение. Проверить нулевую гипотезу Но: r(х,е)· =0. Для этого необходимо воспользоваться значением квантили стандартного нормального распределения. Например, для двустороннего критерия гипотеза об отсутствии гетероскедастичности будет отклонена, если при уровне значимости α=0,05 r(х,е)· >1,96.

Тест Гольдфельда-Квандта используется в случае относительно небольшого количества данных в предположении, что с увеличением х значения (еi) увеличиваются, а значит σ(еi) пропорционально значению независимой переменной х. Согласно этому тесту все данные упорядочиваются по мере увеличения х. После этого средняя часть выборки объема (с) отбрасывается. По освободившимся двум выборкам объема (n-с)/2 оцениваются отдельные регрессии. Если принятое предположение верно, то дисперсия остатков по последним (n-с)/2 значениям будет значимо больше дисперсии остатков по первым значениям.

При принятии допущения о нормальном распределении остатков отношение Fф=SSост2/SSост1 будет иметь F-распределение Фишера. При выполнении гипотезы об отсутствии гетероскедастичности значение Fф будет меньше критического (Fкр).

Порядок тестирования:

1. Упорядочить исследуемые данные по мере роста переменной (х).

2. Разделить исходную выборку на три части (выборки). Исключить центральную часть объемом ориентировочно (1/4...1/3) объема первоначальной выборки, при этом необходимо, чтобы (n-с)/2>К, где К – число оцениваемых параметров в уравнении регрессии.

3. Построить два уравнения регрессии (у1 и у2) по оставшимся частям (выборкам).

4. Найти значения сумм квадратов остатков (SSост) для каждого уравнения регрессии и по ним определить Fф=SS2/SS1. При этом необходимо, чтобы выполнялось условие SS2>SS1.

5. Используя F-распределение Фишера сравнить полученное значение Fф с критическим значением, соответствующим выбранному уровню значимости. При Fф>Fкр гипотеза об отсутствии гетероскедастичности будет отклонена.

Задание на работу.

1. Построить уравнение регрессии государственных расходов на образование в функции от валового внутреннего продукта (ВВП) по данным табл.1[7] и произвести тестирование на наличие гетероскедастичности, используя тесты ранговой корреляции Спирмена, Гольдфельда-Квандта. В предположении, что причиной наличия гетероскедастичности является неправильная спецификация модели. 2. В предположении, что причиной гетероскедастичности является ошибочная спецификация модели, учесть в модели численность населения, получив уравнение зависимости расходов на образование на одного человека в функции ВВП на одного человека. Произвести тестирование одним из тестов. 3. Произвести тестирование по индивидуальному заданию, используя оба теста и сделать выводы по всей работе.

Порядок выполнения работы:

1. Найти уравнение линейной регрессии.

2. Построить графики зависимости уii), еii), еii) на основе визуального анализа выдвинуть гипотезу о наличии или отсутствии гетероскедастичности.

3. Провести тестирование по вышеуказанным тестам и дать анализ.

В отчете к лабораторной работе привести: исходные данные, графические зависимости уi i), еi i), еii), расчетные таблицы при проведении тестирования, расчетные формулы и результаты анализа.

Таблица 1. Государственные расходы на образование (РО), валовой внутренний продукт (ВВП) и численность населения (ЧН) в выборке стран, 1980 г.

Таблица 1

Страна РО ВВП ЧН
Люксембург 0,34 5,67 0,36
Уругвай 0,22 10,13 2,90
Сингапур 0,32 11,34 2,39
Ирландия 1,23 18,88 3,44
Израиль 1,81 20,94 3,87
Венгрия 1,02 22,16 10,71
Новая Зеландия 1,27 23,83 3,10
Португалия 1,07 24,67 9,93
Гонконг 0,67 27,56 5,07
Чили 1,25 27,57 11,10
Греция 0,75 40,15 9,60
Финляндия 2,80 51,62 4,78
Норвегия 4,90 57,71 4,09
Югославия 3,50 63,03 22,34
Дания 4,45 66,32 5,12
Турция 1,60 66,97 44,92
Австрия 4,26 76,88 7,51
Швейцария 5,31 101,65 6,37
Саудовская Аравия 6,40 115,97 8,37
Бельгия 7,15 119,49 9,86
Швеция 11,22 124,15 8,31
Австралия 8,66 140,98 14,62
Аргентина 5,56 153,85 27,06
Нидерланды 13,41 169,38 14,14
Мексика 5,46 186,33 67,40
Испания 4,79 211,78 37,43
Бразилия 8,92 249,72 123,03
Канада 18,90 261,41 23,94
Италия 15,95 395,52 57,04
Великобритания 29,90 534,97 55,95
Франция 33,59 655,29 53,71
ФРГ 38,62 815,00 61,56
Япония 61,61 1040,45 116,78
США 181,30 2586,40 227,64

Таблица 2. Исходная информация для индивидуального задания.

  Вариант1 Вариант2 Вариант3 Вариант4 Вариант5 Вариант6 Вариант7
x y y y y y y y
  6,2954802 10,872768 11,59096 24,618305 10,99096 18,401389 8,8727683
  11,03354 18,853664 20,56708 44,5609912 19,66708 6,63399607 15,853664
  13,292276 22,867641 24,584552 52,6029237 23,384552 4,60502994 18,867641
  6,5114292 12,418287 10,522858 17,2548601 9,0228584 21,7451659 7,4182867
  13,5103 24,01648 24,0206 48,04944 22,2206 65,4566672 18,01648
  37,414441 62,663106 71,328883 159,989319 69,228883 75,6138047 55,663106
  31,46263 53,540208 58,92526 128,620624 56,52526 66,7110669 45,540208
  44,955229 75,528367 85,410459 190,585101 82,710459 8,18448307 66,528367
  25,489669 44,783471 45,979339 94,3504135 42,979339 43,7225599 34,783471
  16,611286 30,978057 27,722571 48,9341716 24,422571 58,0446098 19,978057
  68,656392 114,65023 131,31278 295,950682 127,71278 33,0313856 102,65023
  57,345683 96,953093 108,19137 238,859279 104,29137 47,1724935 83,953093
  42,703269 73,92523 78,406537 165,775689 74,206537 139,668665 59,92523
  67,047029 113,27525 126,59406 279,825739 122,09406 103,442781 98,275246
  21,034333 40,054933 34,068667 56,1648 29,268667 62,7429696 24,054933
  95,727531 159,96405 182,95506 411,892148 177,85506 53,1985013 142,96405
  20,579119 40,126591 32,158238 48,3797723 26,758238 228,883821 22,126591
  50,868648 88,989837 92,237297 190,969512 86,537297 214,210478 69,989837
  119,96948 199,95117 229,93896 519,853511 223,93896 178,778845 179,95117
               
               
Вариант8 Вариант9 Вариант10 Вариант11 Вариант12 Вариант13 Вариант14 Вариант15
               
y y y y y y y y
21,695639 24,869549 783,29121 1707,4736 981,86401 20,3408 26,1760002 36,3464
40,338206 45,922758 425,15201 925,91498 534,440016 22,902738 30,1284219 41,579791
20,88757 19,359462 40,302023 76,570038 53,6275292 62,278542 80,098178 111,23745
20,017823 16,022279 522,35548 1155,906 656,444349 59,150609 76,9382611 106,51357
52,025056 53,78132 242,96625 535,42405 307,457808 36,138035 48,922544 66,991562
127,43815 145,79769 506,39387 1136,4802 636,99234 91,12833 118,410413 163,97458
145,48622 166,10778 613,42879 1389,3565 771,035981 132,24247 170,553087 236,67432
132,37245 147,46556 141,86694 317,31938 181,833674 37,966735 53,4584185 72,441786
40,140049 29,925062 211,27436 481,39308 268,842952 64,240944 87,0511795 119,17165
99,460128 101,82516 516,34083 1198,1286 650,426038 175,44694 226,808679 314,53215
124,33824 130,6728 315,48732 736,76757 399,609149 123,46071 162,575884 224,30624
87,527451 82,409314 341,46934 806,23969 432,33668 150,62972 197,287149 272,60201
112,00027 110,75034 213,78433 508,91797 272,980407 263,74801 339,435011 471,30902
256,5439 289,17988 131,93554 316,92074 170,919431 216,42683 281,03354 389,24696
202,80511 219,75639 94,43968 229,62722 124,2996 62,663808 89,5797601 120,91166
143,10056 142,8757 163,55779 404,77868 210,947233 275,70519 356,631489 494,48408
131,14649 125,68311 98,8034 248,44115 130,25425 80,419904 113,27488 153,48483
396,86081 455,57601 243,50292 621,28016 311,37865 349,05014 449,812677 624,33775
376,15036 427,43796 42,839351 113,25166 60,7991882 47,807031 74,0087893 97,912305
324,99832 361,2479 111,32145 295,96881 146,651814 121,32145 166,651814 227,31254

Отчет должен содержать:

1) Теоретические основы и содержание тестов;

2) Результаты тестирования по данным табл.1;

3) Результаты тестирования по варианту выбранного задания.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: