Вопросы для изучения
1. Гетероскедастичность, ее причины и последствия.
2. Методы обнаружения гетероскедастичности: тест ранговой корреляции Спирмена, тест Глейзера, тест Голдфелда – Квандта.
3. Коррекция на гетероскедастичность: обобщенный МНК и его различные варианты.
Контрольные вопросы
1. В чем суть гомоскедастичности и гетероскедастичности?
Каковы последствия гетероскедастичности?
2. В чем заключается тест Спирмена?
3. Приведите схему теста Голдфелда-Квандта.
4. Каково предположение теста Парка.
5. В чем суть метода взвешенных наименьшихквадратов?
6. Какие типы преобразований применяются для устранения гетероскедастичности?
Практические задания
Задача 1*. Имеется информация о поступлении доходов в консолидированный бюджет Санкт-Петербурга (млрд. руб.) в зависимости от численности работающих на крупных и средних предприятиях (тыс. чел.) по 20 районам (табл. 3.12):
Таблица 3.12
№ района | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
3 | 6 | 8 | 18 | 20 | 23 | 39 | 49 | 60 | 74 | |
4,4 | 8,1 | 12,9 | 20,8 | 15,5 | 28,8 | 37,5 | 48,7 | 68,6 | 74,0 |
|
|
№ района | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 |
79 | 95 | 106 | 112 | 115 | 125 | 132 | 149 | 157 | 282 | |
90,5 | 88,3 | 132,4 | 122,0 | 99,1 | 114,2 | 150,6 | 156,1 | 201,5 | 342,9 |
Задание:
1) построить оценку парной регрессии по всей выборке;
2) построить график и визуально проверить наличие гетероскедастичности;
3) применить к полученным результатам тест ранговой корреляции Спирмена (уровень значимости 0,05);
4) проверить наличие гетероскедастичности, используя тест Голдфелда-Квандта (уровень значимости 0,05);
5) если предположить, что имеется гетероскедастичность и дисперсии отклонений пропорциональны значениям , построить новое уравнение регрессии с помощью взвешенного метода наименьших квадратов;
6) сравнить результаты, полученные в п.1 и п.5.
Задача 2*. Известны данные (в у.е.) по доходам и расходам на продовольственные товары для 30 домохозяйств (табл. 3.13):
Таблица 3.13
26,2 | 33,1 | 42,5 | 47,0 | 48,5 | 49,0 | 49,1 | 50,9 | 52,4 | 53,2 | |
10,0 | 11,2 | 15,0 | 20,5 | 21,2 | 19,5 | 23,0 | 19,0 | 19,5 | 18,0 |
54,0 | 54,8 | 59,0 | 61,3 | 62,5 | 63,1 | 64,0 | 66,2 | 70,0 | 71,5 | |
24,5 | 21,5 | 35,4 | 25,0 | 17,3 | 21,6 | 15,3 | 32,6 | 34,0 | 23,8 |
73,2 | 75,4 | 76,0 | 80,6 | 81,2 | 83,3 | 92,0 | 95,5 | 103,2 | 110,4 | |
22,5 | 27,4 | 40,0 | 23,6 | 20,0 | 40,1 | 15,5 | 39,0 | 47,4 | 21,3 |
Задание:
1) определить по МНК оценки парного уравнения регрессии и оценить качество полученного уравнения;
2) выполнить графический анализ остатков;
3) применить тест ранговой корреляции Спирмена для проверки наличия гетероскедастичности на уровне значимости 0,05;
4) применить для указанных статистических данных взвешенный метод наименьших квадратов, предполагая, что выполняется ;
5) определить, существенно ли повлияла гетероскедастичность на качество МНК- оценок.
|
|
Задача 3*. Выдвигается предположение, что средняя заработная плата наемных рабочих пропорциональна их стажу. Для анализа данного утверждения обследуется по 20 рабочих восьми категорий стажа. Получены следующие статистические данные (табл. 3.14):
Таблица 3.14
Стаж | [0;5) | [5;10) | [10;15) | [15;20) | [20;25) | [25;30) | [30;35) | [35;40] |
з/п | 10000 | 12500 | 14300 | 18700 | 25400 | 29000 | 32000 | 34300 |
Задание:
1) построить выборочное уравнение регрессии, в котором заработная плата является зависимой переменной, а стаж работы – объясняющей переменной, с использованием МНК;
2) в предположении, что дисперсия отклонений пропорциональна трудовому стажу, построить по этим же данным уравнение регрессии, используя взвешенный метод наименьших квадратов (ВМНК);
3) в предположении, что дисперсия отклонений пропорциональна квадрату величины трудового стажа, построить ВМНК уравнение регрессии;
4) какое из трех предположений относительно дисперсии отклонений наиболее реалистично?
Задача 4*. По 30 странам оценивалась регрессия расходов на образование от валового национального продукта по следующим данным (табл.3.15):
Таблица 3.15
5,67 | 10,13 | 11,34 | 18,88 | 20,94 | 22,16 | 23,83 | 24,67 | 27,56 | 27,57 | |
0,34 | 0,22 | 0,32 | 1,23 | 1,81 | 1,02 | 1,27 | 1,07 | 0,67 | 1,25 | |
40,15 | 51,62 | 57,71 | 63,03 | 66,32 | 66,97 | 76,88 | 101,85 | 115,97 | 119,49 | |
0,75 | 2,8 | 4,9 | 3,5 | 4,45 | 1,6 | 4,26 | 5,31 | 6,4 | 7,15 | |
124,15 | 140,98 | 153,85 | 169,38 | 186,33 | 211,78 | 249,72 | 261,41 | 395,52 | 534,97 | |
11,22 | 8,66 | 5,56 | 13,11 | 5,46 | 4,79 | 8,92 | 18,9 | 15,95 | 29,9 |
Задание:
1) построить выборочное уравнение линейной регрессии;
2) проверить наличие гетероскедастичности по критерию Голдфелда-Квандта (уровень значимости 0,05);
3) в предположении, что дисперсия отклонений пропорциональна величине валового национального продукта, построить по этим же данным уравнение регрессии по ВМНК;
4) сравнить модели, полученные в п.1 и п.3 и оценить их.
Задача 5*. Для обобщенной линейной регрессионной модели
имеется 10 пар наблюдений, которые представлены в таблице (табл.3.16):
Таблица 3.16
8 | 10 | 12 | 16 | 20 | 20 | 24 | 28 | 30 | 36 | |
6,8 | 6,9 | 7,3 | 7,4 | 8,6 | 8,0 | 8,8 | 8,0 | 9,9 | 10,3 |
Задание:
1) определить оценки обобщенного МНК для параметров модели, исходя из того, что имеется "чисто" гетероскедастичная модель со следующими дисперсиями ошибок:
- если , то 0,04;
- если , то 0,16;
- если , то 1,00;
2) оценить параметры модели классическим МНК. Определить ошибку, которая возникает из-за неправильной спецификации модели;
3) определить ковариационные матрицы оценок параметров, полученных обобщенным МНК и классическим МНК и сравнить их.
Задача 6. Заданы следующие значения остатков линейной модели, соответственные ранжированным значениям фактора (табл.3.17):
Таблица 3.17
Ранг | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 |
-1 | 2 | -3 | 2 | 0 | -3 | 3 | 1 | -2 | -4 | 5 | -11 | 8 | -20 | 12 | -21 | 18 | 14 |
Задание: установить, имеется ли гетероскедастичность по тесту ранговой корреляции Спирмена на уровне значимости 0,05.
Задача 7. Для линейной модели переменной относительно переменной получены следующие остатки, соотнесенные последовательным наблюдениям переменной (табл.3.18):
Таблица 3.18
1,3 | 0,9 | 0,8 | 0,7 | 1,1 | 1,0 | 1,5 | 1,0 | 0,8 | 1,4 | 1,2 | 1,1 | |
-5 | 1 | 2 | -6 | 4 | -4 | 1 | 4 | 5 | -6 | -1 | 6 | |
1,5 | 1,8 | 1,2 | 0,8 | 1,3 | 1,1 | 1,2 | 1,0 | 0,9 | 1,3 | 1,2 | 1,0 | |
-4 | 9 | -5 | -2 | 8 | -5 | 6 | -4 | 5 | 7 | -8 | 5 |
Задание: на уровне значимости 0,05 с помощью теста проверить гипотезу о равенстве дисперсий случайных ошибок.
Задача 8*. Для предприятий некоторой отрасли анализируют заработную плату (Y) сотрудников в зависимости от масштаба (количества сотрудников) предприятия (Х). Наблюдения по 30 случайно отобранным предприятиям представлены следующей таблицей (табл.3.19):
Таблица 3.19
Y | Х | |||||
75,5 80,5 85,5 93,0 102,0 | 75,5 82,0 88,5 93,5 105,5 | 77,5 84,5 90,0 97,5 107,0 | 78,5 85,0 91,0 99,0 110,5 | 80,0 85,5 95,0 102,5 115,0 | 81,0 86,5 96,0 105,0 118,5 | 100 200 300 400 500 |
|
|
Задание:
1) постройте уравнение регрессии Y на Х и оцените его качество;
2) можно ли ожидать наличие гетероскедастичности в данном случае? Ответ поясните;
3) проверьте наличие гетероскедастичности, используя тест Голфреда-Квандта. Рекомендуется использовать разбиение, при котором к=12;
4) если предположить, что гетероскедастичность имеет место и дисперсии отклонений пропорциональны значениям Х, то такое преобразование вы предложите, чтобы получить несмещенные, эффективные и состоятельные оценки?
5) постройте новое уравнение регрессии на основе преобразования. осуществленного в предыдущем пункте, и оцените его качество.
6) сравните результаты, полученные в пунктах а) и е).
Задача 9*. Исследуется зависимость между доходом (Х) домохозяйства и его расходом (Y) на продукты питания. Выборочные данные по 40 домохозяйствам представлены ниже (табл.3.20):
Таблица 3.20
Х | 25,5 | 26,5 | 27,2 | 29,6 | 35,7 | 38,6 | 39,0 | 39,3 | 40,0 | 41,9 |
Y | 14,5 | 11,3 | 14,7 | 10,2 | 13,5 | 9,9 | 12,4 | 8,6 | 10,3 | 13,9 |
Х | 42,5 | 44,2 | 44,8 | 45,5 | 45,5 | 48,3 | 49,5 | 52,3 | 55,7 | 59,0 |
Y | 14,9 | 11,6 | 21,5 | 10,8 | 13,8 | 16,0 | 18,2 | 19,1 | 16,3 | 17,5 |
Х | 61,0 | 61,7 | 62,5 | 64,7 | 69,7 | 71,2 | 73,8 | 74,7 | 75,8 | 76,9 |
Y | 10,9 | 16,1 | 10,5 | 10,6 | 29,0 | 8,2 | 14,3 | 21,8 | 26,1 | 20,0 |
Х | 79,2 | 81,5 | 82,4 | 82,8 | 83,0 | 85,9 | 86,4 | 86,9 | 88,3 | 89,0 |
Y | 19,8 | 21,2 | 29,0 | 17,3 | 23,5 | 22,0 | 18,8 | 13,7 | 14,5 | 27,3 |
Задание:
1) постройте эмпирическое уравнение регрессии Y на Х;
2) вычислите отклонения ;
3) проведите анализ модели Проведите анализ модели на гетероскедастичность по тесту ранговой корреляции Спирмена;
4) проведите графический анализ отклонений и выдвиньте предположение о зависимости дисперсии отклонений от значений Х;
5) на основании предыдущего пункта постройте новое уравнение регрессии, используя для этого ВНК.
Рекомендуемая литература
1. Бородич С.А. Эконометрика: учебное пособие. -Мн.: Новое знание, 2006. –Гл. 8.
2. Практикум по эконометрике. учебное пособие / Под ред. И. И. Елисеевой.- М.: Финансы и статистика, 2007.- Разделы 2, 3.
3. Эконометрика: учебник / Под ред. И. И. Елисеевой. 2-е изд. -М.: Финансы и статистика, 2005. - Гл. 3.
|
|