Тема 3.6. Фиктивные переменные (1 занятие)

Вопросы для изучения

1. Фиктивные переменные в регрессионных моделях. Правила использования фиктивных переменных.

2. ANOVA – модели и ANCOVA – модели.

3. Тест Чоу на наличие структурной перестройки.

Контрольные вопросы

1. Какие статистические данные называют неоднородными?

2. Когда применяются фиктивные переменные?

3. В чем преимущества фиктивных переменных?

4. Как фиктивные переменные включаются в модель регрессии?

5. В чем суть ANOVA-моделей?

6. В чем суть ANCOVA-моделей?

7. В чем состоит правило применения фиктивных переменных?

8. Какой смысл имеет дифференциальный свободный член?

9. Какой смысл имеет дифференциальный угловой коэффициент?

10. В чем особенность моделей с переменной структурой?

11. Какова идея теста Чоу?

12. Как сезонные переменные применяются для устранения сезонного фактора?

Практические задания

Задача 1*. Имеются следующие данные о весе  (в фунтах) и возрасте  (в неделях) 14 индеек, выращенных в областях А, В, С (табл.3.29):

 

Таблица 3.29

Область происхождения Область происхождения
1 2 3 4 5 6 7 8
1 28 12,3 A 8 26 11,8 B
2 20 8,9 A 9 21 11,5 C
3 32 15,1 A 10 27 14,2 C
4 22 10,4 A 11 29 15,4 C
5 29 13,1 B 12 23 13,1 C
6 27 12,4 B 13 25 13,8 C
7 28 13,2 B 14 24 13,4 C

 

Задание:

1) найти уравнение парной регрессии  по  и оценить его значимость;

2) введя соответствующие фиктивные переменные, найти общее уравнение множественной регрессии  по всем объясняющим переменным (включая фиктивные);

3) оценить значимость общего уравнения регрессии по F-критерию и значимость его параметров по t-критерию на уровне 0,05;

4) оценить на уровне 0,05 значимость различия между свободными членами уравнений, получаемых из общего уравнения множественной регрессии  для каждой области.

Задача 2*. На предприятии используются станки трех фирм (А, В, С). Исследуется надежность этих станков. При этом учитывается возраст станка (, в месяцах) и время безаварийной работы до последней поломки (, в часах). Выборка из 40 станков дала следующие результаты (табл.3.30):

Таблица 3.30

Фирма А В С

А

С

А

В С В А
23 30 65

69

75

63

25 75 75 52
280 230 112

176

90

176

216 110 45 200
Фирма В С

С

В

А

А

С

В А А
20 70

62

40

66

20

39

25 48 59
265 148

150

176

123

245

176

260 236 205
                             

                                                            Продолжение таблицы 3.30

Фирма А В А С В А С

В

А В
25 69 71 26 45 40 30

69

30 22
240 65 115 200 126 225 210

45

260 220
Фирма В С А В А С В А

В

А
33 48 75 21 56 58 50 37

56

67
194 156 100 240 170 116 120 240

88

120
                       

 

Задание:

1) оценить уравнение регрессии  без учета различия станков разных фирм;

2) оценить уравнение регрессии, учитывающее различие качества станков разных фирм;

3) сделать вывод о необходимости использования фиктивных переменных в этом случае.

Задача 3*. По данным о 20 рабочих цеха оценивается регрессия заработной платы рабочего за месяц  ($) от возраста рабочего  (лет) и качественного фактора - пола рабочего (табл.3.31):

Таблица 3.31

Наблюдение 1 2 3 4 5 6 7 8 9 10
29 40 36 32 23 45 38 40 50 47
300 400 300 320 200 350 350 400 380 400
пол ж м ж ж м м ж м м м
Наблюдение 11 12 13 14 15 16 17 18 19 20
28 30 25 48 30 40 40 38 29 25
250 350 200 400 220 320 390 360 260 250
пол ж м м м ж м м м ж м

 

Задание:

1) построить уравнение однофакторной регрессии без учета пола рабочего и оценить его качество, используя  и статистики;

2) введя в рассмотрение фиктивную переменную, получить двухфакторное уравнение регрессии и также оценить его качество;

3) вывести частные уравнения регрессии (отдельно для рабочих разных полов) и сделать выводы.

Задача 4. При построении линейной зависимости расходов на одежду () от располагаемого дохода () по выборке для 10 женщин получены следующие суммы квадратов:

110, 1540, 60, 448, 828.

Аналогичные вычисления сумм по выборке из 5 мужчин дали:

35, 325, 15, 61, 140.

По общей (объединенной) выборке оценена регрессия с использованием фиктивной переменной  ( =1 для мужчин и =0 для женщин), которая имеет вид:

-0,06+0,438 +0,46 .

Задание: на уровне 0,05 с использованием теста Чоу проверить гипотезу о том, что функция потребления одна и та же для мужчин и женщин.

Задача 5. Исследуется зависимость заработной платы от возраста рабочего  для мужчин и женщин. Оценивание объединенной регрессии

( 20) и отдельных регрессий для рабочих-мужчин ( 13) и рабочих-женщин ( 7) дали следующие результаты (табл. 3.32):

Таблица 3.32

Выборка Оцененное уравнение Сумма квадратов остатков
Объединенная 0,728 24888
Мужчины 0,735 18619
Женщины 0,712 5658

 

Задание: улучшилось ли качество регрессии после разделения выборки на части? Найти ответ на уровне значимости 0,05 с использованием критерия Чоу.

Задача 6*. Исследуется вопрос о наличии собственного дома ( 1, если дом имеется; 0, если дома нет) в зависимости от совокупного дохода семьи (). Выборка из 40 семей дала следующие результаты (табл. 3.33):

Таблица 3.33

Семья 1 2 3 4 5 6 7 8 9 10
10 20 22 18 9 15 25 30 40 16
0 1 1 0 0 0 1 1 1 0

 

Семья 11 12 13 14 15 16 17 18 19 20
12 8 20 19 30 50 37 28 45 38
0 0 1 0 1 1 1 1 1 1

 

Семья 21 22 23 24 25 26 27 28 29 30
30 12 16 27 19 15 32 18 43 13
1 0 0 1 0 0 1 0 1 0

 

Семья 31 32 33 34 35 36 37 38 39 40
22 14 10 17 36 45 14 22 41 34
1 0 0 0 1 1 0 1 1 1

 

Задание:

1) построить линейную вероятностную модель;

2) оценить качество построенной модели;

3) оценить вероятность того, что при доходе, равном 18, семья имеет дом.

Задача 7*. В следующей таблице представлены данные о количестве семей (), имеющих определенный уровень дохода (), и количестве семей  (), имеющих частные дома (табл. 3.34):

Таблица 3.34

10 15 20 25 30 35 40 45 50 55 60
35 45 60 80 100 130 90 65 50 30 15
5 10 18 30 45 60 55 45 38 24 13

 

Задание: Оценить logit-модель по МНК.

Задача 8*. Производитель исследует эффективность лекарств (EF) в зависимости от возраста пациентов (AG), при этом он сравнивает эффективность трех видов лекарств (А,В,С). Имеются данные по 36 пациентам (табл. 3.35):

Таблица 3.35

Вид лекарств С А В А В В A С С А С А
AG 29 53 29 58 66 67 63 59 51 67 63 33
EF 36 69 47 73 64 60 62 71 62 70 71 52
Вид лекарств А В С В С А С В В А С С
AG 33 42 67 33 23 28 19 30 23 21 56 45
EF 63 48 71 46 25 55 28 40 41 56 62 50
Вид лекарств В А С В С А В В С А А В
AG 43 38 37 43 27 43 45 48 47 48 53 58
EF 45 58 46 58 34 65 55 57 59 64 61 62

 

Задание:

1) постройте корреляционное поле для переменных AG и EF, изображая точки, соответствующие различным видам лекарств, разными символами;

2) оцените уравнение регрессии  и оцените его качество;

3) оцените уравнение регрессии , где D1 и D2 - фиктивные переменные, отражающие наличие лекарств трех видов. Проанализируйте статистическую значимость его параметров. Постройте уравнение регрессии только со значимыми факторами. Какой вывод Вы сделаете по эффективности различных видов лекарств?

4) постройте уравнение регрессии . Дайте интерпретацию построенного уравнения. Что выражается через произведения переменных?

5) какая из моделей предпочтительнее для выражения исследуемой зависимости и почему?

Задача 9. Рассматривая зависимость между доходом (Х) и сбережениями (Y) за 20 лет, исследователь заметил, что на 12-м году наблюдений экономическая ситуация изменилась, что стимулировало население к большим сбережениям по сравнению с первым этапом рассматриваемого интервала. Использовались следующие статистические данные (табл. 3.36):

Таблица 3.36

Год 75 76 77 78 79 80 81 82 83 84
Х 100 105 108 111 115 122 128 135 143 142
Y 4,7 6,1 6,5 6,8 5,2 6,5 7,5 8 9 9,1
Год 85 86 87 88 89 90 91 92 93 94
Х 147 155 167 177 188 195 210 226 238 255
Y 8,7 12 16,2 18,5 18 17,6 20 23 22,5 24,3

 

Задание:

1) постройте общее уравнение регрессии для всего интервала наблюдений, а также уравнение регрессии, учитывающее изменение ситуации в 1986 году. В последнем случае уравнение регрессии имеет вид:

Здесь фиктивная переменная D1 принимает значения 0 и 1 соответственно до и после изменения экономических условий. Коэффициенты при факторах, содержащих фиктивную переменную, называются соответственно дифференциальным свободным членом и дифференциальным угловым коэффициентом соответственно. Рассматриваемая зависимость фактически разбивается на две части, связанные с периодами изменения рассматриваемого в модели качественного фактора;

2) проверьте с помощью теса Чоу необходимость разбиения интервала наблюдений на два подинтервала и построения для каждого из них отдельного уравнения (принять уровень значимости 0,05).

Рекомендуемая литература

1. Бородич С.А. Эконометрика: учебное пособие. -Мн.: Новое знание, 2006. –Гл. 11.

2. Практикум по эконометрике: учебное пособие / Под ред. И. И. Елисеевой.- М.: Финансы и статистика, 2007. - Разделы 2,3.

3.Эконометрика: учебник /Под ред. И. И. Елисеевой. 2-е изд. -М.: Финансы и статистика, 2005. - Гл. 3.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: