Для выбранной модели проверим предпосылку МНК о гомоскедастичности остатков, т. е. о том, что остатки регрессии имеют постоянную дисперсию

Используем метод Гольдфельдта-Квандта.

1. Упорядочим наблюдения по мере возрастания переменной х.

2. Исключим из рассмотрения 3 центральных наблюдения.

3. Рассмотрим первую группу наблюдений (малые значения фактора х) и

 определим этой группы.

4. Рассмотрим вторую группу наблюдений (большие значения фактора х)   и определим этой группы.

5. Проверим, значимо или незначимо отличаются дисперсии остатков этих групп.

Таблица 5

x

y

yx

x2

y2

1

4,1

14,2

58,22

16,81

201,64

15,47

-1,27

1,60

2

5,3

18,4

97,52

28,09

338,56

16,50

1,90

3,61

3

7,1

16,4

116,44

50,41

268,96

18,05

-1,65

2,72

4

8,5

21,7

184,45

72,25

470,89

19,26

2,44

5,97

5

10,2

18,5

188,70

104,04

342,25

20,72

-2,22

4,93

6

11,0

22,2

244,20

121,00

492,84

21,41

0,79

0,63

сумма

46,2

111,4

889,53

392,60

2115,14

111,40

0,00

19,46

среднее

7,70

18,57

148,26

65,43

352,52

18,57

0,00

3,89

    Определим параметры уравнения регрессии 1 группы:

    Уравнение регрессии 1 группы:

=11,93+0,86x

Таблица 6

x

y

yx

x2

y2

10

18,3

28,2

516,06

334,89

795,24

27,56

0,64

0,41

11

18,6

26,1

485,46

345,96

681,21

27,85

-1,75

3,06

12

19,7

30,2

594,94

388,09

912,04

28,92

1,28

1,63

13

21,3

28,6

609,18

453,69

817,96

30,49

-1,89

3,56

14

22,1

34,0

751,40

488,41

1156,00

31,27

2,73

7,47

15

24,2

32,3

781,66

585,64

1043,29

33,32

-1,02

1,03

сумма

124,2

179,4

3738,70

2596,68

5405,74

179,40

0,00

17,17

среднее

20,70

29,90

623,12

432,78

900,96

29,90

0,00

3,43

    Параметры уравнения регрессии 2 группы:

    Уравнение регрессии 2 группы:

=9,7+0,98x

S1= 19.46 >S2= 17.17

Fфакт.< Fтабл.

    следовательно, остатки гомоскедастичны, предпосылки МНК не нарушены.

5. Рассчитаем прогнозное значение результата у, если прогнозное значение фактора  х  увеличивается на 5% от его среднего уровня.

    Точечный прогноз:

11,59+0,87–1,05–14,13=24,515 млн. руб.

Для данной величины выпуска продукции прогнозное значение затрат на производство составляет 24,515 млн. руб.

Для уровня значимости α= 0,05 определим доверительный интервал прогноза.

Предварительно определим стандартные ошибки коэффициента корреляции и параметра b.

    Стандартная ошибка коэффициента корреляции:

    Ошибка прогноза:

Доверительный интервал прогноза значений y при  с вероятностью 0,95 составит:

Прогноз надежный, но не очень точный, т. к. .

Варианты заданий.

Вариант № 1

1 2 3 4 5 6 7 8 9 10
162 151 190 178 161 175 144 191 160 161
95 107 125 111 89 97 95 131 92 102

 

Вариант № 2

1 2 3 4 5 6 7 8 9 10
131 124 152 150 139 157 129 160 135 153
85 91 115 111 94 115 95 130 90 122

 

Вариант № 3

1 2 3 4 5 6 7 8 9 10
118 111 126 114 118 129 126 122 105 113
98 98 118 103 95 121 99 114 93 107

 

Вариант № 4

1 2 3 4 5 6 7 8 9 10
120 112 133 123 126 140 131 133 114 120
88 87 110 101 93 118 93 111 93 102

 

Вариант № 5

1 2 3 4 5 6 7 8 9 10
130 122 145 134 137 152 141 144 124 132
91 90 113 104 97 121 96 114 97 106

 

Вариант № 6

1 2 3 4 5 6 7 8 9 10
124 117 138 128 131 145 136 138 119 125
95 94 117 108 101 125 101 119 101 110

 

Вариант № 7

1 2 3 4 5 6 7 8 9 10
137 128 156 148 149 162 152 156 134 142
89 87 113 108 100 119 97 115 97 106

 

Вариант № 8

1 2 3 4 5 6 7 8 9 10
147 138 164 157 160 175 163 168 145 154
99 97 120 115 110 130 107 125 107 99

 

Вариант № 9

1 2 3 4 5 6 7 8 9 10
118 130 159 138 140 152 158 145 141 127
69 87 112 95 88 105 100 100 101 99

 

Вариант № 10

1 2 3 4 5 6 7 8 9 10
107 97 115 106 130 135 114 107 108 117
59 55 73 66 83 95 59 65 72 83

 

Вариант № 11

1 2 3 4 5 6 7 8 9 10
117 108 125 118 137 130 141 107 108 116
67 65 82 77 90 87 88 61 69 79

 

Вариант № 12

1 2 3 4 5 6 7 8 9 10
134 125 143 136 156 148 160 124 126 125
78 76 93 88 101 98 99 72 80 80

 

Вариант № 13

1 2 3 4 5 6 7 8 9 10
129 121 139 132 152 144 156 119 121 119
79 77 94 89 102 99 100 73 81 79

 

Вариант № 14

1 2 3 4 5 6 7 8 9 10
136 129 139 140 154 145 160 154 139 137
67 67 74 77 83 79 83 90 80 79

 

Вариант № 15

1 2 3 4 5 6 7 8 9 10
150 129 133 145 141 147 146 132 134 145
87 73 74 88 76 87 75 74 81 93

 

Вариант № 16

1 2 3 4 5 6 7 8 9 10
130 119 113 135 131 137 136 112 124 135
67 63 54 78 66 77 65 54 71 83

 

Вариант № 17

1 2 3 4 5 6 7 8 9 10
149 110 118 124 161 147 136 122 134 142
86 54 59 67 96 87 65 64 81 90

 

Вариант № 18

1 2 3 4 5 6 7 8 9 10
161 133 140 134 164 137 159 132 139 149
98 77 81 77 99 77 88 74 86 97

 

Вариант № 19

1 2 3 4 5 6 7 8 9 10
164 169 153 145 161 143 160 132 149 151
101 113 94 88 96 83 89 74 96 99

 

Вариант № 20

1 2 3 4 5 6 7 8 9 10
146 130 131 115 139 131 138 129 124 127
112 100 97 78 99 96 90 96 96 101

 

Вариант № 21

1 2 3 4 5 6 7 8 9 10
155 142 146 157 147 141 158 147 136 143
101 93 94 112 88 87 95 97 89 100

 

Вариант № 22

1 2 3 4 5 6 7 8 9 10
124 118 123 126 138 132 149 146 117 140
65 66 69 76 80 79 87 99 68 65

 

Вариант № 23

1 2 3 4 5 6 7 8 9 10
121 100 108 122 125 118 145 125 105 128
77 59 66 87 79 77 98 88 69 99

 

Вариант № 24

1 2 3 4 5 6 7 8 9 10
128 105 116 134 135 128 158 136 108 133
65 48 57 78 70 68 89 79 55 82

 

Вариант № 25

1 2 3 4 5 6 7 8 9 10
107 108 104 106 119 125 120 125 106 105
43 51 44 49 53 65 49 67 53 52

 

Вариант № 26

1 2 3 4 5 6 7 8 9 10
107 108 104 106 119 125 120 125 106 105
43 51 44 49 53 65 49 67 53 52

 

Вариант № 27

1 2 3 4 5 6 7 8 9 10
150 138 140 131 153 150 160 138 140 145
95 89 88 79 97 100 99 87 96 103

 

Вариант № 28

1 2 3 4 5 6 7 8 9 10
143 134 134 142 156 159 130 147 144 129
93 87 77 81 100 101 88 97 85 79

 

Вариант № 29

1 2 3 4 5 6 7 8 9 10
129 119 110 119 139 130 126 132 117 121
93 87 77 81 100 101 88 97 85 79

 

Вариант № 30

1 2 3 4 5 6 7 8 9 10
126 112 110 129 128 126 123 112 122 128
82 71 70 86 79 89 77 65 83 80

 

Работа № 2.

 

  Построение моделей в условиях мультиколлинеарности независимых переменных.

    Имеются данные о заработной плате у (тысяч рублей), возрасте х1 (лет), стаже работы по специальности х2 (лет) и выработке х3 (штук в смену) по 15 рабочим цеха:

y х1 х2 х3
1 3,2 30 6 12
2 4,5 41 18 20
3 3,3 37 11 12
4 3,0 33 9 18
5 2,8 24 4 15
6 3,9 44 19 17
7 3,7 37 18 17
8 4,2 39 22 26
9 4,7 49 30 26
10 4,4 48 24 22
11 2,9 29 8 18
12 3,7 31 6 20
13 2,4 26 5 10
14 4,5 47 19 20
15 2,6 29 4 15

    Требуется:

1. С помощью определителя матрицы парных коэффициентов межфакторной корреляции оценить мультиколлинеарность факторов,
исключить из модели фактор, ответственный за мультиколлинеарность.

2. Построить уравнение множественной регрессии в стандартизованной
форме:

2.1. Оценить параметры уравнения.

2.2. Используя стандартизованные коэффициенты регрессии
     сравнить факторы по силе их воздействия на результат.

2.3. Оценить тесноту связи между результатом и факторами с помощью коэффициента множественной корреляции.

2.4. Оценить с помощью коэффициента множественной
    детерминации качество модели.

2.5. Используя F-критерий Фишера оценить статистическую
значимость присутствия каждого из факторов в уравнении регрессии.

3. Построить уравнение множественной регрессии в естественной форме, пояснить экономический смысл параметров уравнения.

4. Найти среднюю ошибку аппроксимации.

5. Рассчитать прогнозное значение результата, если прогнозное значение факторов составит: х1 = 35 лет, х2 = 10 лет, х3 = 20 штук в смену.

 

    Решение.

 

    Для оценки мультиколлинеарности факторов используем определитель матрицы парных коэффициентов корреляции между факторами.

    Определим парные коэффициенты корреляции.

    Для этого рассчитаем таблицу 7.

Используя рассчитанную таблицу, определяем дисперсию y, x1, x2, x3.

Найдем среднее квадратическое отклонение признаков y, x1, x2, x3, как корень квадратный из соответствующей дисперсии.

Определим парные коэффициенты корреляции:

 

 


 

 

таблица 7

y

y2

x1

x12

x2

x22

x3

x32

yx1 yx2 yx3 x1x2 x1x3 x2x3 Аi

1

3,2

10,24

30

900

6

36

12

144

96,0 19,2 38,4 180 360 72 2,87 0,33 10,18

2

4,5

20,25

41

1681

18

324

20

400

184,5 81,0 90,0 738 820 360 4,00 0,50 11,03

3

3,3

10,89

37

1369

11

121

12

144

122,1 36,3 39,6 407 444 132 3,32 -0,02 0,73

4

3,0

9,00

33

1089

9

81

18

324

99,0 27,0 54,0 297 594 162 3,38 -0,38 12,79

5

2,8

7,84

24

576

4

16

15

225

67,2 11,2 42,0 96 360 60 2,65 0,15 5,47

6

3,9

15,21

44

1936

19

361

17

289

171,6 74,1 66,3 836 748 323 4,04 -0,14 3,54

7

3,7

13,69

37

1369

18

324

17

289

136,9 66,6 62,9 666 629 306 3,59 0,11 3,03

8

4,2

17,64

39

1521

22

484

26

676

163,8 92,4 109,2 858 1014 572 4,19 0,01 0,20

9

4,7

22,09

49

2401

30

900

26

676

230,3 141,0 122,2 1470 1274 780 4,83 -0,13 2,86

10

4,4

19,36

48

2304

24

576

22

484

211,2 105,6 96,8 1152 1056 528 4,56 -0,16 3,61

11

2,9

8,41

29

841

8

64

18

324

84,1 23,2 52,2 232 522 144 3,13 -0,23 7,82

12

3,7

13,69

31

961

6

36

20

400

114,7 22,2 74,0 186 620 120 3,36 0,34 9,17

13

2,4

5,76

26

676

5

25

10

100

62,4 12,0 24,0 130 260 50 2,51 -0,11 4,65

14

4,5

20,25

47

2209

19

361

20

400

211,5 85,5 90,0 893 940 380 4,39 0,11 2,46

15

2,6

6,76

29

841

4

16

15

225

75,4 10,4 39,0 116 435 60 2,97 -0,37 14,17

σ

53,8

201,08

544

20674

203

3725

268

5100

2030,7 807,7 1000,6 8257 10076 4049 53,80 0,00 91,69

ср.

3,59

13,41

36,27

1378,27

13,53

248,33

17,87

340,00

135,38 53,85 66,71 550,47 671,73 269,93 3,59 0,00 6,11

Матрица парных коэффициентов корреляции:

 

y

x1

x2

x3

y

1,000

 

 

 

x1

0,908

1,000

 

 

x2

0,894

0,931

1,000

 

x3

0,783

0,657

0,765

1,000

    Анализируем матрицу парных коэффициентов корреляции.

ú rx1x2 =0.931, т. е. между факторами x1 и x2 существует сильная корреляционная связь, один из этих факторов необходимо исключить.

ú rx1x3 =0.657 меньше, чем rx2x3 =0.765, т.е. корреляция фактора х2 с фактором х3 сильнее, чем корреляция факторов х1 и х3.

ú Из модели следует исключить фактор х2, т.к. он имеет наибольшую тесноту связи с х3 и, к тому же, менее тесно (по сравнению с x1) связан с результатом у (0.894<0.908).

2.1. Уравнение регрессии в естественной форме будет иметь вид:

yx = a + blx]+b3x3,

фактор х2  исключен из модели.

Стандартизованное уравнение:

ty = β1tx13tx3

где:   ty, tx1, tx3 – стандартизованные переменные.

Параметры уравнения β1 и β3 определим методом наименьших квадратов из системы уравнений:

Или:

Систему решаем методом Крамера:

∆=

1

0,657

= 1-0,6572= 0,568

0,657

1

 

∆β1=

0,908

0,657

= 0,908-0,657–0,783=0,394

0,783

1

 

∆β3=

1

0,571

=0,833-0,571–0,413= 0,186

0,413

0,833

    Тогда:

Получили уравнение множественной регрессии в стандартизованном масштабе:

ty = 0,693tx1+0,327tx3

Коэффициенты β1 и β3 сравнимы между собой в отличии от коэффициентов чистой регрессии b1 и b3.

β1= 0,693 больше β3= 0,327, следовательно, фактор x1 сильнее влияет на результат y чем фактор x3.

Определим индекс множественной корреляции:

Cвязь между y и факторами x1, x3 характеризуется как тесная, т. к. значение индекса множественной корреляции близко к 1.

    Коэффициент множественной детерминации:

R 2yx1x3 =(0.941)2=0.886

    Т. е. данная модель объясняет 88,6% вариации y, на долю неучтенных в модели факторов приходится 100-88,6=11,4%

Оценим значимость полученного уравнения регрессии с помощью F -критерия Фишера:

Fтабл(α= 0,05; k1= 2; k2= 15-2-1=12 )= 3,88

Табличное значение критерия Фишера (определяем по таблице значений критерия Фишера при заданном уровне значимости α  и числе степеней свободы k1 и k2) меньше фактического значения критерия.      следовательно, гипотезу H0 о том, что полученное уравнение статистически незначимо и ненадежно, отвергаем и принимаем альтернативную гипотезу H1: полученное уравнение статистически значимо, надежно и пригодно для анализа и прогноза.

Оценим статистическую значимость включения в модель факторов x1 и x2.

Fтабл (α= 0,05; k1= 1; k2= 15-2-1=12 )= 4,75

Fx1 >Fтабл.

Fx3 >Fтабл.

    Значит, включение в модель факторов x1 и x3 статистически значимо.

Перейдем к уравнению регрессии в естественном масштабе:

Уравнение множественной регрессии в естественном масштабе:

Экономическая интерпретация параметров уравнения:

b1 =0.064, это значит, что с увеличением x1 – возраста рабочего на 1 год заработная плата рабочего увеличивается в среднем на 64 рубля, если при этом фактор x2 - выработка рабочего не меняется и фиксирован на среднем уровне.

b3 =0,053, это значит, что с увеличением x3 – выработки рабочего на 1 шт. в смену, заработная плата рабочего увеличивается в среднем на 53 рубля, если при этом фактор x1 - возраст рабочего не меняется и фиксирован на среднем уровне.    

a =0,313 не имеет экономической интерпретации, формально это значение результата y при нулевом значении факторов, но факторы могут и не иметь нулевого значения.

Найдем величину средней ошибки аппроксимации, таблица 7.

    Ошибка аппроксимации Аi, i =1…15:

    Средняя ошибка аппроксимации:

    Ошибка небольшая, качество модели высокое.

Используем полученную модель для прогноза.

    Если х1 =35, х2 =10, х3 =20, то

ур = 0,313 + 0,064•35 + 0,053•20 = 3,618 тыс. руб.

    Вывод. Для рабочего данного цеха, возраст которого 35 лет, а выработка 20 шт. в смену, прогнозное значение заработной платы - 3618 руб.

 








Варианты заданий.

Вариант № 1

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow