Оценка благосостояния населения Санкт-Петербурга по экономическим показателям

На основе данных таблицы 3 построим следующую модель множественной регрессии, используя пакет «Анализ данных» MS Excel.

Из уравнения можно заключить, что:

1) существует обратная зависимость между среднедушевыми доходами населения, прожиточным минимумом и средним размером назначенных пенсий;

2) существует прямая зависимость между среднедушевыми доходами населения, среднемесячной номинальной заработной и ВРП на душу населения.

На основе построенной модели можно сравнить прогнозные значения и фактические значения среднедушевых денежных доходов населения (рис.1).

Рисунок 1. Сравнение фактических и прогнозных значений среднедушевых денежных доходов населения (первый вариант)

На основе модели можно также построить следующий график нормальной вероятности (рис. 2).

Рисунок 2. График нормальной вероятности

Говоря о качестве модели, можно отметить, что модель обладает хорошей объясняющей способностью, о чём свидетельствует высокий коэффициент детерминации – 0,992. Так как стремится к единице, то уравнение регрессии хорошо аппроксимирует эмпирические данные и использование регрессионной модели теоретически обосновано. Коэффициент детерминации =0,992, что свидетельствует о том, что изменение зависимой переменной (среднедушевых денежных доходов населения) в основном (на 99,2 %) можно объяснить совместным влиянием включенных в модель объясняющих переменных: - прожиточный минимум, - среднемесячная номинальная заработная плата, - средний размер назначенных пенсий, - ВРП на душу населения. Скорректированный коэффициент детерминации = 0,98. В отличие от , скорректированный коэффициент детерминации может уменьшаться при введении в модель новых объясняющих переменных, не оказывающих существенного влияния на зависимую переменную. Следовательно, для оценки адекватности модели множественной регрессии предпочтительнее использовать . Этот показатель имеет высокое значение (0,98) и незначительно отличается от , что говорит о том, что модель обладает хорошей объясняющей способностью.

Одновременно с этим, проверяя значимость модели по критерию Фишера, можно сказать, что модель статистически значима на уровне значимости 5 %, т.к. , что существенно меньше полученного фактического значения: .

Говоря о значимости отдельных коэффициентов регрессии, можно сказать, что три из них статистически незначимы, поскольку для анализируемой модели составляет 3,18 при уровне значимости 5%. Коэффициент для оказывается статистически значимым (Приложение Б).

Далее проверим модель на наличие мультиколлинеарности с помощью расчёта парных показателей корреляции для каждой пары факторов. Результаты проверки представлены в следующей таблице:

Таблица 4. Таблица парных коэффициентов корреляции


	–	–	–	–
0,976		–	–	–
0,98	0,98		–	–
0,97	0,99	0,978		–
0,97	0,993	0,967	0,99

Из таблицы видно, что между собой коррелируют все рассматриваемые факторы, в связи с чем необходимо отобрать факторы, которые оказывают наиболее существенное влияние на . С этой целью будем постепенно исключать из модели факторы с наибольшим значением парного коэффициента корреляции .

Из данной таблицы видно, что наибольший парный коэффициент корреляции у переменных и . Исключим из модели фактор .

Получим новую модель:

Рассмотрим таблицу парных показателей корреляции. Из таблицы видно, что между собой коррелируют все оставшиеся факторы. Исключим теперь фактор .

Полученное уравнение имеет вид:

На основе построенной модели можно сравнить прогнозные значения и фактические значения показателя среднедушевых доходов населения Санкт-Петербурга.

Рисунок 3. Сравнение фактических и прогнозных значений

среднедушевых денежных доходов населения

Теперь проверим значимость уравнения в целом (адекватность построенной модели линейной регрессии наблюдаемым реальным данным), для этого сформулируем гипотезу . В данном случае , а . Так как , то нулевая гипотеза отвергается, т.е. линейная модель значима.

Проведем тест Дарбина-Уотсона на наличие автокорреляции в остатках. Полученное значение DW=1,68, и для и . Следовательно, . Это значит, что вывод о наличии автокорреляции не определен.

Проверим значимость коэффициентов уравнения регрессии. Коэффициент при значим, так как =2,98, что больше =2,57. Коэффициент при незначим, так как =1,13, что меньше =2,57. Его наличие среди объясняющих переменных не оправдано со статистической точки зрения. Поэтому после установления того факта, что коэффициент незначим, рекомендуется исключить из уравнения регрессии переменную .

Рассмотрим парную модель зависимости от . Корреляционное поле представлено на рис. 4.

Рисунок 4. Корреляционное поле для

По виду корреляционного поля (рис. 4) можно сделать предположение о линейной зависимости среднедушевых денежных доходов населения от среднемесячной номинальной заработной платы. Проверим гипотезу об их линейной зависимости, для этого оценим тесноту связи. Вычислим средние значения по формулам , и приведем данные, необходимые для дальнейших вычислений, в следующей таблице (табл.5):

;

Таблица 5. Расчеты коэффициента корреляции


-3824,73	-3743,35	14317284,33		1389569,44
-3285,33	-3084,15	10132435,1
-2461,13	-2338,65	5755709,981		6674472,25
-1277,33	-1454,15	1857422,149
462,075	-349,95	-161703,1463		20905012,84	213513,3
1494,875	1929,05	2883688,619		46938941,44
3183,875	3932,95	12522021,18		78412796,01
5707,675	5108,25	29156230,82	1,14E+08	100608924,16
		76463089,03	2,76E+08	270334984,1

Получим следующие значения для показателей, характеризующих тесноту связи:

=
=	3127,966	=	0,988037
=	3092,622	=	0,976216

Вывод: так как =0,988037, то мы принимаем гипотезу о линейной зависимости между и , и связь между ними - весьма высокая. Так как =0,976216, то связь между переменными достаточно сильная и использование линейной регрессионной модели обосновано.

В результате получена модель парной регрессии:

Проинтерпретируем уравнение регрессии: так как = 0,97, то можно сделать вывод о том, что при увеличении среднемесячной номинальной заработной платы на 1 руб. среднедушевые денежные доходы населения увеличатся на 0,97 руб.

Одновременно с этим, проверяя значимость модели по критерию Фишера, можно сказать, что модель статистически значима на уровне значимости 0,05, так как = 5,9, что существенно меньше полученного фактического значения: =164.

Говоря о значимости коэффициентов регрессии, можно сказать, что коэффициент статистически значим, поскольку для анализируемой модели =2,44 при уровне значимости 5 %, а =15,69.

Построим две альтернативные модели: степенную и с квадратным корнем, сравним их с линейной моделью и выберем наилучшую. Для этого прежде всего посчитаем сумму квадратов остатков (ESS) для каждой модели (табл.6-8).

1. Линейная модель.

Таблица 6. Расчет суммы квадратов остатков

, руб.	, руб.
1178,8	1147,9	1185,882	7,081877	50,15297759
	1687,3	1712,807	-125,193	15673,24396
2583,5	2511,5	2517,946	-65,5541	4297,340092
	3695,3	3674,368	206,3682	42587,81618
4572,2	5434,7	5373,541	801,3411	642147,4834
6851,2	6467,5	6382,455	-468,745	219721,418
8855,1	8156,5	8032,394	-822,706	676845,1879
10030,4	10680,3	10497,83	467,4261	218487,1233
39377,2				1819809,766

2. Степенная модель.

Рассмотрим степенную модель вида . Линеаризовав данное уравнение, получим систему линейных нормальных уравнений, решив которую получим оценки коэффициентов и уравнения степенной модели по МНК. В результате имеем значения коэффициентов: .

Следовательно, уравнение регрессии имеет вид:

Найдем сумму квадратов остатков для данной модели:

Таблица 7. Расчет суммы квадратов остатков


1192,927	14,1267206	199,5642
1731,137	-106,86348	11419,8
2542,845	-40,654796	1652,812
3693,614	225,613787	50901,58
5362,888	790,688217	625187,9
6345,172	-506,02755	256063,9
7940,636	-914,46418	836244,7
10304,72	274,318647	75250,72
	ESS=

3. Модель с квадратным корнем.

Рассмотрим модель вида . Используя систему линейных нормальных уравнений, находим оценки параметров модели: .

Следовательно, уравнение регрессии имеет вид:

Найдем сумму квадратов остатков для данной модели:

Таблица 8. Расчет суммы квадратов остатков


578,3555	-600,4445	360533,596
1530,569	-307,4307	94513,6413
2726,527	143,0271	20456,7576
4138,967	670,9669	450196,569
5850,105	1277,905	1633041,09
6736,721	-114,4787	13105,3652
8045,745	-809,3548	655055,199
9770,216	-260,1844	67695,9464
39377,21		3294598,16

Вывод: Сумма квадратов остатков равна:

· для линейной модели – 1819809,766;

· для степенной модели – 1856921;

· для модели с квадратным корнем – 3294598,16.

Наименьшей из них является сумма квадратов остатков для линейной модели. Следовательно, из рассмотренных моделей она наилучшим образом аппроксимирует исходные статистические данные.

Рассчитаем средний коэффициент эластичности для каждой из трех моделей:

Линейная модель:

Средний коэффициент эластичности равен

Степенная модель:

Средний коэффициент эластичности равен

Модель с квадратным корнем:

Средний коэффициент эластичности равен

Вывод. Найдены средние коэффициенты эластичности, наибольшим из них является средний коэффициент эластичности для линейной модели. Следовательно, из рассмотренных моделей она наилучшим образом отражает влияние на .

Оценим с помощью средней ошибки аппроксимации качество уравнений, используя следующую формулу:

В таблице 9 приведены расчеты средней ошибки аппроксимации.

Таблица 9. Расчет средней ошибки аппроксимации

Линейная	Степенная	С квадратным корнем

0,0060077	0,011984	0,509369
-0,068113616	0,058141	0,167264
-0,025374144	0,015736	0,055362
0,059506389	0,065056	0,193474
0,17526378	0,172934	0,279495
-0,06841787	0,07386	0,016709
-0,092907592	0,10327	0,0914
0,046600939	0,027349	0,02594
0,032565586	0,528329	1,339012

Тогда мы получим следующие значения средней ошибки аппроксимации для построенных моделей:

Линейная модель - A=0,41%

Степенная модель -A=6,60%

Модель с квадратным корнем - A=16,74%

Вывод. Средняя ошибка аппроксимации намного меньше для линейной модели. Следовательно, линейная модель наилучшим образом приближает имеющиеся статистические данные. Так как А=0,41%, то данная модель хорошо аппроксимирует данные.

Проведем тест Гольдфельда – Куандта для проверки гипотезы о гомоскедастичности остатков. На основе следующей таблицы (табл.10) составим статистику .

Таблица 10. Расчеты средней ошибки аппроксимации.

, руб.	, руб.
1178,8	1147,9	1147,9	1,01972	49,38858	1219,924597	-41,1246	1691,232469
	1687,3	1687,3			1769,961295	68,0387	4629,26532
2583,5	2511,5	2511,5			2610,414108	-26,9141	724,3691928
	3695,3						7044,86698
4572,2	5434,7
6851,2	6467,5	6467,5	0,732079	2403,987	7138,705868	-287,506	82659,62396
8855,1	8156,5	8156,5			8375,186885	479,9131	230316,5979
10030,4	10680,3	10680,3			10222,80725	-192,407	37020,54878
						=	349996,7706

Вывод: Значение статистика меньше табличного значения , следовательно, модель гомоскедастична.

Далее проведем тест Дарбина-Уотсона на наличие автокорреляции. Рассчитаем статистику DW, используя данные табл.11.:

Таблица 11. Расчеты статистики Дарбина-Уотсона

, руб.	,руб.				(e -e )	(e -e )
1178,8	1147,9	1185,882	-7,08188	50,15297759
	1687,3	1712,807	125,1928	15673,24396	132,2747	17496,59727
2583,5	2511,5	2517,946	65,5541	4297,340092	-59,6387	3556,77771
	3695,3	3674,368	-206,368	42587,81618	-271,922	73941,71407
4572,2	5434,7	5373,541	-801,341	642147,4834	-594,973	353992,7472
6851,2	6467,5	6382,455	468,7445	219721,418	1270,086	1613117,344
8855,1	8156,5	8032,394	822,706	676845,1879	353,9615	125288,7456
10030,4	10680,3	10497,83	-467,426	218487,1233	-1290,13	1664440,777
39377,2			-0,01969	1819809,766		3851834,703

По таблице критических точек распределения Дарбина – Уотсона для заданного уровня значимости , числа наблюдений и количества объясняющих переменных определим два значения: и .

Так как DW=2,116, то . Это говорит о том, что автокорреляция отсутствует.

Среднее значение фактора . Прогнозное значение средней заработной платы на этом уровне составит

Увеличение фактора на 5% даст значение . Тогда

В процентном отношении: . Итак, увеличение среднего значения фактора на 5% приведет к увеличению значения результата на 243 руб. или на 4,9%.

Таким образом, можно сделать вывод о том, что модель парной регрессии, которая отражает зависимость между среднемесячной заработной платой и среднедушевыми денежными доходами населения, наилучшим образом подходит для моделирования.