Исходные данные по эконометрическому моделированию стоимости квартир
№ | Цена квартиры | Город области | Число комн. в кв. | Общая площадь |
тыс. $USD | 1-Подольск 0-Люберцы | кв.м. | ||
Y | X1 | X2 | X3 | |
115,00 | 70,40 | |||
85,00 | 82,80 | |||
69,00 | 64,50 | |||
57,00 | 55,10 | |||
184,60 | 83,90 | |||
56,00 | 32,20 | |||
85,00 | 65,00 | |||
265,00 | 169,00 | |||
60,65 | 74,00 | |||
130,00 | 87,00 | |||
46,00 | 44,00 | |||
115,00 | 60,00 | |||
70,96 | 65,70 | |||
39,50 | 42,00 | |||
78,90 | 49,30 | |||
60,00 | 64,50 | |||
100,00 | 93,80 | |||
51,00 | 64,00 | |||
157,00 | 98,00 | |||
123,50 | 107,50 | |||
55,20 | 48,00 | |||
95,50 | 80,00 | |||
57,60 | 63,90 | |||
64,50 | 58,10 | |||
92,00 | 83,00 | |||
100,00 | 73,40 | |||
81,00 | 45,50 | |||
65,00 | 32,00 | |||
110,00 | 65,20 | |||
42,10 | 40,30 | |||
135,00 | 72,00 | |||
39,00 | 36,00 | |||
57,00 | 61,50 | |||
80,00 | 35,50 | |||
61,00 | 58,10 | |||
69,60 | 83,00 | |||
250,00 | 152,00 | |||
64,50 | 64,50 | |||
125,00 | 54,00 | |||
152,30 | 89,00 |
Решение.
1. Расчет матрицы парных коэффициентов корреляции выполнен при помощи надстройки MS Excel «Пакет анализа», функция «Корреляция» Матрица представлена в Таблице 2
|
|
Таблица 2
Y | X1 | X2 | X3 | |
Y |
|
|
| |
X1 | -0,40346 |
|
| |
X2 | 0,688389 | -0,155005943 |
| |
X3 | 0,845531 | -0,082018234 | 0,806625894 |
Расчет парных коэффициентов корреляции произведены по формуле:
Оценка значимости производилась по t-статистике.
t табл вычислено с использованием функции СТЬЮДРАСПОБР
Таблица 3
| r | r**2 | n | n-2 | t набл | t табл | Уровень значимости α |
YX1 | -0,403 | 0,16 | 2,718 | 2,024 | 0,05 | ||
YX2 | 0,688 | 0,47 | 5,850 | 2,024 | 0,05 | ||
YX3 | 0,846 | 0,71 | 9,762 | 2,024 | 0,05 | ||
X1X2 | -0,155 | 0,02 | 0,967 | 2,024 | 0,05 | ||
X1X3 | -0,082 | 0,01 | 0,507 | 2,024 | 0,05 | ||
X2X3 | 0,807 | 0,65 | 8,413 | 2,024 | 0,05 |
Наиболее тесно связанный с результативным признак – X3 (общая площадь квартиры). Все факторы, согласно t-статистики по отношению к результативному являются значимыми. Наиболее тесная связь – между результативным признаком и X3 (общей площадью квартиры). Обнаружена мультиколлинеарность – корреляционная значимая связь между X2(количеством комнат) и X3(общей площадью), что очевидно.
Корреляция результативного признака и X1(город) – отрицательна. Это означает, что Люберцы (0) ценятся больше Подольска (1), что логично – объясняется удаленностью. Корреляция Y,X2,X3 положительна, что также логично - чем больше комнат и чем больше площадь, тем больше ценится квартирка.
2. Поле корреляции результативного признака и наиболее тесно связанного с ним фактора(X3-общая площадь) представлено на Рис.1. Аномальных данных не обнаружено.
Рис.1
3. Расчет параметров парной линейной парной регрессии для всех факторов X производился с использованием инструмента Анализа данных «Регрессия». Результаты сведены в Таблицу 4.
|
|
Таблица 4
Модель | Коэффициент детерминации | F-критерий Фишера | Индекс корреляции | Средняя относительная ошибка | F табличн | Адекватность |
YX1 | 0,163 | 7,388 | 0,403 | 36,96% | 3,25 | Адекватна |
YX2 | 0,474 | 34,227 | 0,688 | 27,90% | 3,25 | Адекватна |
YX3 | 0,715 | 95,297 | 0,846 | 27,90% | 3,25 | Адекватна |
YX1X3 | 0,827 | 88,628 | 0,910 | 19,62% | 3,25 | Адекватна |
Уравнения регрессии:
1. Y=117,504-41,510X1
2. Y= 13,151+33,54X2
3. Y= 13,301+1,545X3
4. Y= 10,087-34,608X1+1,495X3
4. Таблица 3 содержит параметры парной регрессии. Лучшей моделью следует признать модель парной регрессии которая учитывает фактор X3 (общая площадь квартиры).
5. Прогнозное значение результативного признака (стоимости квартиры) определим по уравнению линейной модели, признанной наилучшей:
Y= 13,301+1,545X3; Согласно заданию прогнозное значение фактора X3 составляет 80% от его максимального значения при уровне значимости α=0,1.
X3max =169,00. X3прогн=0,8* X3max=0,8*169,00=135,2
Y= 13,301+1,545X3=222,185 ($ USD)
Ширина доверительного интервала рассчитывается по формулам:
27,861
Коэффициент Стьюдента tα для m = n - 2 = 38 и уровня значимости 0,1 равен 1,686. (использована функция СТЬЮДРАСПОБР)
Результаты расчета сведены в Таблицу 5
Таблицу 5
X3 прогн | 135,200 |
Y прогн | 222,185 |
Sy | 27,861 |
Tтабл | 1,686 |
X3 средн | 69,193 |
(Xпр-Xср)**2 | 4356,990 |
∑((Xi-Xср)**2) | 30970,268 |
U | 50,715 |
Ymin | 171,470 |
Ymax | 272,900 |
Таким образом с вероятностью 90% можно утверждать, что при 80% от максимального фактора X3(площадь квартиры) стоимость будет находится в доверительном интервале от 171,47$USD до 272,900 $USD.
Графическое представление фактических и модельных значений приведено на Рис.2
Рис.2
6. Используем пошаговую множественную регрессию – метод исключения, строим более точную многофакторную модель. Таблица парной корреляции (Таблица 2) указывает на мультиколлинеарность в модели – тесную связь между объясняющими факторами X2 и X3.
Исключаем из модели фактор X2 – количество комнат. Таблица парной корреляции примет следующий вид (Таблица 6):
Таблица 6.
Y | X1 | X3 | |
Y |
|
| |
X1 | -0,403 |
| |
X3 | 0,846 | -0,082 |
Таблица 4 дает представление о том, что многофакторная модель улучшила показатели, модель стала более достоверной. Однако и теперь она несовершенна, т.к. средняя относительная ошибка составляет 19,6%, что слишком много (должно быть меньше 7%).
Расчет коэффициентов эластичности, β и ∆ - коэффициентов приведен в Таблице 7. Расчет производился по формулам:
где Sx j — среднеквадратическое отклонение фактора j
— коэффициент парной корреляции между фактором j (j = 1,...,m) и зависимой переменной.
Таблица 7
Среднее Y | 93,64 |
Sy | 51,51 |
Sx1 | 0,50 |
Sx3 | 28,18 |
a1 | -34,608 |
a2 | 1,495 |
Коэффициент эластичности Эyx1 | -0,213 |
Коэффициент эластичности Эyx3 | 1,105 |
Бета коэффициент βyx1 | -0,336 |
Бета коэффициент βyx3 | 0,818 |
Дельта коэффициент ∆yx1 | 0,164 |
Дельта коэффициент ∆yx3 | 0,836 |
Коэффициент парной корреляции ryx1 | -0,403 |
Коэффициент парной корреляции ryx3 | 0,846 |
Коэффициент детерминации R**2 | 0,827 |
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент. Из полученных данных видно, что большим влиянием обладает фактор X3 – жилая площадь.
Бета-коэффициент показывает, на какую часть величины среднего квадратического отклонения Sy изменится зависимая переменная Y с изменением соответствующей независимой переменной Хj на величину своего среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных. Наблюдаем большее влияние фактора X3.
Указанные коэффициенты позволяют упорядочить факторы по степени влияния факторов на зависимую переменную.
|
|
Долю влияния фактора в суммарном влиянии всех факторов можно оценить по величине дельта – коэффициентов. Наблюдаем большее влияние фактора X3.
Вспомогательные расчеты приведены в Таблице 8.
№ | Y | X1 | X3 | Y-Yср | (Y-Yср)**2 | X1-X1ср | (X1-X1ср)**2 | X2-X2ср | (X2-X2ср)**2 | ||
115,00 | 70,40 | 21,36 | 456,45 | -0,58 | 0,33 | 1,21 | 1,46 | ||||
85,00 | 82,80 | -8,64 | 74,57 | 0,43 | 0,18 | 13,61 | 185,16 | ||||
69,00 | 64,50 | -24,64 | 606,90 | 0,43 | 0,18 | -4,69 | 22,02 | ||||
57,00 | 55,10 | -36,64 | 1342,14 | 0,43 | 0,18 | -14,09 | 198,60 | ||||
184,60 | 83,90 | 90,96 | 8274,59 | -0,58 | 0,33 | 14,71 | 216,31 | ||||
56,00 | 32,20 | -37,64 | 1416,41 | 0,43 | 0,18 | -36,99 | 1368,45 | ||||
85,00 | 65,00 | -8,64 | 74,57 | -0,58 | 0,33 | -4,19 | 17,58 | ||||
265,00 | 169,00 | 171,36 | 29365,88 | -0,58 | 0,33 | 99,81 | 9961,54 | ||||
60,65 | 74,00 | -32,99 | 1088,03 | 0,43 | 0,18 | 4,81 | 23,11 | ||||
130,00 | 87,00 | 36,36 | 1322,40 | -0,58 | 0,33 | 17,81 | 317,11 | ||||
46,00 | 44,00 | -47,64 | 2269,12 | 0,43 | 0,18 | -25,19 | 634,66 | ||||
115,00 | 60,00 | 21,36 | 456,45 | -0,58 | 0,33 | -9,19 | 84,50 | ||||
70,96 | 65,70 | -22,68 | 514,17 | -0,58 | 0,33 | -3,49 | 12,20 | ||||
39,50 | 42,00 | -54,14 | 2930,63 | 0,43 | 0,18 | -27,19 | 739,43 | ||||
78,90 | 49,30 | -14,74 | 217,13 | -0,58 | 0,33 | -19,89 | 395,71 | ||||
60,00 | 64,50 | -33,64 | 1131,33 | 0,43 | 0,18 | -4,69 | 22,02 | ||||
100,00 | 93,80 | 6,36 | 40,51 | 0,43 | 0,18 | 24,61 | 605,53 | ||||
51,00 | 64,00 | -42,64 | 1817,76 | 0,43 | 0,18 | -5,19 | 26,96 | ||||
157,00 | 98,00 | 63,36 | 4015,09 | -0,58 | 0,33 | 28,81 | 829,87 | ||||
123,50 | 107,50 | 29,86 | 891,90 | 0,43 | 0,18 | 38,31 | 1467,46 | ||||
55,20 | 48,00 | -38,44 | 1477,27 | -0,58 | 0,33 | -21,19 | 449,12 | ||||
95,50 | 80,00 | 1,86 | 3,48 | 0,43 | 0,18 | 10,81 | 116,80 | ||||
57,60 | 63,90 | -36,04 | 1298,54 | -0,58 | 0,33 | -5,29 | 28,01 | ||||
64,50 | 58,10 | -29,14 | 848,86 | 0,43 | 0,18 | -11,09 | 123,04 | ||||
92,00 | 83,00 | -1,64 | 2,67 | 0,43 | 0,18 | 13,81 | 190,65 | ||||
100,00 | 73,40 | 6,36 | 40,51 | 0,43 | 0,18 | 4,21 | 17,70 | ||||
81,00 | 45,50 | -12,64 | 159,65 | -0,58 | 0,33 | -23,69 | 561,33 | ||||
65,00 | 32,00 | -28,64 | 819,98 | 0,43 | 0,18 | -37,19 | 1383,28 | ||||
110,00 | 65,20 | 16,36 | 267,81 | -0,58 | 0,33 | -3,99 | 15,94 | ||||
42,10 | 40,30 | -51,54 | 2655,88 | 0,43 | 0,18 | -28,89 | 834,78 | ||||
135,00 | 72,00 | 41,36 | 1711,04 | -0,58 | 0,33 | 2,81 | 7,88 | ||||
39,00 | 36,00 | -54,64 | 2985,01 | 0,43 | 0,18 | -33,19 | 1101,74 | ||||
57,00 | 61,50 | -36,64 | 1342,14 | 0,43 | 0,18 | -7,69 | 59,17 | ||||
80,00 | 35,50 | -13,64 | 185,92 | -0,58 | 0,33 | -33,69 | 1135,18 | ||||
61,00 | 58,10 | -32,64 | 1065,06 | 0,43 | 0,18 | -11,09 | 123,04 | ||||
69,60 | 83,00 | -24,04 | 577,69 | 0,43 | 0,18 | 13,81 | 190,65 | ||||
250,00 | 152,00 | 156,36 | 24449,94 | 0,43 | 0,18 | 82,81 | 6857,08 | ||||
64,50 | 64,50 | -29,14 | 848,86
| 0,43 | 0,18 | -4,69 | 22,02 | ||||
125,00 | 54,00 | 31,36 | 983,75 | -0,58 | 0,33 | -15,19 | 230,81 | ||||
152,30 | 89,00 | 58,66 | 3441,55 | -0,58 | 0,33 | 19,81 | 392,34 | ||||
Сум | 3745,41 |
|
|
| 103471,62 |
| 9,78 |
| 30970,27 | ||
Сред | 93,64 | 0,58 | 69,19 |
|
|
|
|
|
|
ЗАДАЧА 2
Исследовать динамику экономического показателя на основе анализа одномерного временного ряда
В течение девяти последовательных недель фиксировался спрос на кредитные ресурсы финансовой компании. Временной ряд этого показателя приведен в Таблице 9.
Таблица 9
№ наблюдения | Y(t), млн.руб. |
1. Проверить наличие аномальных наблюдений.
2. Построить линейную модель Y(t)=a0+a1t, параметры которой оценить при помощи МНК (Y(t) – расчетные, смоделированные значения временного ряда).
3. Оценить адекватность построенных моделей, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S-критерия взять табулированные границы 2,7 ÷ 3,7).
4. Оценить точность модели на основе использования средней относительной ошибки аппроксимации.
5. Осуществить прогноз спроса на следующие две недели (доверительный интервал прогноза рассчитать при доверительной вероятности p=70%).
6. Фактические значения показателя, результаты моделирования представить графически.
Вычисления провести с тремя знаками в дробной части. Основные промежуточные результаты вычислений привести в таблицах. При использовании компьютера представить соответствующие листинги с комментариями.
1. Корреляционное поле представлено на Рис.3. Визуально - аномальных наблюдений не отмечено.