Эконометрическая модель множественной линейной регрессии

Поскольку, как было уже указано выше, рассматриваемая регрессионная модель оказалась низкокачественной, попробуем повысить значимость модели с помощью введения новой переменной Z (темпа прироста цен алюминия за период 11.01.2009-06.12.2013гг.), также являющейся фактором, влияющим на формирование премии за риск от вложения в портфель акций корпорации АВИСМА. Предполагаем эту зависимость, исходя из отрасли производства этой корпорации.

Рис. 10. Ящичковые диаграммы для параметра Z до и после удаления выбросов

Определив выбросы посредством ящичковой диаграммы (см. рис.10), избавились от них, наложив ограничения: Z>-0,0525 и Z<0,054. После удаления выбросов, число наблюдений в модели сократилось до 1041.

Подставим новый фактор в нашу модель с целью определения наилучшего варианта из моделей.

После удаления выбросов нового параметра, отвечающего за темп прироста цен алюминия, получили следующее уравнение:

Y = 1.19652794872e-05 + 0.42*X + 0.004*Z

При увеличении темпа роста цены алюминия на 1%, премия за риск от вложения в портфель акций корпорации ВСМПО-АВИСМА увеличится, в среднем, на 0,4% при прочих равных условиях. Коэффициент равный 0,04 говорит о низкой чувствительности премии за риск от вложения в портфель акций ВСМПО-АВИСМА к премии за риск от вложения в рыночный портфель акций.

Таблица 4. Модель множественной линейной регрессии

Variable Coefficient Std. Error t-Statistic Prob.
C 1.20E-05 0.000487 0.024557 0.9804
X 0.418096 0.041083 10.17697 0.0000
Z 0.004350 0.026160 0.166289 0.8680
Adjusted R-squered 0.089011  
F-statistic 51.80849
Prob(F-statistic) 0.000000

Введение дополнительной переменной (Z) в уравнение регрессии привело к уменьшению коэффициента детерминации (R2=8,9%), несмотря на то, что он имеет тенденцию увеличиваться при увеличении членов регрессии. Это несоответствие с теорией объясняется неравенством числа наблюдений в моделях (парной и множественной). Коэффициент детерминации является показателем доли объясненной вариации в полной вариации, которая представляет разные значения для моделей регрессии, в связи с чем, сравнение полученных коэффициентов детерминации не является корректным[8].

Проверим модель на значимость: p(F-statistic(=0))<α(=0,01), следовательно, со значимостью на уровне 1% можно утверждать, что данная модель значима.

Таблица 5. Корреляционная матрица между параметрами X, Y, Z

Correlation X Y Z
Probablity
X 1.000000    
------    
Y 0.301229 1.000000  
0.0000 ------  
Z 0.04814 0.006372 1.000000
0.8767 0.8373 ------

Исходя из данных корреляционной матрицы (см. табл.5) видим, что коэффициент корреляции между X и Z составляет 0,005, что не превышает |0,7|, следовательно, можно говорить о незначительной мультиколлинеарности в рамках данной эконометрической модели. С вероятностью 99% мы можем утверждать, что коэффициент корреляции между переменными X и Y значим, поскольку p(=0,00)<α(=0,01), а что касается коэффициентов корреляции между Z и X, Z и Х, они не значимы, поскольку p(=0,88)<α(=0,01) и p(=0,84)<α(=0,01) соответственно.

Таблица 6. Критерий VIF для множественной линейной модели

Variable Uncentered VIF
C 1.000833
X 1.000808
Z 1.000073

Проверив на мультиколлиниарность данную модель посредством критерия VIF, также утвердились в ее отсутствии (показатель VIF как для Х, так и для Z ниже 10).

Для оценки качества модели с нововведенной переменной, проверим, выполняются ли условия Гаусса-Маркова с помощью графического анализа остатков модели.

Рис. 11. Гистограмма с наложением нормального распределения и описательная статистика параметра RESID2

Исходя из описательной статистики сгенерированной переменной остатков (см. рис.11), p(=0,055)>α(=0,01), следовательно, благодаря тесту Jarque-Bera, можно говорить на уровне значимости 1% о том, что распределение остатков нормально, т.о. условие нормальности выполняется. Мат. ожидание стремится к нулю, следовательно, условие несмещенности также выполняется.

Исходя из графика остатков, видно, что некоторые из ошибок отклоняются больше, чем на величину среднего отклонения, поэтому можно сделать вывод о гетероскедастичности. Автокорреляция положительна. Следовательно, условие эффективности не выполняется.

Для выполнения условия состоятельности необходимо проверить выполнение равенства: cov(X,RESID2)=0 и cov(Z,RESID2)=0.

Таблица 7. Ковариационная матрица между параметрами Х, Z, RESID2

  X Z RESID2
X 0.0001405435709772897 1.062512334319649e-06 -1.9684362209391e-20
Z 1.062512334319649e-06 0.0003466126239352628 1.507782609259371e-06
RESID2 -1.9684362209391e-20 1.507782609259371e-06 0.0002462211782449991


Исходя из данных ковариационной матрицы коэффициентов ковариации между объясняющими переменными X, Z и ошибками модели RESID2 видно, что они стремятся к нулю, следовательно, условие состоятельности выполняется.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: