Задание для выполнения самостоятельной работы

Пусть имеются данные, аналогичные рассмотренным в тренировочном примере (n=21, y – потребление, х – доходы), для которых рассчитано уравнение регрессии и другие характеристики, необходимые для их полного анализа с помощью парной регрессии и корреляции.

Ниже приведены результаты расчетов (рис.12) и (рис.13).

Описательные статистики рассчитаны отдельно:

=5,1, =4,95, Sx=2.1, Sy=1,4.

 

Рис. 13. Уравнение парной регрессии для примера

 

 

Рис. 14. График остатков для примера

Выписать уравнение регрессии и провести полный анализ его точности в соответствии с рассмотренным тренировочным примером.

Проверить равенства: = = и прокомментировать их смысл.

Прокомментировать смысл коэффициента регрессии (склонность к потреблению), рассчитать мультипликатор и коэффициент средней эластичности и привести их содержательный анализ.

Показать, что Vx>Vy и прокомментировать это знаком при свободном члене уравнения простой линейной регрессии.

Охарактеризовать тесноту линейной корреляционной связи на основе шкалы Чеддока.

Выборочный коэффициент Дарбина – Уотсона для этого уравнения равен 1,54. Используя данные тренировочного примера (та же размерность задачи) проверить остатки на автокорреляцию и сделать вывод.

Сравнительный анализ моделей для рассмотренных данных показал следующее (рис.15):

Рис. 15. Сравнительный анализ моделей

Мультипликативная и экспоненциальная модели следующие:

Рис. 16. Мультипликативная модель

Рис. 17. Экспоненциальная модель

Выписать уравнения этих моделей, охарактеризовать их точность на основе данных рис. 15 и дать смысл их параметров (в пределах рассмотренного в тренировочном примере) и указать наиболее точное из них.

 

Решение

Уравнение линейной регрессии (для результатов расчетов, приведенных на рис. 13) имеет вид: у = 2,085 + 0,561* х + е.

F=43,96, а расчетный уровень ее значимости равен нулю (p-Value = 0,0000), следовательно уравнение парной линейной регрессии является значимым.

Проверка значимости коэффициента парной регрессии аналогична проверке значимости уравнения регрессии в целом и статистика Стьюдента для этой проверки равна корню квадратному из статистики Фишера (или t2 =F): 6,630162 =43,96. Следовательно, коэффициент регрессии значимо отличен от нуля.

Коэффициент регрессии в уравнении у = 2,085 + 0,561* х показывает, что из каждой тысячи рублей дохода на потребление расходуется 561 руб., а 439 руб. (1000-561=439) сберегаются.

Величина мультипликатора равна 1/(1-b)=1/(1-0.561)=1/0.439=2.278. Это означает, что при дополнительном инвестировании 1 тыс. руб. в перспективе, будет получен дополнительный доход в размере 2,278 тыс. руб.

Свободный член уравнения регрессии: а=2,085>0. Это означает, что в анализируемом примере расходы (y) изменяются менее интенсивно, чем доходы (x).

Рассчитаем коэффициенты вариации для переменных х и y.

Vx= =2,1*100/5,1=41,176 (%)

Vy= =1.4*100/4.95= 28.283(%)

Vx=41.176>Vy=28.283, что еще раз подтверждает, что в примере расходы (y) изменяются менее интенсивно, чем доходы (x).

Коэффициент средней эластичности равен:

Э=0,561*5,1/4,95=0,578

Следовательно, в рассматриваемом примере при изменении доходов на 1% расходы изменятся в среднем на 0,578%.

Коэффициентом корреляции равен 0,836 и в соответствии со шкалой Чеддока можно сказать, что теснота этой связи является высокой.

Рассчитаем значение статистики Стьюдента для проверки гипотезы о том, что коэффициент корреляции равен нулю:

6,630148

6,630162 =43,96.

Таким образом, что в случае парной регрессии значение статистики Стьюдента для проверки гипотезы о том, что коэффициент корреляции равен нулю совпадет со статистикой Стьюдента для проверки гипотезы о равенстве нулю коэффициента регрессии, а ее квадрат равен значению критерия Фишера для проверки гипотезы о значимости уравнения регрессии в целом.

Коэффициент детерминации равен 69,82%, следовательно, в анализируемом примере изменение потребительских расходов 69,82% зависит от изменения доходов, а остальные 30,18% (100-69,82=30,18) изменения потребительских расходов зависят от не учтенных в модели факторов.

Стандартная ошибка оценки по регрессии равна 0,79, и это означает, что, оценивая потребительские расходы по заданной величине доходов по данному уравнению регрессии, мы в среднем ошибаемся на величину 0,79.

 

Выборочный коэффициент Дарбина – Уотсона для этого уравнения равен 1,54, а табличные значения равны: dl=1,22, du=1,42 (см. приложения).

Имеем:

_______ dl _____ du _____4-du ______4-dl _________

0 1,22 1,42 2,58 2,78 4

Итак, вычисленное значение статистики Дарбина – Уотсона попало в область между du и 4-du, что означает отсутствие автокорреляции в остатках. Следовательно, в анализируемом примере остатки являются случайными величинами, как того и требует МНК.

Результаты расчетов, приведенные на рис. 15, что наилучшими моделями для рассматриваемых данных о потребительских расходах являются степенная и экспоненциальная, т.к. эти модели характеризуются наибольшими значениями коэффициента корреляции (0,8540 и 0,8535, соответственно) и коэффициента детерминации (72,92 % и 72,85%, соответственно).

Уравнение степенной модели: y=0,737*х0,535

Уравнение экспоненциальной модели: y=e0,998+0.111*x

Оба этих уравнения являются статистически значимыми, т. к. значения p-value для статистики Стьюдента, рассчитанной для проверки значимости параметра b равны нулю. Коэффициенты корреляции в обоих моделях попадают в интервал от 0,7 до 0,9, что свидетельствует о высокой силе связи между признаками х (доходы) и y (потребительские расходы).

Коэффициент детерминации для степенной модели равен 72,92 %, следовательно в этой модели 72,92 % вариации признака y (потребительские расходы) объясняются изменением признака х (объем доходов), а остальные 27,08% (100-72,92=27,08) изменений потребительских расходов зависят от не учтенных в модели факторов.

Коэффициент детерминации для экспоненциальной модели равен 72,85 %, следовательно, в этой модели 72,85 % вариации признака y (потребительские расходы) объясняются изменением признака х (объем доходов), а остальные 27,15% (100-72,85=27,15) изменений потребительских расходов зависят от не учтенных в модели факторов.

Таким образом, уравнение степенной регрессии объясняет несколько большую долю вариации объемов потребительских расходов (Y) вариацией объемов доходов (х). С этой точки зрения уравнение степенной регрессии следует признать более точным, чем уравнение экспоненциальной регрессии.

В уравнении степенной регрессии: y=0,737*х0,535 параметр a=0.737 означает, что уровень автономных потребительских расходов (не зависящих от объема располагаемых доходов) равен 0,737 руб., а параметр b=0.535 означает, что при увеличении доходов на 1% руб. объем потребительских расходов в среднем увеличится на 0,535 %.

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: