Парная линейная регрессия. Эконометрика – одна из базовых дисциплин экономического образования

ЛАБОРАТОРНАЯ РАБОТА №1. ПАРНАЯ РЕГРЕССИЯ

Эконометрика – одна из базовых дисциплин экономического образования. В экономике в большинстве случаев между переменными величинами существуют зависимости, когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной. Иначе говоря, каждому значению одной переменной соответствует определенное (условное) распределение другой переменной. Такая зависимость получила название статистической. Задачами регрессионного анализа являются установление формы зависимости между переменными, оценка функции регрессии, оценка неизвестных значений (прогноз значений) зависимой переменной.

Согласно методу наименьших квадратов неизвестные параметры a и b выбираются таким образом, чтобы сумма квадратов отклонений эмпирических значений зависимой переменной y от значений, найденных по уравнению регрессии, была минимальной. На основании необходимого условия экстремума функции двух переменных после преобразования получим систему нормальных уравнений для определения параметров a и b линейной регрессии.

Параметры a и b линейной регрессии у=a+b*x получаются с помощью функции Регрессия ППП EXCEL анализа данных.

Для этого выполните следующие шаги:

· Введите исходные данные

· Выполните команду меню Данные, Анализ данных, Регрессия

Получаем уравнение линейной регрессии yлр=b*x+a, где а и b взяты из столбца Коэффициенты:

улр=91,9158 - 5,51987*x.

Экономическое содержание параметра a при линейной парной регрессии: если x -фактор не может иметь нулевые значения, то трактовка a не имеет смысла. Если a <0, то его экономическая трактовка может привести к абсурду. Интерпретировать можно лишь знак
при a: если a >0, то относительное изменение результата y происходит медленнее, чем изменение x -фактора.

Экономический смысл коэффициента b - его величина показывает среднее изменение
y -фактора с изменением x -фактора на одну единицу.

Вывод. Величина коэффициента b= - 5,52 означает, что с ростом заработной платы на 1 тыс. руб. доля расходов на покупку продовольственных товаров снижается в среднем на 5,52%.

Сводную таблицу основных статистических характеристик для одного или нескольких массивов данных можно получить с помощью инструмента ППП EXCEL анализа данных Описательная статистика: Данные, Анализ данных, Описательная статистика

Уравнение регрессии характеризуется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции ryx. Линейный коэффициент корреляции находится в определенных пределах:
(-1)<= ryx <=(+1). При этом чем ближе ryx к Нулю, тем слабее корреляция, а при ryx =0 линия регрессии параллельна оси х; чем ближе ryx к (-1) или к (+1), тем сильнее корреляция, т.е. зависимость х и y близка к линейной.

Линейное уравнение регрессии дополняется расчетом линейного коэффициента корреляции:

,

где σx – стандартное отклонение по x, а σy – стандартное отклонение по y., взятые из результатов Описательной статистики, а коэффициент b – из таблиц Регрессии.

Вывод. Значение ryx = -0,94215, т.е. близок к (-1) и существует сильная корреляция y и x, или иначе - зависимость y и x близка к линейной.

Если коэффициент регрессии b>0, то 0<= ryx <=(+1) –это прямая корреляционная связь; если же коэффициент регрессии b<0, то (-1)<= ryx <=0. –это обратная корреляционная связь. При прямой (при обратной) связи увеличение одной из переменных ведет к увеличению
(к уменьшению) условно средней другой.

Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной. Согласно основной идее дисперсионного анализа для парной регрессии число степеней свободы уравнения регрессии k1=m-1, а число степеней свободы остаточной дисперсии k2=n-m, где m - число оцениваемых параметров уравнения регрессии (m =2), n - число наблюдений (n =7).

Коэффициент детерминации составит:

Вывод: Вариации Y на 88,8% объясняется вариацией X. На долю прочих факторов, не учитываемых в регрессии, приходится 11,2%.

Вывод. Коэффициент детерминации 0<= ryx2 <=(+1), чем ближе к 1, тем регрессия аппроксимирует лучше эмпирические данные.

F-критерий Фишера будет равен:

причем значение F- критерия Фишера взято из таблиц Регрессии.

Табличное значение F-критерия Фишера при числе степеней свободы k1=m-1=1 и
k2=n-m=5, где m - число оцениваемых параметров уравнения регрессии (m =2), n - число наблюдений (n =7), и уровне значимости 0,05 составит 6,61.

Вывод: Фактическое значение F-критерия Фишера превышает табличное, и можно сделать вывод, что уравнение регрессии статистически значимо.

Ошибки аппроксимации для каждого наблюдения определяются как:

 
 


Средняя ошибка аппроксимации находится как средняя арифметическая простая из индивидуальных ошибок:

Вывод: величина средней ошибки аппроксимации показывает хорошее соответствие расчетных и фактических данных.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: