Тема 4. Парная регрессионная модель. Парная (простая, однофакторная) регрессия –регрессия, в которой рассматривается зависимость показателя Y от одного фактора Х

Парная (простая, однофакторная) регрессия – регрессия, в которой рассматривается зависимость показателя Y от одного фактора Х.

В общем виде эту зависимость можно задать функцией:

где у – зависимая переменная (результативная переменная)

х – независимая или объясняющая переменная (фактор-признак)

 

На практике наиболее широко используется линейная парная регрессия .

Коэффициент a – отрезок; формально – это значение результативной переменной при x=0. Если фактор-признак не имеет и не может иметь нулевого значения, то интерпретация а не имеет смысла.

Интерпретировать можно лишь знак при параметре а. Если а >0, то относительное изменение результата происходит медленнее, чем изменение фактора. Другими словами, вариация результата меньше вариации фактора-признака. При а <0 – интерпретация вообще смысла не имеет.

Коэффициент b – наклон, показывает среднее изменение результата при изменении фактора на единицу.

 

Например, зависимость стоимости квартиры (тыс.руб.) от общей площади квартиры (кв.м.) задается уравнением регрессии =145+13,3x, тогда можно сделать вывод, что при увеличении общей площади квартиры на 1 кв.м. ее стоимость возрастает на 13,3 тыс.руб.

Регрессионное уравнение = a+bx указывает, что при увеличении фактора х на единицу Y увеличивается на b единиц, при b>0.

Регрессионное уравнение = a–bx указывает, что при увеличении фактора х на единицу Y уменьшается на b единиц, при b<0.

После того, как найдено уравнение однофакторной регрессии необходимо оценить его качество.

Для оценки качества подбора линейной функции используют следующие показатели:

1. Коэффициент детерминации. Он рассчитывается возведением в квадрат линейного коэффициента корреляции (r2xy). Он показывает, на сколько процентов вариация фактора х объясняет вариацию результативного показателя у.

2. Средняя ошибка аппроксимации –это среднее отклонение расчетных значений от фактических у.


Она вычисляется по формуле:

Допустимый предел значений средней ошибки аппроксимации не более 8-10%.

Если А< 8%, то ошибка аппроксимации небольшая, и регрессионная модель хорошо описывает изучаемую закономерность.

Если 8% А 10%, ошибка аппроксимации высокая, но регрессионная модель хорошо описывает изучаемую закономерность.

Если А>10%, ошибка аппроксимации высокая, но регрессионная модель плохо описывает изучаемую закономерность.

3. F- критерий Фишера.

F – тест состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Сравниваются фактическое Fфакт и критическое (табличное) Fтабл значения F- критерий Фишера.


Fфакт можно рассчитать по формуле:

где n – число единиц совокупности;

m – число факторов, включаемых в модель.

Fтабл– этомаксимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости a.

Уровень значимости a– вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно a принимается равной 0,05 или 0,01. (Будем при решении задач принимать a=0,05.)

При нахождении Fтаблв таблице значений F-критерия Фишера будем принимать: k1 = m и k2 = n-2,

где n – объем выборки,

m – количество объясняющих переменных.

 

Гипотеза Н0 – природа оцениваемых характеристик случайна.

Гипотеза Н1 – природа оцениваемых характеристик не случайна.

Если Fтабл<Fфакт, то гипотеза Н0 – о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность с вероятностью 1-a.

Если Fтабл>Fфакт, то Н0 – гипотеза о случайной природе оцениваемых характеристик не отклоняется и признается их статистическая незначимость и ненадежность с вероятностью 1-a.

Таким образом, качество модели считается высоким, если выполняются все три условия:

1. коэффициент детерминации ;

2. средняя ошибка аппроксимации ;

3. Fтабл<Fфакт.

Если хоть одно из условий не выполняется, качество модели низкое.Выбор наилучшего варианта эконометрической модели осуществляется сравнением их качественных характеристик. Соответственно лучшему варианту модели должны соответствовать лучшие характеристики.

Образец решения задачи контрольной работы:

По Российской Федерации за 2009 год известны значения двух признаков (табл. 3.1).

Таблица 3.1

 

Месяцы Расходы на покупку продовольственных товаров в общих расходах, %«Y» Средний денежный доход на душу населения, руб. «Х»
Январь   1964,7
Февраль 65,6 2292,0
Март 60,7 2545,8
Апрель
Май
Июнь
Июль
Август
Сентябрь
Октябрь 53,3 3042,8
Ноябрь 50,9 3107,2
Декабрь 47,5 4024,7

 

Для оценки зависимости Y от Х построена парная линейная регрессионная модель с помощью метода наименьших квадратов
= а + bх + е, где а = b = . Парный коэффициент корреляции rxy= Средняя ошибка аппроксимации = Известно, что Fтабл= 4,96, а Fфакт = Определите коэффициент детерминации. Оцените линейную модель через среднюю ошибку аппроксимации и F-критерий Фишера.

Решение.

Пусть, например, число =302. Тогда найдем коэффициенты парной линейной регрессионной модели а= 75,5 и b= -0,003. Получили уравнение регрессии:

 

= 75,5-0,003х+е.

 

Значит, с увеличением среднего денежного дохода на 1 руб. доля расходов на покупку продовольственных товаров снижается в среднем на 0,003 процентных пункта.

Линейный коэффициент парной корреляции rxy =-0,26 (связь слабая, обратная).

Найдем коэффициент детерминации rxy2=(-0,26)2=0,07. Вариация результата Y на 7% объясняется вариацией фактора Х.

Средняя ошибка аппроксимации =11,17, что говорит о высокой ошибке аппроксимации (недопустимые пределы). В среднем расчетные значения отклоняются от фактических на 11,17%.

Проверяем F-критерий Фишера, для этого сравним Fтабл и Fфакт. Fтабл<Fфакт (4,96<156), значит Н0 – гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность с вероятностью 0,95.

Общий вывод: Линейная парная модель плохо описывает изучаемую закономерность, т.к. не выполняются условия по коэффициенту детерминации и средней ошибке аппроксимации.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow