Выбор формы уравнения регрессии

Как и в парной зависимости, используются разные виды уравнений множественной регрессии: линейные и нелинейные.

Ввиду четкой интерпретации параметров наиболее широко используются линейная и степенная функция. В линейной множественной регрессии y = a + b 1 × x 1 + b 2 × x 2 + … + bp × xp параметры при x называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение результата с изменением соответствующего фактора на единицу при неизменном значении других факторов, закрепленных на среднем уровне.

Пример 3.3. Предположим, что зависимость расходов на продукты питания по совокупности семей характеризуется следующим уравнением:

y = 0,5 + 0,35 x 1 + 0,73 x 2,

где y –расходы семьи за месяц на продукты питания, тыс. руб.; x 1 – месячный доход на одного члена семьи, тыс. руб.; x 2 – размер семьи, человек.

Анализ данного уравнения позволяет сделать выводы – с ростом дохода на одного члена семьи на 1 тыс. руб. расходы на питание возрастут в среднем на 350 руб. при том же среднем размере семьи. Иными словами, 35 % дополнительных семейных расходов тратится на питание. Увеличение размера семьи при тех же её доходах предполагает дополнительный рост расходов на питание на 730 руб. Параметр a не имеет экономической интерпретации.

При изучении вопросов потребления коэффициенты регрессии рассматриваются как характеристики предельной склонности в потреблению. Например, если функция потребления Ct имеет вид

Ct = a + b 0 × Rt + b 1 × Rt –1 + e,

то потребление в период времени t зависит от дохода того же периода Rt и от дохода предшествующего периода Rt –1. Соответственно коэффициент b 0 характеризует эффект единичного возрастания дохода Rt при неизменном уровне предыдущего дохода. Коэффициент b 0 обычно называют краткосрочной предельной склонностью к потреблению. Общим эффектом возрастания как текущего, так и предыдущего дохода будет рост потребления на b = b 1. Коэффициент b рассматривается здесь как долгосрочная склонность к потреблению. Поскольку коэффициенты b 0 и b 1 > 0, долгосрочная склонность к потреблению должна превосходить краткосрочную b 0. Напрмер, за период 1905-1951 гг. (за исключением военных лет) М.Фридман построил для США следующую функцию потребления: Ct = 53 + 0,58 × Rt + 0,32 × Rt –1 с краткосрочной предельной склонностью к потреблению 0,58 и с долгосрочной склонностью к потреблению 0,9.

Функция потребления может рассматриваться также в зависимости от прошлых привычек потребления, т.е. от предыдущего уровня потребления Ct 1:

Ct = a + b 0 × Rt + b 1 × Ct –1 + e.

В этом уравнении параметр b 0 также характеризует краткосрочную предельную склонность к потреблению, т.е. влияние на потребление единичного роста доходов того же периода Rt. Долгосрочную предельную склонность к потреблению здесь измеряет выражение b 0/(1 – b 1).

Так, если уравнение регрессии составило:

Ct = 23,4 + 0,46 × Rt + 0,20 × Ct –1 + e.

то краткосрочная склонность к потреблению равна 0,46, а долгосрочная – 0,575 (0,46/0,8).

Свободный член уравнения множественной линейной регрессии (параметр a) вбирает в себя информацию о прочих не учитываемых в модели факторах. Его величина экономической интерпретации не имеет. Формально его значение предполагает то значение y, когда все x = 0, что практически не бывает.

В степенной функции yx = a × x 1 b 1 × x 2 b 2 × … × xpbp коэффициенты bj являются коэффициентами эластичности. Они показывают, на сколько процентов в среднем изменяется результат с изменением соответствующего фактора на 1 % при неизменности действия других факторов. Этот вид уравнения регрессии получил наибольшее распространение в производственных функциях, в исследованиях спроса и потребления.

Предположим, что при исследовании спроса на мясо получено уравнение

yx = 0,82 × x 1–2,63 × x 21,11 ×или yx = 0,82 × x 21,11/ x 12,63,

где yx – количество спрашиваемого мяса; x 1 – цена; x 2 – доход.

Следовательно, рост цен на 1 % при том же доходе вызывает снижение спроса в среднем на 2,63 %. Увеличение дохода на 1 % обусловливает при неизменных ценах рост спроса на 1,11 %.

В производственных функциях вида

P = a × F 1 b 1 × F 2 b 2 … × Fmbm × e,

где P – количество продукта, изготавливаемого с помощью m производственных факторов (F 1, F 2, … Fm); b – параметр, являющийся эластичностью количества продукции по отношению к количеству соответствующих производственных факторов.

Экономический смысл имеют не только коэффициенты b каждого фактора, но и их сумма, т.е. сумма эластичности: B = b 1 + b 2 + … + bm. Эта величина фиксирует обобщенную характеристику эластичности производства. Пусть производственная функция имеет вид:

P = 2 × F 10,3 × F 20,2 × F 30,5 × e,

где P – выпуск продукции; F 1 – стоимость основных производственных фондов; F 2 – отработано человеко-дней; F 3 – затраты на производство.

Эластичность выпуска по отдельным факторам производства составляет в среднем 0,3 % с ростом F 1 на 1 % при неизменном уровне других факторов; 0,2 % – с ростом F 2 на 1 % также при неизменности других факторов производства; 0,5 % – с ростом F 3 на 1 % при неизменном уровне других факторов. Для данного уравнения B = b 1 + b 2 + b3 = 1. Следовательно в целом с ростом каждого фактора производства на 1 % коэффициент эластичности выпуска продукции составляет 1 %, т.е. выпуск продукции увеличивается на 1 %, что в микроэкономике соответствует постоянной отдаче от масштаба.

При практических расчетах не всегда сумма коэффициентов равна единице. Она может быть как больше, так и меньше единицы. В этом случае величина B фиксирует приближенную оценку эластичности выпуска с ростом каждого фактора производства на 1 % в условиях увеличивающейся (B > 1) или уменьшающейся (B < 1) отдачи от масштаба.

Так, если P = 2,4 × F 10,3 × F 20,7 × F 30,2, то с ростом значений каждого фактора производства на 1 % выпуск продукции в целом возрастает приблизительно на 1,2 %.

Возможны и другие линеаризуемые функции для построения уравнения множественной регрессии:

– экспонента ;

– гипербола , которая используется при обратных связях признаков.

Стандартные компьютерные программы обработки регрессионного анализа позволяют перебирать различные функции и выбрать ту из них, для которой остаточная дисперсия и ошибка аппроксимации минимальны, а коэффициент детерминации максимален.

Если исследователя не устраивает предлагаемый стандартной программой набор функций регрессии, то можно использовать любые другие функции, приводимые путем соответствующих преобразований к линейному виду, например

.

Обозначив

z 1 = x 1, z 2 = 1/ x 2, z 3 = x 31/2, z 4 = ln x 4,

получим линейное уравнение множественной регрессии

y = a + b 1 × z 1 + b 2 × z 2 + b 3 × z 3 + b 4 × z 4 + e.

Однако чем сложнее функция, тем менее интерпретируемы её параметры.

При использовании сложных полиномиальных функций с большим числом факторов необходимо помнить, что каждый параметр преобразованной функции является средней величиной, которая должна быть подсчитана по достаточному числу наблюдений. Если число наблюдений невелико, что, как правило, имеет место в эконометрике, то увеличение числа параметров функции приведет к их статистической незначимости и соответственно потребует упрощения вида функции. Если один и тот же фактор вводится в регрессию в разных степенях, то каждая степень рассматривается как самостоятельный фактор. Так, если модель имеет вид полинома второго порядка

y = a + b 1 × x 1 + b 2 × x 2 + b 11 × x 12 + b 22 × x 22 + b 12 × x 1 × x 2 + e,

то после замены переменных z 1 = x 1, z 2 = x 2, z 3 = x 12, z 4 = x 22, z 5 = x 1 x 2, получим линейное уравнение регрессии с пятью факторами

y = a + b 1 × z 1 + b 2 × z 2 + b 3 × z 3 + b 4 × z 4 + b 5 × z 5 + e.

Поскольку, как отмечалось, должно выполняться соотношение между числом параметров и числом наблюдений, для полинома второй степени требуется не менее 30-35 наблюдений.

В эконометрике регрессионные модели часто строятся на основе макроуровня экономических показателей, когда ставится задача оценки влияния наиболее экономически существенных факторов на моделируемый показатель при ограниченном объеме информации. Поэтому полиномиальные модели высоких порядков используются редко.

К линейному виду может быть приведена и следующая экспоненциальная модель: , так как  или . Далее, логарифмируя обе части равенства, получим: , где  можно обозначить через Y, т.е. имеем линейную модель множественной регрессии Y = a + b 1 × x 1 + b 2 × x 2 + e.

 

 

№12

Оценка параметров

Параметры уравнения множественной регрессии оцениваются, как и в парной регрессии, методом наименьших квадратов. При его применении строится система, решение которой и позволяет получить оценки параметров регрессии.

Так, для уравнения y = a + b 1 × x 1 + b 2 × x 2 + … + bp × xp + e система нормальных уравнений составит:

Её решение может быть осуществлено методом определителей:

a = Da / D,    b 1 = Db 1 / D,…, bp = Dbp / D,

где D – определитель системы; Da, Db 1, …, Dbp – частные определители.

При этом

а Da, Db 1, …, Dbp получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы.

Процедура оценки параметров b 0 = a, b 1, b 2, bk та же, что и в парной линейной регрессии, т.е. находим по правилу умножения матрицу XTX, обратную матрицу (XTX)–1, XTY, и далее оценки B, как: B = (XTX)–1 XTY.

Пример 3.4. Имеются следующие данные по 10 предприятиям концерна о прибыли (y – млн. руб.), выработке продукции на одного работника (x 1 – единиц) и доле продукции, производимой на экспорт (– %), приведенные в табл. 3.1.

Таблица 3.1. Исходные и расчетные данные для примера построения множественной регрессии

№ п/п y x 1 x 2 y 2 x 12 x 22 yx 1 yx 2 x 1 x 2 yr
1 2 11 3 4 121 9 22 6 33 2,284553
2 1 10 2 1 100 4 10 2 20 1,45935
3 3 12 4 9 144 16 36 12 48 3,109756
4 8 18 10 64 324 100 144 80 180 8,060976
5 7 15 11 49 225 121 105 77 165 6,544715
6 5 13 6 25 169 36 65 30 78 4,174797
7 4 13 5 16 169 25 52 20 65 3,934959
8 6 15 7 36 225 49 90 42 105 5,585366
9 7 16 10 49 256 100 112 70 160 6,890244
10 7 17 12 49 289 144 119 84 204 7,955285
Итого 50 140 70 302 2022 604 755 423 1058  

 

Система нормальных уравнений составит:

Решая ее методом определителей, получим:

D = 9840, Da = –47960, Db 1 = 5760, Db 2 = 2360,

откуда:

a = –4,874; b 1 = 0,585; b 2 = 0,240.

Уравнение регрессии выглядит следующим образом:

 

№13

На основе линейного уравнения множественной регрессии

y = a + b 1 × x 1 + b 2 × x 2 + … + bp × xp + e

могут быть найдены частные уравнения регрессии:

 

т.е. уравнения регрессии, которые связывают результативный признак с соответствующими факторами x при закреплении других учитываемых во множественной регрессии факторов на среднем уровне. Частные уравнения регрессии имеют следующий вид:

;

;

.

При подстановке в эти уравнения средних значений соответствующих факторов они принимают вид парных уравнений линейной регрессии, т.е. имеем:

;

;

где

;

;

В отличие от парной регрессии частные уравнения регрессии характеризуют изолированное влияние фактора на результат, ибо другие факторы закреплены на неизменном уровне. Эффекты влияния других факторов присоединены в них к свободному члену уравнения множественной регрессии. Это позволяет на основе частных уравнений регрессии определять частные коэффициенты эластичности:

                                       (3.5)

где bi – коэффициенты регрессии для фактора xi в уравнении множественной регрессии;  – частное уравнение регрессии.

Пример 3.7. Предположим, что по ряду регионов множественная регрессия величины импорта на определенный товар y относительно отечественного его производства x 1, изменения запасов x 2 и потребления на внутреннем рынке x 3 оказалась следующей:

y = –66,028 + 0,135 × x 1 + 0,476 × x 2 + 0,343 × x 3.

При этом средние значения для рассматриваемых признаков составили:

y = 31,5;      x 1 =245;       x 2 =3,7; x 3 = 12,5.

На основе данной информации могут быть найдены средние по совокупности показатели эластичности:

.

Для этого примера они окажутся равными:

,

т.е. с ростом объема отечественного производства на 1 % размер импорта в среднем по совокупности регионов возрастет на 1,053 % при неизменных запасах и потреблении семей.

Для второй переменной коэффициент эластичности составляет:

,

т.е. с ростом изменения запасов на 1 % при неизменном производстве и внутреннем потреблении величина импорта увеличивается в среднем на 0,056 5.

Для третьей переменной коэффициент эластичности составляет:

,

т.е. при неизменном объеме производства и величины запасов с увеличением внутреннего потребления на 1 % импорт товара возрастает в среднем на 1,987 %. Средние показатели эластичности можно сравнивать друг с другом и соответственно ранжировать факторы по силе их воздействия на результат. В рассматриваемом примере наибольшее воздействие на величину импорта оказывает размер внутреннего потребления товара x 3, а наименьшее – изменение запасов x 2.

Наряду со средними показателями эластичности в целом по совокупности регионов на основе частных уравнений регрессии могут быть определены частные коэффициенты эластичности для каждого региона.

Частные уравнения регрессии в нашем случае составят:

,

т.е. ;

,

т.е. ;

,

т.е. .

Подставив в данные уравнения фактические значения соответствующих факторов по отдельным регионам, получим значения моделируемого показателя y при заданном уровне одного фактора и средних значениях других факторов. Эти расчетные значения результативного признака используются для определения частных коэффициентов эластичности по приведенной выше формуле. Так, если в регионе x 1 = 160,2; x 2 = 4,0; x 3 = 190,5, то частные коэффициенты эластичности составят:

;

;

.

Как видим, частные коэффициенты эластичности для региона несколько отличаются от аналогичных средних показателей по совокупности регионов. Они могут быть использованы при принятии решений по развитию конкретных регионов.

 

 

№14.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: