По 30 территориям России имеются данные, представленные в табл. 2.1.
Признак | Среднее значение | Среднее квадратическое отклонение | Линейный коэффициент парной корреляции |
Среднедневной душевой доход, руб., у | 86,8 | 11,44 | - |
Среднедневная заработная плата одного работающего, руб., х1 | 54,9 | 5,86 | |
Средний возраст безработного, лет, х2 | 33,5 | 0,58 |
Требуется:
1. Построить уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с β1 и β2, пояснить различия между ними.
2. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними.
3.Рассчитать общий и частные F-критерии Фишера.
Решение:
1. Линейное уравнение множественной регрессии у от х1 и х2 имеет вид: у = а+b1∙х1+b2∙x2. Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизованном масштабе: . Расчет β-коэффициентов выполним по формулам:
Получим уравнение: ty=0,8273 tx1 -0,1141 tx2.
Для построения уравнения в естественной форме рассчитаем b1 и b2, используя формулы для перехода от βi к bi:
Значение а определим из соотношения:
Для характеристики относительной силы влияния х1 и х2 на у рассчитаем средние коэффициенты эластичности:
;
С увеличением средней заработной платы на 1 % от ее среднего уровня средний душевой доход у возрастает на 1,02 % от своего среднего уровня; при повышении среднего возраста безработного х2 на 1 % среднедушевой доходу снижается на 0,87 % от своего среднего уровня. Очевидно, что сила влияния средней заработной платы х1 на средний душевой доход у оказалась большей, чем сила влияния среднего возраста безработного х2 К аналогичным выводам о силе связи приходим при сравнении модулей значений β1и β2:
.
Различия в силе влияния фактора на результат, полученные при сравнении . и , объясняются тем, что коэффициент эластичности исходит из соотношения средних: , а β-коэффициент - из соотношения средне- квадратических отклонений .
2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле:
;
;
.
Если сравнить значения коэффициентов парной и частной корреляции, то приходим к выводу, что из-за слабой межфакторной связи ( = -0,116) коэффициенты парной и частной корреляции отличаются незначительно: выводы о тесноте и направлении связи на основе коэффициентов парной и частной корреляции совпадают:
.
Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов и βj:
Зависимость у от x1 и x2 характеризуется как тесная, в которой 72 % вариации среднего душевого дохода определяются вариацией учтенных в модели факторов: средней заработной платы и среднего возраста безработного. Прочие факторы, не включенные в модель, составляют соответственно 28 % от общей вариации у.
3. Общий F-критерий проверяет гипотезу H0 о статистической значимости уравнения регрессии и показателя тесноты связи (R2 = 0):
Fтабл=3,4; α=0,05.
Сравнивая Fтабл и Fфакт приходим к выводу о необходимости отклонить гипотезу H0, так как Fтабл=3,4<Fфакт=34,6. С вероятностью 1 - α= 0,95 делаем заключение о статистической значимости уравнения в целом и показателя тесноты связи , которые сформировались под неслучайным воздействием факторов х1 и F х2. Частные F-критерии - и оценивают статистическую значимость присутствия факторов х1 и х2 в уравнении множественной регрессии, оценивают целесообразность включения в уравнение одного фактора после другого фактора, т.е. оценивает целесообразность включения в уравнение фактора х1 после того, как в него был включен фактор х2. Соответственно указывает на целесообразность включения в модель фактора x2 после фактора х1:
Сравнивая Fтабли Fфакт, приходим к выводу о целесообразности включения в модель фактора х1 после фактора х2, так как . Гипотезу о несущественности прироста за счет включения дополнительного фактора х1 отклоняем и приходим к выводу о статистически подтвержденной целесообразности включения фактора х1 после фактора х2.
Целесообразность включения в модель фактора х2 после фактора х1 проверяет :
Низкое значение (немногим больше 1) свидетельствует о статистической незначимости прироста за счет включения в модель фактора х2 после фактора х1. Следовательно, подтверждается нулевая гипотеза о нецелесообразности включения в модель фактора х2 (средний возраст безработного). Это означает, что парная регрессионная модель зависимости среднего дохода от средней заработной платы является достаточно статистически значимой, надежной и что нет необходимости улучшать ее, включая дополнительный фактор х2 (средний возраст безработного).