Многофакторный корреляционно - регрессионный анализ

 

Таблица 4. Исходные данные.

год уровень безраб-цы доход на душу насел-я индекс потребит цен индекс ВРП

1995

12,7

83,7

278,2

86,2

1996

14,9

89,6

235,2

93,5

1997

21,3

130,5

124

102,2

1998

22,2

72,2

107,9

94,2

1999

17,3

99,9

163,7

108

2000

19,1

111,2

144,6

104,9

2001

18,4

110,2

120,3

106,4

2002

15,4

121,5

110,6

106,4

2003

16,8

104,5

114,2

106,7

2004

15,3

104,4

114,7

103,7

2005

12

111,3

115,1

104,8

итого

185,4

1139

1628,5

1117

средн

16,86

103,55

148,046

101,55

 

Для анализа необходимо из нескольких факторов произвести предварительный отбор факторов для регрессионной модели. Сделаем это по итогам расчета коэффициента корреляции, т.е. возьмем те факторы, связь которых с результативным признаком будет выражена в большей степени. Рассмотрим следующие факторы:

- Доход на душу населения – x1 (%)

- Индекс потребительских цен – x2 (%)

- Индекс ВРП - x3 (%)

Рассчитаем коэффициент корреляции для линейной связи и для имеющихся факторов - x1, x2 и x3:

Для фактора x1 получаем коэффициент корреляции: r1= 0,042

Для фактора x2 получаем коэффициент корреляции: r2 =0,437

Для фактора x3 получаем коэффициент корреляции: r3=0,151

По полученным данным можно сделать вывод о том, что:

1)Связь между x1 и y отсутствует, так как коэффициент корреляции меньше 0,15. Таким образом, возникает необходимость исключить данный фактор из дальнейших исследований.

2)Связь между x2 и y прямая (так как коэффициент корреляции положительный) и умеренная, так как она находится между 0,41 и 0,50. Поэтому, будем использовать фактор в дальнейших расчётах.

3)Связь между x3 и y прямая (так как коэффициент корреляции положительный) и слабая. Тем не менее, будем использовать фактор в дальнейших расчетах.

Таким образом, два наиболее влиятельных фактора – Индекс потребительских цен – x2 и индекс ВРП - x3. Для имеющихся факторов x2 и x3 составим уравнение множественной регрессии.

Проверим факторы на мультиколлинеарность, для чего рассчитаем коэффициент корреляции rx2x3. Подставив имеющиеся данные (из таблицы 10) в формулу, имеем следующее значение: rx2x3=0,747. Полученный коэффициент говорит об очень высокой связи, поэтому дальнейший анализ по обоим факторам вестись не может. Однако в учебных целях продолжим анализ.

Проводим оценку существенности связи с помощью коэффициента множественной корреляции: R=0,512

Так как R < 0,8, то связь признаем не существенной, но, тем не менее, в учебных целях, проводим дальнейшее исследование.

 

Уравнение прямой имеет следующий вид: ŷ = a + bx1 + cx3

Для определения параметров уравнения необходимо решить систему:

Решив систему, получим уравнение: Ŷ=41,57-0,042 x1-0,183x3

Для данного уравнения найдем ошибку аппроксимации:

A=15,12

А> 5%, то данную модель нельзя использовать на практике.

Проведем оценку параметров на типичность. Рассчитаем значения величин:

S2=28,039

ma=0,886; mb=0,0003; mс=0,017;

ta=41,57/0,886=46,919; tb=-0,042/0,0003=-140; tc=-0,183/0,017=-10,77.

Сравним полученные выше значения t для α = 0,05 и числа степеней свободы (n-2) с теоретическим значением t-критерия Стьюдента, который tтеор = 2,1788. Расчетные значения tb и tс < tтеор, значит данные параметры не значимы и данное уравнение не используется для прогнозирования.

Далее оценим существенность совокупного коэффициента множественной корреляции на основе F-критерия Фишера по формуле:

 

где: n – число уровней ряда; к – число параметров; R – коэффициент множественной корреляции.

После расчета получаем: F=1,41

Сравним Fрасч с Fтеор для числа степеней свободы U1 = 9 и U2 = 2, видим, что 1,41 < 19,40, то есть Fрасч < Fтеор - связь признаётся не существенной, то есть корреляция между факторами x2, x3 и у не существенна.

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: