Таблица 4. Исходные данные.
год | уровень безраб-цы | доход на душу насел-я | индекс потребит цен | индекс ВРП |
1995 | 12,7 | 83,7 | 278,2 | 86,2 |
1996 | 14,9 | 89,6 | 235,2 | 93,5 |
1997 | 21,3 | 130,5 | 124 | 102,2 |
1998 | 22,2 | 72,2 | 107,9 | 94,2 |
1999 | 17,3 | 99,9 | 163,7 | 108 |
2000 | 19,1 | 111,2 | 144,6 | 104,9 |
2001 | 18,4 | 110,2 | 120,3 | 106,4 |
2002 | 15,4 | 121,5 | 110,6 | 106,4 |
2003 | 16,8 | 104,5 | 114,2 | 106,7 |
2004 | 15,3 | 104,4 | 114,7 | 103,7 |
2005 | 12 | 111,3 | 115,1 | 104,8 |
итого | 185,4 | 1139 | 1628,5 | 1117 |
средн | 16,86 | 103,55 | 148,046 | 101,55 |
Для анализа необходимо из нескольких факторов произвести предварительный отбор факторов для регрессионной модели. Сделаем это по итогам расчета коэффициента корреляции, т.е. возьмем те факторы, связь которых с результативным признаком будет выражена в большей степени. Рассмотрим следующие факторы:
- Доход на душу населения – x1 (%)
- Индекс потребительских цен – x2 (%)
- Индекс ВРП - x3 (%)
Рассчитаем коэффициент корреляции для линейной связи и для имеющихся факторов - x1, x2 и x3:
Для фактора x1 получаем коэффициент корреляции: r1= 0,042
Для фактора x2 получаем коэффициент корреляции: r2 =0,437
|
|
Для фактора x3 получаем коэффициент корреляции: r3=0,151
По полученным данным можно сделать вывод о том, что:
1)Связь между x1 и y отсутствует, так как коэффициент корреляции меньше 0,15. Таким образом, возникает необходимость исключить данный фактор из дальнейших исследований.
2)Связь между x2 и y прямая (так как коэффициент корреляции положительный) и умеренная, так как она находится между 0,41 и 0,50. Поэтому, будем использовать фактор в дальнейших расчётах.
3)Связь между x3 и y прямая (так как коэффициент корреляции положительный) и слабая. Тем не менее, будем использовать фактор в дальнейших расчетах.
Таким образом, два наиболее влиятельных фактора – Индекс потребительских цен – x2 и индекс ВРП - x3. Для имеющихся факторов x2 и x3 составим уравнение множественной регрессии.
Проверим факторы на мультиколлинеарность, для чего рассчитаем коэффициент корреляции rx2x3. Подставив имеющиеся данные (из таблицы 10) в формулу, имеем следующее значение: rx2x3=0,747. Полученный коэффициент говорит об очень высокой связи, поэтому дальнейший анализ по обоим факторам вестись не может. Однако в учебных целях продолжим анализ.
Проводим оценку существенности связи с помощью коэффициента множественной корреляции: R=0,512
Так как R < 0,8, то связь признаем не существенной, но, тем не менее, в учебных целях, проводим дальнейшее исследование.
Уравнение прямой имеет следующий вид: ŷ = a + bx1 + cx3
Для определения параметров уравнения необходимо решить систему:
Решив систему, получим уравнение: Ŷ=41,57-0,042 x1-0,183x3
Для данного уравнения найдем ошибку аппроксимации:
|
|
A=15,12
А> 5%, то данную модель нельзя использовать на практике.
Проведем оценку параметров на типичность. Рассчитаем значения величин:
S2=28,039
ma=0,886; mb=0,0003; mс=0,017;
ta=41,57/0,886=46,919; tb=-0,042/0,0003=-140; tc=-0,183/0,017=-10,77.
Сравним полученные выше значения t для α = 0,05 и числа степеней свободы (n-2) с теоретическим значением t-критерия Стьюдента, который tтеор = 2,1788. Расчетные значения tb и tс < tтеор, значит данные параметры не значимы и данное уравнение не используется для прогнозирования.
Далее оценим существенность совокупного коэффициента множественной корреляции на основе F-критерия Фишера по формуле:
где: n – число уровней ряда; к – число параметров; R – коэффициент множественной корреляции.
После расчета получаем: F=1,41
Сравним Fрасч с Fтеор для числа степеней свободы U1 = 9 и U2 = 2, видим, что 1,41 < 19,40, то есть Fрасч < Fтеор - связь признаётся не существенной, то есть корреляция между факторами x2, x3 и у не существенна.