Пример 1. По семи территориям некоторого региона известны значения двух признаков:
Расходы на покупку продовольственных товаров в общих расходах (в процентах, ) | Среднедневная заработная плата одного работающего (в денежных единицах, ) |
68,8 | 45,1 |
61,2 | 59,0 |
59,9 | 57,2 |
56,7 | 61,8 |
55,0 | 58,8 |
54,3 | 47,2 |
49,3 | 55,2 |
Требуется:
1. Для характеристики зависимости у от х рассчитать параметры следующих функций:
а) линейной;
б) степенной;
в) показательной;
г) равносторонней гиперболы.
2. Оценить каждую модель через среднюю ошибку аппроксимации и -ритерий Фишера.
Решение:
1а). Для расчета параметров и линейной регрессии решаем систему нормальных уравнений относительно и :
По исходным данным рассчитываем
Таблица 1
68,8 | 45,1 | 3102,88 | 2034,01 | 4733,44 | 61,3 | 7,5 | 10,9 | |
61,2 | 59,0 | 3610,80 | 3481,00 | 3745,44 | 56,5 | 4,7 | 7,7 | |
59,9 | 57,2 | 3426,28 | 3271,84 | 3588,01 | 57,1 | 2,8 | 4,7 | |
56,7 | 61,8 | 3504,06 | 3819,24 | 3214,89 | 55,5 | 1,2 | 2,1 | |
55,0 | 58,8 | 3234,00 | 3457,44 | 3025,00 | 56,5 | -1,5 | 2,7 | |
54,3 | 47,2 | 2562,96 | 2227,84 | 2948,49 | 60,5 | -6,2 | 11,4 | |
49,3 | 55,2 | 2721,36 | 3047,04 | 2430,49 | 57,8 | -8,5 | 17,2 | |
Итого | 405,2 | 384,3 | 22162,34 | 21338,4 | 23685,76 | 405,2 | 0,0 | 56,7 |
Сред-нее | 57,89 | 54,90 | 3166,05 | 3048,34 | 3383,68 | - | - | 8,1 |
5,74 | 5,86 | - | - | - | - | - | - | |
32,92 | 34,34 | - | - | - | - | - | - |
Уравнение регрессии =76,88-0,35 . С увеличением среднедневной заработной платы на 1 денежную единицу доля расхода на покупку продовольственных товаров снижается в среднем на 0,35 %-ных пункта. Рассчитаем линейный коэффициент парной корреляции:
Связь умеренная, обратная.
Определим коэффициент детерминации:
Вариация результата на 12,7% объясняется вариацией фактора .
Подставляя в уравнение регрессии фактические значения ,определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации :
В среднем расчетные значения отклоняются от фактических на 8,1%.
Рассчитываем -критерий: = .
Полученное значение указывает на необходимость принять гипотезу о случайной природе выявленной зависимости и статистической незначимости параметров уравнения и показателя тесноты связи.
1б).Построению степенной модели предшествует процедура линеаризации переменных. В данном примере линеаризация производится путем логарифмирования обеих частей уравнения:
;
,
где
Для расчетов используем данные табл. 2.
Таблица 2
1,8376 | 1,6542 | 3,0398 | 3,3768 | 2,7364 | 61,0 | 7,8 | 60,8 | 11,3 | |
1,7868 | 1,7709 | 3,1642 | 3,1927 | 3,1361 | 56,3 | 4,9 | 24,0 | 8,0 | |
1,7774 | 1,7574 | 3,1236 | 3,1592 | 3,0885 | 56,8 | 3,1 | 9,6 | 5,2 | |
1,7536 | 1,7910 | 3,1407 | 3,0751 | 3,2077 | 55,5 | 1,2 | 1,4 | 2,1 | |
1,7404 | 1,7694 | 3,0795 | 3,0290 | 3,1308 | 56,3 | -1,3 | 1,7 | 2,4 | |
1,7348 | 1,6739 | 2,9039 | 3,0095 | 2,8019 | 60,2 | -5,9 | 34,8 | 10,9 | |
1,6928 | 1,7419 | 2,9487 | 2,8656 | 3,0342 | 57,4 | -8,1 | 65,6 | 16,4 | |
Итого | 12,3234 | 12,1587 | 21,4003 | 21,7078 | 21,1355 | 403,5 | 1,7 | 197,9 | 56,3 |
Сред-нее | 1,7605 | 1,7370 | 3,0572 | 3,1011 | 3,0194 | - | - | 28,27 | 8,0 |
0,0425 | 0,0484 | - | - | - | - | - | - | - | |
0,0018 | 0,0023 | - | - | - | - | - | - | - |
Рассчитаем и :
Получим линейное уравнение: =2,278-0,298 .
Выполнив его потенцирование, получим:
Подставляя в данное уравнение фактические значения х, получаем теоретическое значение результата . По ним рассчитываем показатели: тесноты связи – индекс корреляции и среднюю ошибку аппроксимации :
,
Характеристики степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь.
1в). Построению уравнения показательной кривой предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:
,
где .
Для расчетов используем данные табл. 3.
Таблица 3
1,8376 | 45,1 | 82,8758 | 3,3768 | 2034,01 | 60,7 | 8,1 | 65,61 | 11,8 | |
1,7868 | 59,0 | 105,4212 | 3,1927 | 3481,00 | 56,4 | 4,8 | 23,04 | 7,8 | |
1,7774 | 57,2 | 101,6673 | 3,1592 | 3271,84 | 56,9 | 3,0 | 9,00 | 5,0 | |
1,7536 | 61,8 | 108,3725 | 3,0751 | 3819,24 | 55,5 | 1,2 | 1,44 | 2,1 | |
1,7404 | 58,8 | 102,3355 | 3,0290 | 3457,44 | 56,4 | -1,4 | 1,96 | 2,5 | |
1,7348 | 47,2 | 81,8826 | 3,0095 | 2227,84 | 60,0 | -5,7 | 32,49 | 10,5 | |
1,6928 | 55,2 | 93,4426 | 2,8656 | 3047,04 | 57,5 | -8,2 | 67,24 | 16,6 | |
Ито-го | 12,3234 | 384,3 | 675,9974 | 21,7078 | 21338,41 | 403,0 | -1,8 | 200,78 | 56,3 |
Среднее | 1,7605 | 54,9 | 96,5711 | 3,1011 | 3048,34 | Х | Х | 28,68 | 8,0 |
0,0425 | 5,86 | Х | Х | Х | Х | Х | Х | Х | |
0,0018 | 34,3396 | х | х | х | х | Х | х | х |
Значения параметров регрессии и составили:
Полученное линейное уравнение:
Произведем потенцирование полученного уравнения и запишем его в обычной форме:
Тесноту связи оценим через индекс корреляции :
Связь умеренная.
, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах. Показательная функция чуть хуже, чем степенная, описывает изучаемую зависимость.
1г). Уравнение односторонней гиперболы линеаризуется при замене: . Тогда
Для расчетов используем данные таблицы 4.
Таблица 4
68,8 | 0,0222 | 1,5255 | 0.000492 | 4733,44 | 61,8 | 7,0 | 49,00 | 10,2 | |
61,2 | 0,0169 | 1,0373 | 0.000287 | 3745,44 | 56,3 | 4,9 | 24,01 | 8,0 | |
59,9 | 0,0175 | 1,0472 | 0,000306 | 3588,01 | 56,9 | 3,0 | 9,00 | 5,0 | |
56,7 | 0,0162 | 0,9175 | 0,000262 | 3214,89 | 55,5 | 1,2 | 1,44 | 2,1 | |
0,0170 | 0,9354 | 0,000289 | 3025,00 | 56,4 | -1,4 | 1,96 | 2,5 | ||
54,3 | 0,0212 | 1,1504 | 0,000449 | 2948,49 | 60,8 | -6,5 | 42,25 | 12,0 | |
49,3 | 0,0181 | 0,8931 | 0,000328 | 2430,49 | 57,5 | -8,2 | 67,24 | 16,6 | |
Итого | 405,2 | 0,1291 | 7,5064 | 0,002413 | 23685,76 | 405,2 | 0,0 | 194,90 | 56,5 |
Среднее | 57,9 | 0,0184 | 1,0723 | 0,000345 | 3383,68 | - | - | 27,84 | 8,1 |
5,74 | 0,002145 | - | - | - | - | - | - | - | |
32,9476 | 0,000005 | - | - | - | - | - | - | - |
Значение параметров регрессии и составили:
Полученное уравнение:
Индекс корреляции:
. По уравнению равносторонней гиперболы получена наибольшая оценка тесноты связи: (по сравнению с линейной, степенной и показательной регрессиями). остается на допустимом уровне.
2. Вычислим критическое и наблюдаемое значения для критерия Фишера:
где
Следовательно, принимается гипотеза о статистически незначимых параметрах этого уравнения. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.
Пример 2. Известны значения двух признаков:
Расходы на покупку продовольственных товаров в общих расходах, , % | Среднедневная заработная плата одного работающего, , условные единицы |
68,8 | 45,1 |
61,2 | 59,0 |
59,9 | 57,2 |
56,7 | 61,8 |
55,0 | 58,8 |
54,3 | 47,2 |
49,3 | 55,2 |
Требуется:
1) для характеристики зависимости от рассчитать параметры парной линейной регрессионной модели;
2) оценить модель через ошибку аппроксимации и -критерий.
Решение:
Для расчёта параметров и линейной регрессии решаем систему нормальных уравнений.
По исходным данным рассчитаем (таблица 5):
Таблица 5
№ п/п | ||||||||
68,8 | 45,1 | 3102,88 | 2034,01 | 4733,44 | 61,3 | 7,5 | 10,9 | |
61,2 | 59,0 | 3610,80 | 3481,00 | 4733,44 | 56,5 | 4,7 | 7,7 | |
59,9 | 57,2 | 3426,28 | 3271,84 | 3588,01 | 57,1 | 2,8 | 4,7 | |
56,7 | 61,8 | 3504,06 | 3819,24 | 3214,89 | 55,5 | 1,2 | 2,1 | |
55,0 | 58,8 | 3234,00 | 3457,44 | 3025,00 | 56,5 | -1,5 | 2,7 | |
54,3 | 47,2 | 2562,06 | 2227,84 | 2948,49 | 60,5 | -6,2 | 11,4 | |
49,3 | 55,2 | 2721,36 | 3047,04 | 2430,49 | 57,8 | -8,5 | 17,2 | |
Итого | 405,2 | 384,2 | 22162,34 | 21338,41 | 23685,76 | 405,2 | 0,0 | 56,7 |
Среднее значение | 57,89 | 54,9 | 3166,05 | 3048,34 | 3383,68 | - | - | 8,1 |
5,7 | 5,9 | - | - | - | - | - | - | |
32,43 | 34,33 | - | - | - | - | - | - |
Уравнение регрессии: у =76,88-0,35 х.
С увеличением среднедневной заработной платы на одну условную единицу доля расходов на покупку продовольственных товаров снижается в среднем на 0,35 процентных пункта.
Рассчитываем линейный коэффициент парной корреляции:
Связь умеренная, обратная.
Определим коэффициент детерминации: .
Вариация результата на 13,1% объясняется вариацией фактора х.
Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчётные) значения .
Найдём величину средней ошибки аппроксимации :
.
В среднем расчётные значения откланяются от фактических на 8,1%.
Рассчитаем -критерий: .
Полученное значение указывает на необходимость принять гипотезу о случайной природе выявленной зависимости, так как ( находится из таблицы значений F -критерия Фишера).