По семи территориям Уральского района за 1999 г. известны значения двух признаков (табл. 1.1).
Таблица 1.1
Район | Расходы на покупку продовольственных товаров в общих расходах, %, у | Среднедневная заработная плата одного работающего, руб., х |
Удмуртская респ. | 68,8 | 45,1 |
Свердловская обл. | 61,2 | 59,0 |
Башкортостан | 59,9 | 57,2 |
Челябинская обл. | 56,7 | 61,8 |
Пермская обл. | 55,0 | 58,8 |
Курганская обл. | 54,3 | 47,2 |
Оренбургская обл. | 49,3 | 55,2 |
Требуется:
1. Для характеристики зависимости у от х рассчитать параметры следующих функций:
а) линейной; б) степенной; в) показательной; г) равносторонней гиперболы.
2. Оценить каждую модель через среднюю ошибку аппроксимации и - критерий Фишера.
Решение: 1а. Для расчета параметров а и b линейной регрессии
решаем систему нормальных уравнений относительно: и :
По исходным данным рассчитываем ,
Таблица 1.2
у | х | ух | х2 | у2 | Аi | |||
68,8 | 45,1 | 3102,88 | 2034,01 | 4733,44 | 61,3 | 7,5 | 10,9 | |
61,2 | 59,0 | 3610,80 | 3481,00 | 3745,44 | 56,5 | 4,7 | 7,7 | |
59,9 | 57,2 | 3426,28 | 3271,8f* | 3588,01 | 57,1 | 2,8 | 4,7 | |
56,7 | 61,8 | 3504,06 | 3819,24 | 3214,89 | 55,5 | 1,2 | 2,1 | |
55,0 | 58,8 | 3234,00 | 3457,44 | 3025,00 | 56,5 | -1.5 | 2,7 | |
54,3 | 47,2 | 2562,96 | 2227,84 | 2948,49 | 60,5 | -6,2 | 11,4 | |
49,3 | 55Д | 3047,04 | 2430,49 | 57,8 | -8,5 | 17,2 | ||
Итого | 405,2 | 384,3 | 22162,34 | 21338,41 | 23685,76 | 405,2 | 0,0 | 56,7 |
Среднее значение | 57,89 | 54,90 | 3166,05 | 3048,34 | 3383,68 | 8,1 | ||
5,74 | 5,86 | |||||||
32,92 | 34,34 |
Уравнение регрессии: С увеличением среднедневной заработной платы на 1 руб. доля расходов на покупку продовольственных товаров снижается в среднем на 0,35 процентных пункта.
Рассчитаем линейный коэффициент парной корреляции:
Связь умеренная, обратная.
Определим коэффициент детерминации:
Вариация результата на 12,7% объясняется вариацией факторах х. Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения ух. Найдем величину средней ошибки аппроксимации :
В среднем расчетные значения отклоняются от фактических на 8,1%.
Рассчитаем F-критерий:
26.
Полученное значение указывает на необходимость принять гипотезу Н0 о случайной природе выявленной зависимости и статистической незначимости параметров уравнения и показателя тесноты связи.
1б. Построению степенной модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:
где Для расчетов используем данные табл. 1.3. Рассчитаем С и b:
Получим линейное уравнение:
Выполнив его потенцирование, получим:
Подставляя в данное уравнение фактические значения х, получаем теоретические значения результата . По ним рассчитаем показатели: тесноты связи - индекс корреляции рху и среднюю ошибку аппроксимации :
Характеристики степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь.
Таблица 1.3
Y | X | YX | Y2 | X2 | |||||
1,8376 | 1,6542 | 3,0398 | 3,3768 | 2,7364 | 61,0 | 7,8 | 60,8 | 11,3 | |
1,7868 | 1,7709 | 3,1642 | 3,1927 | 3,1361 | 56,3 | 4,9 | 24,0 | 8,0 | |
1,7774 | 1,7574 | 3.1236 | 3,1592 | 3,0885 | 56,8 | 3,1 | 9,6 | 5,2 | |
1,7536 | 1,7910 | 3,1407 | 3,0751 | 3,2077 | 55,5 | 1,2 | 1,4 | 2,1 | |
1,7404 | 1,7694 | 3,0795 | 3,0290 | 3.1308 | 56,3 | -1,3 | 1,7 | 2,4 | |
1,7348 | 1,6739 | 2,9039 | 3,0095 | 2,8019 | 60,2 | -5,9 | 34,8 | 10,9 | |
1,6928 | 1,7419 | 2,9487 | 2,8656 | 3,0342 | 57,4 | -8,1 | 65,6 | 16.4 | |
Итого | 12,3234 | 12,1587 | 21,4003 | 21,7078 | 21,1355 | 403,5 | 1,7 | 197,9 | 56.3 |
Среднее значение | 1,7605 | 1,7370 | 3,0572 | 3,1011 | 3,0194 | 28,27 | 8,0 | ||
0,0425 | 0,0484 | ||||||||
0,0018 | 0,0023 |
1в. Построению уравнения показательной кривой
предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:
где
Для расчетов используем данные табл. 1.4.
Значения параметров регрессии А и В составили:
Получено линейное уравнение:
Произведем потенцирование полученного уравнения и запишем его в обычной форме:
Тесноту связи оценим через индекс корреляции :
Связь умеренная. , что говорит о повышенной ошибке аппроксимации, но в допустимых пределах. Показательная функция чуть хуже, чем степенная, она описывает изучаемую зависимость.
Таблица 1.4
Y | x | Yx | Y2 | X2 | Ai | ||||
1,8376 | 45,1 | 82,8758 | 2034,01 | 60,7 | 8,1 | 65,61 | 11,8 | ||
1,7868 | 59,0 | 105,4212 | 3,1927 | 3481,00 | 56,4 | 4,8 | 23,04 | 7,8 | |
1,7774 | 57,2 | 101,6673 | 3,1592 | 3271,84 | 56,9 | 3,0 | 9,00 | 5,0 | |
1,7536 | 61,8 | 3,0751 | 3819,24 | 55,5 | 1,2 | 1,44 | 2,1 | ||
1,7404 | 58,8 | 3,0290 | 3457,44 | 56,4 | -1,4 | 1,96 | |||
1,7348 | 47,2 | 81,8826 | 3,0095 | 2227,84 | 60,0 | -5,7 | 32,49 | 10,5 | |
1,6928 | 55,2 | 93,4426 | 2,8656 | 3047,04 | 57,5 | -8,2 | 67,24 | 16,6 | |
Итого | 384,3 | 675,9974 | 21,7078 | 21338,41 | 403,4 | -1,8 | 200,78 | 56,3 | |
Среднее значение | 1,7605 | 54,9 | 96,5711. | 3,1011 | 28,68. | 8,0 | |||
0,0425 | 5,86 | ||||||||
0,0018 | 34,3396 |
1г. Уравнение равносторонней гиперболы линеаризуется при замене: Тогда
Для расчетов используем данные таблицы 1.5.
Таблица 1.5
y | z | yz | z2 | y2 | Ai | ||||
68,8 | 0,0222 | 1,5255 | 0,000492 | 4733,44 | 61,8 | 7,0 | 49,00 | 10,2 | |
61,2 | 0,0169 | 1,0373 | 0,000287 | 3745,44 | 56,3 | 4,9 | 24,01 | 8,0 | |
59,9 | 0,0175 | 1,0472 | 0,000306 | 3588,01 | 56,9 | 3,0 | 9,00 | 5,0 | |
56,7 | 0,0162 | 0,9175 | 0,000262 | 3214,89 | 55,5 | 1,2 | 1,44 | 2,1 | |
0,0170 | 0,000289 | 3025,00 | 56,4 | -1,4 | 1,96 | 2,5 | |||
54,3 | 0,0212 | 1,1504 | 0,000449 | 2948,49 | 60,8 | -6,5 | 42,25 | 12,0 | |
49,3 | 0,0181 | 0,8931 | 0,000328 | 2430,49 | 57,5 | -8,2 | 67,24 | 16,6 | |
Итого | 405,2 | 0,1291 | 7,5064 | 0,002413 | 23685,76 | 405,2 | 0,0 | 194,90 | 56,5 |
Среднее значение | 57,9 | 0,0184 | 1,0723 | 0,000345 | 3383,68 | 27,84 | 8,1 | ||
5,74 | 0,002145 | ||||||||
32,9476 | 0,000005 |
Значения параметров регрессии а и b составили:
Получено уравнение:
Индекс корреляции: Коэффициент аппроксимации: . Для уравнения равносторонней гиперболы получена наибольшая оценка тесноты связи: (по сравнению с линейной, степенной и показательной регрессиями), остается на допустимом уровне:
2.
где Fтабл=6,6>Fфакт, а=0,05.
где
Следовательно, принимается гипотеза Н0 о статистически незначимых параметрах этого уравнения. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.