Примеры решения заданий. Пример 1. По семи территориям некоторого региона известны значения двух признаков

Пример 1. По семи территориям некоторого региона известны значения двух признаков:

Расходы на покупку продовольственных товаров в общих расходах (в процентах, ) Среднедневная заработная плата одного работающего (в денежных единицах, )
68,8 45,1
61,2 59,0
59,9 57,2
56,7 61,8
55,0 58,8
54,3 47,2
49,3 55,2

Требуется:

1. Для характеристики зависимости у от х рассчитать параметры следующих функций:

а) линейной;

б) степенной;

в) показательной;

г) равносторонней гиперболы.

2. Оценить каждую модель через среднюю ошибку аппроксимации и -ритерий Фишера.

Решение:

1а). Для расчета параметров и линейной регрессии решаем систему нормальных уравнений относительно и :

По исходным данным рассчитываем

Таблица 1

 
  68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
  61,2 59,0 3610,80 3481,00 3745,44 56,5 4,7 7,7
  59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
  56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
  55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
  54,3 47,2 2562,96 2227,84 2948,49 60,5 -6,2 11,4
  49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Итого 405,2 384,3 22162,34 21338,4 23685,76 405,2 0,0 56,7
Сред-нее 57,89 54,90 3166,05 3048,34 3383,68 - - 8,1
5,74 5,86 - - - - - -
32,92 34,34 - - - - - -

Уравнение регрессии =76,88-0,35 . С увеличением среднедневной заработной платы на 1 денежную единицу доля расхода на покупку продовольственных товаров снижается в среднем на 0,35 %-ных пункта. Рассчитаем линейный коэффициент парной корреляции:

Связь умеренная, обратная.

Определим коэффициент детерминации:

Вариация результата на 12,7% объясняется вариацией фактора .

Подставляя в уравнение регрессии фактические значения ,определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации :

В среднем расчетные значения отклоняются от фактических на 8,1%.

Рассчитываем -критерий: = .

Полученное значение указывает на необходимость принять гипотезу о случайной природе выявленной зависимости и статистической незначимости параметров уравнения и показателя тесноты связи.

1б).Построению степенной модели предшествует процедура линеаризации переменных. В данном примере линеаризация производится путем логарифмирования обеих частей уравнения:

;

,

где

Для расчетов используем данные табл. 2.

Таблица 2

 
  1,8376 1,6542 3,0398 3,3768 2,7364 61,0 7,8 60,8 11,3
  1,7868 1,7709 3,1642 3,1927 3,1361 56,3 4,9 24,0 8,0
  1,7774 1,7574 3,1236 3,1592 3,0885 56,8 3,1 9,6 5,2
  1,7536 1,7910 3,1407 3,0751 3,2077 55,5 1,2 1,4 2,1
  1,7404 1,7694 3,0795 3,0290 3,1308 56,3 -1,3 1,7 2,4
  1,7348 1,6739 2,9039 3,0095 2,8019 60,2 -5,9 34,8 10,9
  1,6928 1,7419 2,9487 2,8656 3,0342 57,4 -8,1 65,6 16,4
Итого 12,3234 12,1587 21,4003 21,7078 21,1355 403,5 1,7 197,9 56,3
Сред-нее 1,7605 1,7370 3,0572 3,1011 3,0194 - - 28,27 8,0
0,0425 0,0484 - - - - - - -
0,0018 0,0023 - - - - - - -

Рассчитаем и :

Получим линейное уравнение: =2,278-0,298 .

Выполнив его потенцирование, получим:

Подставляя в данное уравнение фактические значения х, получаем теоретическое значение результата . По ним рассчитываем показатели: тесноты связи – индекс корреляции и среднюю ошибку аппроксимации :

,

Характеристики степенной модели указывают, что она несколько лучше линейной функции описывает взаимосвязь.

1в). Построению уравнения показательной кривой предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:

,

где .

Для расчетов используем данные табл. 3.

Таблица 3

 
  1,8376 45,1 82,8758 3,3768 2034,01 60,7 8,1 65,61 11,8
  1,7868 59,0 105,4212 3,1927 3481,00 56,4 4,8 23,04 7,8
  1,7774 57,2 101,6673 3,1592 3271,84 56,9 3,0 9,00 5,0
  1,7536 61,8 108,3725 3,0751 3819,24 55,5 1,2 1,44 2,1
  1,7404 58,8 102,3355 3,0290 3457,44 56,4 -1,4 1,96 2,5
  1,7348 47,2 81,8826 3,0095 2227,84 60,0 -5,7 32,49 10,5
  1,6928 55,2 93,4426 2,8656 3047,04 57,5 -8,2 67,24 16,6
Ито-го 12,3234 384,3 675,9974 21,7078 21338,41 403,0 -1,8 200,78 56,3
Среднее 1,7605 54,9 96,5711 3,1011 3048,34 Х Х 28,68 8,0
0,0425 5,86 Х Х Х Х Х Х Х
0,0018 34,3396 х х х х Х х х

Значения параметров регрессии и составили:

Полученное линейное уравнение:

Произведем потенцирование полученного уравнения и запишем его в обычной форме:

Тесноту связи оценим через индекс корреляции :

Связь умеренная.

, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах. Показательная функция чуть хуже, чем степенная, описывает изучаемую зависимость.

1г). Уравнение односторонней гиперболы линеаризуется при замене: . Тогда

Для расчетов используем данные таблицы 4.

Таблица 4

 
  68,8 0,0222 1,5255 0.000492 4733,44 61,8 7,0 49,00 10,2
  61,2 0,0169 1,0373 0.000287 3745,44 56,3 4,9 24,01 8,0
  59,9 0,0175 1,0472 0,000306 3588,01 56,9 3,0 9,00 5,0
  56,7 0,0162 0,9175 0,000262 3214,89 55,5 1,2 1,44 2,1
    0,0170 0,9354 0,000289 3025,00 56,4 -1,4 1,96 2,5
  54,3 0,0212 1,1504 0,000449 2948,49 60,8 -6,5 42,25 12,0
  49,3 0,0181 0,8931 0,000328 2430,49 57,5 -8,2 67,24 16,6
Итого 405,2 0,1291 7,5064 0,002413 23685,76 405,2 0,0 194,90 56,5
Среднее 57,9 0,0184 1,0723 0,000345 3383,68 - - 27,84 8,1
5,74 0,002145 - - - - - - -
32,9476 0,000005 - - - - - - -

Значение параметров регрессии и составили:

Полученное уравнение:

Индекс корреляции:

. По уравнению равносторонней гиперболы получена наибольшая оценка тесноты связи: (по сравнению с линейной, степенной и показательной регрессиями). остается на допустимом уровне.

2. Вычислим критическое и наблюдаемое значения для критерия Фишера:

где

Следовательно, принимается гипотеза о статистически незначимых параметрах этого уравнения. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.

Пример 2. Известны значения двух признаков:

Расходы на покупку продовольственных товаров в общих расходах, , % Среднедневная заработная плата одного работающего, , условные единицы
68,8 45,1
61,2 59,0
59,9 57,2
56,7 61,8
55,0 58,8
54,3 47,2
49,3 55,2

Требуется:

1) для характеристики зависимости от рассчитать параметры парной линейной регрессионной модели;

2) оценить модель через ошибку аппроксимации и -критерий.

Решение:

Для расчёта параметров и линейной регрессии решаем систему нормальных уравнений.

По исходным данным рассчитаем (таблица 5):

Таблица 5

№ п/п
  68,8 45,1 3102,88 2034,01 4733,44 61,3 7,5 10,9
  61,2 59,0 3610,80 3481,00 4733,44 56,5 4,7 7,7
  59,9 57,2 3426,28 3271,84 3588,01 57,1 2,8 4,7
  56,7 61,8 3504,06 3819,24 3214,89 55,5 1,2 2,1
  55,0 58,8 3234,00 3457,44 3025,00 56,5 -1,5 2,7
  54,3 47,2 2562,06 2227,84 2948,49 60,5 -6,2 11,4
  49,3 55,2 2721,36 3047,04 2430,49 57,8 -8,5 17,2
Итого 405,2 384,2 22162,34 21338,41 23685,76 405,2 0,0 56,7
Среднее значение 57,89 54,9 3166,05 3048,34 3383,68 - - 8,1
5,7 5,9 - - - - - -
32,43 34,33 - - - - - -

Уравнение регрессии: у =76,88-0,35 х.

С увеличением среднедневной заработной платы на одну условную единицу доля расходов на покупку продовольственных товаров снижается в среднем на 0,35 процентных пункта.

Рассчитываем линейный коэффициент парной корреляции:

Связь умеренная, обратная.

Определим коэффициент детерминации: .

Вариация результата на 13,1% объясняется вариацией фактора х.

Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчётные) значения .

Найдём величину средней ошибки аппроксимации :

.

В среднем расчётные значения откланяются от фактических на 8,1%.

Рассчитаем -критерий: .

Полученное значение указывает на необходимость принять гипотезу о случайной природе выявленной зависимости, так как ( находится из таблицы значений F -критерия Фишера).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: