Примеры решения задач. Исследуется зависимость расходов на приобретение некоторого товара (группы товаров) семейными хозяйствами от располагаемого дохода

Исследуется зависимость расходов на приобретение некоторого товара (группы товаров) семейными хозяйствами от располагаемого дохода.

В течение года i- я семья, имеющая располагаемый доход xi, затратила на приобретение этого товара Vi руб.

Таблица 8

Номер наблюдения, i Располагаемый доход семейного хозяйства, (руб.) Расходы семейного хозяйства на приобретение некоторого товара, V (руб.)
  150537,1 3736,022
  136570,9 3155,929
  151518,1 4091,394
  110318,6 3037,814
  155144,1 3603,569
  129398,2 3025,638
    3041,839
  153232,6 3907,761
  174761,2 3961,124
  158744,2 4072,685
  151702,4 3991,685
  143872,3 3692,751
  166110,4 4227,418
    3783,255
  114337,7 3174,847
  136811,3 3265,973
  135744,2 3359,623
  120100,7 2737,437
  169115,2 3801,232
  156830,3 3828,464

1. Подберите модель зависимости, в которой эластичность потребления рассматриваемого товара по отношению к располагаемому доходу не зависит от размера располагаемого дохода. Постоянство эластичности предполагает оценивание модели, линейной в логарифмах уровней.

2. Постройте график подбора значений регрессии. Рассчитайте среднюю ошибку аппроксимации. Сделайте выводы.

3. Проверьте значимость подобранной модели на уровне α =0,05, используя коэффициент детерминации и критерий Фишера.

4. С помощью графического метода оцените соответствие используемых для построения модели статистических данных стандартным предположениям регрессионного анализа.

5. В рамках подобранной модели проверьте гипотезы о том, что:

А) Потребление данного товара эластично по отношению к располагаемому доходу. Эластичное потребление соответствует значению эластичности, большему единицы по абсолютной величине ();

Б) Потребление данного товара неэластично по отношению к располагаемому доходу ().

Решение

1. Предположим, что модель зависимости затрат на приобретение некоторого товара V от располагаемого дохода семейного хозяйства имеет постоянную эластичность потребления. Постоянство эластичности означает модель вида (3.2):

Для подтверждения нашего предположения построим поле корреляции.

Рисунок 4. Поле корреляции

По форме облака рассеяния видно, что наше предположение о степенной модели наблюдений (см. рис. 3.1) подтверждается. При оценивании коэффициентов такой модели метод наименьших квадратов применяют к логарифмам уровней. Степенная модель линеаризуется путем логарифмирования:

.

Если обозначить , , , то

.

Рассчитаем логарифмы уровней и оценки наименьших квадратов для линейного уравнения парной регрессии . Промежуточные вычисления будем заносить в таблицу 9.

Таблица 9

i xi Vi
               
  150537,1 3736,022 11,922 8,226 0,047 0,0022 98,067
  136570,9 3155,929 11,825 8,057 -0,05 0,0025 95,271
  151518,1 4091,394 11,928 8,317 0,0535 0,0029 99,205
  110318,6 3037,814 11,611 8,019 -0,264 0,0696 93,108
  155144,1 3603,569 11,952 8,19 0,0771 0,0059 97,884
  129398,2 3025,638 11,771 8,015 -0,104 0,0109 94,34
    3041,839 11,679 8,02 -0,196 0,0385 93,666
  153232,6 3907,761 11,94 8,271 0,0647 0,0042 98,75
  174761,2 3961,124 12,071 8,284 0,1962 0,0385  
  158744,2 4072,685 11,975 8,312 0,1 0,01 99,537
  151702,4 3991,685 11,93 8,292 0,0547 0,003 98,921
  143872,3 3692,751 11,877 8,214 0,0017 3E-06 97,557
  166110,4 4227,418 12,02 8,349 0,1454 0,0211 100,36
    3783,255 12,011 8,238 0,1356 0,0184 98,948
  114337,7 3174,847 11,647 8,063 -0,228 0,052 93,909
  136811,3 3265,973 11,826 8,091 -0,049 0,0024 95,691
  135744,2 3359,623 11,819 8,12 -0,056 0,0032 95,962
  120100,7 2737,437 11,696 7,915 -0,179 0,032 92,572
  169115,2 3801,232 12,038 8,243 0,1633 0,0267 99,233
  156830,3 3828,464 11,963 8,25 0,0879 0,0077 98,697
Итого   71496,46 237,5 163,5   0,3518 1941,7
Среднее значение   3574,82 11,875 8,174   0,0176 97,084

Воспользуемся формулами (2.6) и (2.7):

;

.

Получили уравнение: , связывающее логарифмы уровней. Перейдем к исходной форме модели . Для этого рассчитаем коэффициент Таким образом, подобранная модель с постоянной эластичностью η = b = 0,808 имеет вид: .

2. Построим график подбора значений регрессии. Для этого вычислим значения , подставляя в найденную модель наблюдаемые значения x. Эти и дальнейшие вычисления отразим в таблице 10.

Таблица 10

i xi Vi , %
               
  150537,1 3736,022 3685,715 50,30694 2530,7886 1,347 25985,12
  136570,9 3155,929 3407,013 -251,084 63043,247 7,956 175472,2
  151518,1 4091,394 3705,099 386,2947 149223,56 9,442 266845,6
  110318,6 3037,814 2867,513 170,3007 29002,319 5,606 288378,7
  155144,1 3603,569 3776,54 -172,971 29918,989 4,8 826,3325
  129398,2 3025,638 3261,766 -236,128 55756,234 7,804 301604,2
    3041,839 3028,447 13,39168 179,33707 0,44 284071,9
  153232,6 3907,761 3738,92 168,8414 28507,433 4,321 110847,7
  174761,2 3961,124 4157,697 -196,573 38640,771 4,963 149228,5
  158744,2 4072,685 3847,153 225,5317 50864,562 5,538 247866,6
  151702,4 3991,685 3708,738 282,9466 80058,797 7,088 173773,9
  143872,3 3692,751 3553,367 139,3845 19428,035 3,775 13907,01
  166110,4 4227,418 3990,686 236,7319 56042,005 5,6 425880,2
    3783,255 3959,277 -176,022 30983,852 4,653 43443,9
  114337,7 3174,847 2951,586 223,2607 49845,327 7,032 159980,8
  136811,3 3265,973 3411,855 -145,882 21281,685 4,467 95388,32
  135744,2 3359,623 3390,349 -30,7257 944,06702 0,915 46311,04
  120100,7 2737,437 3071,155 -333,718 111367,99 12,19 701215,3
  169115,2 3801,232 4048,882 -247,65 61330,322 6,515 51261,04
  156830,3 3828,464 3809,652 18,81159 353,87606 0,491 64333,76
Итого   71496,46     879303,2 104,9  
Среднее значение 3574,82       5,25  

На одном графике изобразим поле корреляции и подобранную по модели кривую.

Рисунок 5. График подбора

По графику видно, что подобранная модель хорошо аппроксимирует исходные данные.

Среднюю ошибку аппроксимации находим по формуле (2.31) с помощью столбцов 5 и 7 таблицы 10. свидетельствует о хорошем подборе модели к исходным данным.

3. Проверим значимость подобранной модели на уровне α =0,05, используя коэффициент детерминации и критерий Фишера.

Одной из наиболее эффективных оценок значимости уравнения регрессии являетсякоэффициент детерминации. Он характеризует степень выраженности связи между переменными. Определяется по формуле (2.35):

,

где - полная сумма квадратов;

- сумма квадратов, объясненная моделью;

- остаточная сумма квадратов.

Коэффициент детерминации показывает, что уравнением регрессии объясняется 75,8% дисперсии результативного признака, а на долю прочих факторов приходится 24,2%. То есть 75,8% вариации расходов на приобретение некоторого товара (V) объясняется вариацией фактора – дохода семейного хозяйства.

Оценим качество уравнения регрессии в целом с помощью -критерия Фишера. Рассчитаем фактическое значение -критерия. Так как коэффициент детерминации уже известен, проще всего использовать формулу (2.36):

где m – число оцениваемых параметров уравнения регрессии;

n – число наблюдений.

Табличное значение -критерия найдем по приложению 1 : . Так как , то признается статистическая значимость уравнения в целом.

4. С помощью графического метода оценим соответствие используемых для построения модели статистических данных стандартным предположениям регрессионного анализа.

Подобранная модель проверяется на отсутствие автокорреляционной зависимости остатков от номера наблюдения, на независимость случайных ошибок ε 1, ε 2,..., εn, математическое ожидание которых должно стремиться к нулю (i =0 ), на постоянство или гомоскедастичность дисперсии ошибок [ ]. Анализ соблюдения перечисленных условий, проводят, используя графики стандартизированных остатков (формула 2.42)

где - оценка дисперсии остатков (формула 2.43)

Данные для построения графика зависимости стандартизированных остатков (как ординат) от оцененных значений (по оси абсцисс) занесем в таблицу 11.

Таблица 11

i xi Vi
             
  150537,1 3736,022 3685,715 50,30694 2530,7886 0,372
  136570,9 3155,929 3407,013 -251,084 63043,247 -1,86
  151518,1 4091,394 3705,099 386,2947 149223,56 2,854
  110318,6 3037,814 2867,513 170,3007 29002,319 1,258
  155144,1 3603,569 3776,54 -172,971 29918,989 -1,28
  129398,2 3025,638 3261,766 -236,128 55756,234 -1,74
    3041,839 3028,447 13,39168 179,33707 0,099
  153232,6 3907,761 3738,92 168,8414 28507,433 1,247
  174761,2 3961,124 4157,697 -196,573 38640,771 -1,45
  158744,2 4072,685 3847,153 225,5317 50864,562 1,666
  151702,4 3991,685 3708,738 282,9466 80058,797 2,091
  143872,3 3692,751 3553,367 139,3845 19428,035 1,03
  166110,4 4227,418 3990,686 236,7319 56042,005 1,749
    3783,255 3959,277 -176,022 30983,852 -1,3
  114337,7 3174,847 2951,586 223,2607 49845,327 1,65
  136811,3 3265,973 3411,855 -145,882 21281,685 -1,08
  135744,2 3359,623 3390,349 -30,7257 944,06702 -0,23
  120100,7 2737,437 3071,155 -333,718 111367,99 -2,47
  169115,2 3801,232 4048,882 -247,65 61330,322 -1,83
  156830,3 3828,464 3809,652 18,81159 353,87606 0,139
Итого   71496,46     879303,2  
Среднее значение 3574,82        
      18318,82  
      135,35  

Проанализируем полученный график:

Рисунок 6. График стандартизированных остатков

На графике нет выделяющихся наблюдений, что могло бы указывать на отличие математического ожи­дания ошибок от нуля , либо на неоднородность дисперсии ошибок. Не наблюдается функциональной зависимости от величины , то есть дисперсия ошибок гомоскедастична.Судя по графику, условие выполняется, то есть спецификация модели подобрана правильно.

Таким образом, используемые для построения модели статистические данные соответствуют стандартным предположениям регрессионного анализа.

5. Проверим гипотезу А о том, что потребление данного товара эластично по отношению к располагаемому доходу. Эластичное потребление соответствует значению эластичности, большему единицы по абсолютной величине (А: ).

Воспользуемся формулой (3.41):

,

где – среднеквадратическое (стандартное) отклонение параметра модели b. Для его расчета используем формулу (3.40) и таблицу 12.

Таблица 12

i xi
       
  150537,1 5668,175 32128207,83
  136570,9 -8298,025 68857218,9
  151518,1 6649,175 44211528,18
  110318,6 -34550,325  
  155144,1 10275,175 105579221,3
  129398,2 -15470,725  
    -26832,925 720005864,1
  153232,6 8363,675 69951059,51
  174761,2 29892,275 893548104,7
  158744,2 13875,275 192523256,3
  151702,4 6833,475 46696380,58
  143872,3 -996,625 993261,3906
  166110,4 21241,475 451200260,2
    19624,075 385104319,6
  114337,7 -30531,225  
  136811,3 -8057,625 64925320,64
  135744,2 -9124,725 83260606,33
  120100,7 -24768,225 613464969,7
  169115,2 24246,275 587881851,4
  156830,3 11961,375 143074491,9
Итого      
Среднее значение 144868,9    

Значение критерия Стьюдента определим по приложению 2: t 1-0,05;18=2,1.

Нетрудно видеть, что при подстановке любого числа, большего 1 по абсолютной величине, данное неравенство выполняется. Так как наблюдаемое значение отношения больше табличного по абсолютной величине, такую гипотезу с вероятностью 0,95 следует отвергнуть. Это означает слишком большое отклонение оценки b от гипотетического значения параметра в сравнении с оценкой стандартного отклонения этого параметра.

Аналогично проверим гипотезу Б, состоящую в том, что потребление данного товара неэластично по отношению к располагаемому доходу (В: ). Данная гипотеза будет выполняться только при условии подстановки в неравенство чисел из интервала или .

Таким образом, гипотеза Б (потребление товара неэластично по отношению к располагаемому доходу) с вероятностью 0,95 принимается для значений , и отвергается с этой же вероятностью для других значений эластичности, меньших 1.

Как видим, при значениях параметра, не принадлежащих 0,95-процентному доверительному интервалу, обе гипотезы отвергаются. Следовательно, проверить обе гипотезы, то есть осуществить прогноз по подобранной модели, можно только в рассчитанном интервале.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: