Исследуется зависимость расходов на приобретение некоторого товара (группы товаров) семейными хозяйствами от располагаемого дохода.
В течение года i- я семья, имеющая располагаемый доход xi, затратила на приобретение этого товара Vi руб.
Таблица 8
Номер наблюдения, i | Располагаемый доход семейного хозяйства, (руб.) | Расходы семейного хозяйства на приобретение некоторого товара, V (руб.) |
150537,1 | 3736,022 | |
136570,9 | 3155,929 | |
151518,1 | 4091,394 | |
110318,6 | 3037,814 | |
155144,1 | 3603,569 | |
129398,2 | 3025,638 | |
3041,839 | ||
153232,6 | 3907,761 | |
174761,2 | 3961,124 | |
158744,2 | 4072,685 | |
151702,4 | 3991,685 | |
143872,3 | 3692,751 | |
166110,4 | 4227,418 | |
3783,255 | ||
114337,7 | 3174,847 | |
136811,3 | 3265,973 | |
135744,2 | 3359,623 | |
120100,7 | 2737,437 | |
169115,2 | 3801,232 | |
156830,3 | 3828,464 |
1. Подберите модель зависимости, в которой эластичность потребления рассматриваемого товара по отношению к располагаемому доходу не зависит от размера располагаемого дохода. Постоянство эластичности предполагает оценивание модели, линейной в логарифмах уровней.
|
|
2. Постройте график подбора значений регрессии. Рассчитайте среднюю ошибку аппроксимации. Сделайте выводы.
3. Проверьте значимость подобранной модели на уровне α =0,05, используя коэффициент детерминации и критерий Фишера.
4. С помощью графического метода оцените соответствие используемых для построения модели статистических данных стандартным предположениям регрессионного анализа.
5. В рамках подобранной модели проверьте гипотезы о том, что:
А) Потребление данного товара эластично по отношению к располагаемому доходу. Эластичное потребление соответствует значению эластичности, большему единицы по абсолютной величине ();
Б) Потребление данного товара неэластично по отношению к располагаемому доходу ().
Решение
1. Предположим, что модель зависимости затрат на приобретение некоторого товара V от располагаемого дохода семейного хозяйства имеет постоянную эластичность потребления. Постоянство эластичности означает модель вида (3.2):
Для подтверждения нашего предположения построим поле корреляции.
Рисунок 4. Поле корреляции
По форме облака рассеяния видно, что наше предположение о степенной модели наблюдений (см. рис. 3.1) подтверждается. При оценивании коэффициентов такой модели метод наименьших квадратов применяют к логарифмам уровней. Степенная модель линеаризуется путем логарифмирования:
.
Если обозначить , , , то
.
Рассчитаем логарифмы уровней и оценки наименьших квадратов для линейного уравнения парной регрессии . Промежуточные вычисления будем заносить в таблицу 9.
Таблица 9
i | xi | Vi | |||||
150537,1 | 3736,022 | 11,922 | 8,226 | 0,047 | 0,0022 | 98,067 | |
136570,9 | 3155,929 | 11,825 | 8,057 | -0,05 | 0,0025 | 95,271 | |
151518,1 | 4091,394 | 11,928 | 8,317 | 0,0535 | 0,0029 | 99,205 | |
110318,6 | 3037,814 | 11,611 | 8,019 | -0,264 | 0,0696 | 93,108 | |
155144,1 | 3603,569 | 11,952 | 8,19 | 0,0771 | 0,0059 | 97,884 | |
129398,2 | 3025,638 | 11,771 | 8,015 | -0,104 | 0,0109 | 94,34 | |
3041,839 | 11,679 | 8,02 | -0,196 | 0,0385 | 93,666 | ||
153232,6 | 3907,761 | 11,94 | 8,271 | 0,0647 | 0,0042 | 98,75 | |
174761,2 | 3961,124 | 12,071 | 8,284 | 0,1962 | 0,0385 | ||
158744,2 | 4072,685 | 11,975 | 8,312 | 0,1 | 0,01 | 99,537 | |
151702,4 | 3991,685 | 11,93 | 8,292 | 0,0547 | 0,003 | 98,921 | |
143872,3 | 3692,751 | 11,877 | 8,214 | 0,0017 | 3E-06 | 97,557 | |
166110,4 | 4227,418 | 12,02 | 8,349 | 0,1454 | 0,0211 | 100,36 | |
3783,255 | 12,011 | 8,238 | 0,1356 | 0,0184 | 98,948 | ||
114337,7 | 3174,847 | 11,647 | 8,063 | -0,228 | 0,052 | 93,909 | |
136811,3 | 3265,973 | 11,826 | 8,091 | -0,049 | 0,0024 | 95,691 | |
135744,2 | 3359,623 | 11,819 | 8,12 | -0,056 | 0,0032 | 95,962 | |
120100,7 | 2737,437 | 11,696 | 7,915 | -0,179 | 0,032 | 92,572 | |
169115,2 | 3801,232 | 12,038 | 8,243 | 0,1633 | 0,0267 | 99,233 | |
156830,3 | 3828,464 | 11,963 | 8,25 | 0,0879 | 0,0077 | 98,697 | |
Итого | 71496,46 | 237,5 | 163,5 | 0,3518 | 1941,7 | ||
Среднее значение | 3574,82 | 11,875 | 8,174 | 0,0176 | 97,084 |
Воспользуемся формулами (2.6) и (2.7):
|
|
;
.
Получили уравнение: , связывающее логарифмы уровней. Перейдем к исходной форме модели . Для этого рассчитаем коэффициент Таким образом, подобранная модель с постоянной эластичностью η = b = 0,808 имеет вид: .
2. Построим график подбора значений регрессии. Для этого вычислим значения , подставляя в найденную модель наблюдаемые значения x. Эти и дальнейшие вычисления отразим в таблице 10.
Таблица 10
i | xi | Vi | , % | ||||
150537,1 | 3736,022 | 3685,715 | 50,30694 | 2530,7886 | 1,347 | 25985,12 | |
136570,9 | 3155,929 | 3407,013 | -251,084 | 63043,247 | 7,956 | 175472,2 | |
151518,1 | 4091,394 | 3705,099 | 386,2947 | 149223,56 | 9,442 | 266845,6 | |
110318,6 | 3037,814 | 2867,513 | 170,3007 | 29002,319 | 5,606 | 288378,7 | |
155144,1 | 3603,569 | 3776,54 | -172,971 | 29918,989 | 4,8 | 826,3325 | |
129398,2 | 3025,638 | 3261,766 | -236,128 | 55756,234 | 7,804 | 301604,2 | |
3041,839 | 3028,447 | 13,39168 | 179,33707 | 0,44 | 284071,9 | ||
153232,6 | 3907,761 | 3738,92 | 168,8414 | 28507,433 | 4,321 | 110847,7 | |
174761,2 | 3961,124 | 4157,697 | -196,573 | 38640,771 | 4,963 | 149228,5 | |
158744,2 | 4072,685 | 3847,153 | 225,5317 | 50864,562 | 5,538 | 247866,6 | |
151702,4 | 3991,685 | 3708,738 | 282,9466 | 80058,797 | 7,088 | 173773,9 | |
143872,3 | 3692,751 | 3553,367 | 139,3845 | 19428,035 | 3,775 | 13907,01 | |
166110,4 | 4227,418 | 3990,686 | 236,7319 | 56042,005 | 5,6 | 425880,2 | |
3783,255 | 3959,277 | -176,022 | 30983,852 | 4,653 | 43443,9 | ||
114337,7 | 3174,847 | 2951,586 | 223,2607 | 49845,327 | 7,032 | 159980,8 | |
136811,3 | 3265,973 | 3411,855 | -145,882 | 21281,685 | 4,467 | 95388,32 | |
135744,2 | 3359,623 | 3390,349 | -30,7257 | 944,06702 | 0,915 | 46311,04 | |
120100,7 | 2737,437 | 3071,155 | -333,718 | 111367,99 | 12,19 | 701215,3 | |
169115,2 | 3801,232 | 4048,882 | -247,65 | 61330,322 | 6,515 | 51261,04 | |
156830,3 | 3828,464 | 3809,652 | 18,81159 | 353,87606 | 0,491 | 64333,76 | |
Итого | 71496,46 | 879303,2 | 104,9 | ||||
Среднее значение | 3574,82 | 5,25 |
На одном графике изобразим поле корреляции и подобранную по модели кривую.
Рисунок 5. График подбора
По графику видно, что подобранная модель хорошо аппроксимирует исходные данные.
Среднюю ошибку аппроксимации находим по формуле (2.31) с помощью столбцов 5 и 7 таблицы 10. свидетельствует о хорошем подборе модели к исходным данным.
3. Проверим значимость подобранной модели на уровне α =0,05, используя коэффициент детерминации и критерий Фишера.
Одной из наиболее эффективных оценок значимости уравнения регрессии являетсякоэффициент детерминации. Он характеризует степень выраженности связи между переменными. Определяется по формуле (2.35):
,
где - полная сумма квадратов;
- сумма квадратов, объясненная моделью;
- остаточная сумма квадратов.
Коэффициент детерминации показывает, что уравнением регрессии объясняется 75,8% дисперсии результативного признака, а на долю прочих факторов приходится 24,2%. То есть 75,8% вариации расходов на приобретение некоторого товара (V) объясняется вариацией фактора – дохода семейного хозяйства.
Оценим качество уравнения регрессии в целом с помощью -критерия Фишера. Рассчитаем фактическое значение -критерия. Так как коэффициент детерминации уже известен, проще всего использовать формулу (2.36):
|
|
где m – число оцениваемых параметров уравнения регрессии;
n – число наблюдений.
Табличное значение -критерия найдем по приложению 1 : . Так как , то признается статистическая значимость уравнения в целом.
4. С помощью графического метода оценим соответствие используемых для построения модели статистических данных стандартным предположениям регрессионного анализа.
Подобранная модель проверяется на отсутствие автокорреляционной зависимости остатков от номера наблюдения, на независимость случайных ошибок ε 1, ε 2,..., εn, математическое ожидание которых должно стремиться к нулю (Mεi =0 ), на постоянство или гомоскедастичность дисперсии ошибок [ ]. Анализ соблюдения перечисленных условий, проводят, используя графики стандартизированных остатков (формула 2.42)
где - оценка дисперсии остатков (формула 2.43)
Данные для построения графика зависимости стандартизированных остатков (как ординат) от оцененных значений (по оси абсцисс) занесем в таблицу 11.
Таблица 11
i | xi | Vi | ||||
150537,1 | 3736,022 | 3685,715 | 50,30694 | 2530,7886 | 0,372 | |
136570,9 | 3155,929 | 3407,013 | -251,084 | 63043,247 | -1,86 | |
151518,1 | 4091,394 | 3705,099 | 386,2947 | 149223,56 | 2,854 | |
110318,6 | 3037,814 | 2867,513 | 170,3007 | 29002,319 | 1,258 | |
155144,1 | 3603,569 | 3776,54 | -172,971 | 29918,989 | -1,28 | |
129398,2 | 3025,638 | 3261,766 | -236,128 | 55756,234 | -1,74 | |
3041,839 | 3028,447 | 13,39168 | 179,33707 | 0,099 | ||
153232,6 | 3907,761 | 3738,92 | 168,8414 | 28507,433 | 1,247 | |
174761,2 | 3961,124 | 4157,697 | -196,573 | 38640,771 | -1,45 | |
158744,2 | 4072,685 | 3847,153 | 225,5317 | 50864,562 | 1,666 | |
151702,4 | 3991,685 | 3708,738 | 282,9466 | 80058,797 | 2,091 | |
143872,3 | 3692,751 | 3553,367 | 139,3845 | 19428,035 | 1,03 | |
166110,4 | 4227,418 | 3990,686 | 236,7319 | 56042,005 | 1,749 | |
3783,255 | 3959,277 | -176,022 | 30983,852 | -1,3 | ||
114337,7 | 3174,847 | 2951,586 | 223,2607 | 49845,327 | 1,65 | |
136811,3 | 3265,973 | 3411,855 | -145,882 | 21281,685 | -1,08 | |
135744,2 | 3359,623 | 3390,349 | -30,7257 | 944,06702 | -0,23 | |
120100,7 | 2737,437 | 3071,155 | -333,718 | 111367,99 | -2,47 | |
169115,2 | 3801,232 | 4048,882 | -247,65 | 61330,322 | -1,83 | |
156830,3 | 3828,464 | 3809,652 | 18,81159 | 353,87606 | 0,139 | |
Итого | 71496,46 | 879303,2 | ||||
Среднее значение | 3574,82 | |||||
18318,82 | ||||||
135,35 |
Проанализируем полученный график:
|
|
Рисунок 6. График стандартизированных остатков
На графике нет выделяющихся наблюдений, что могло бы указывать на отличие математического ожидания ошибок от нуля , либо на неоднородность дисперсии ошибок. Не наблюдается функциональной зависимости от величины , то есть дисперсия ошибок гомоскедастична.Судя по графику, условие выполняется, то есть спецификация модели подобрана правильно.
Таким образом, используемые для построения модели статистические данные соответствуют стандартным предположениям регрессионного анализа.
5. Проверим гипотезу А о том, что потребление данного товара эластично по отношению к располагаемому доходу. Эластичное потребление соответствует значению эластичности, большему единицы по абсолютной величине (А: ).
Воспользуемся формулой (3.41):
,
где – среднеквадратическое (стандартное) отклонение параметра модели b. Для его расчета используем формулу (3.40) и таблицу 12.
Таблица 12
i | xi | ||
150537,1 | 5668,175 | 32128207,83 | |
136570,9 | -8298,025 | 68857218,9 | |
151518,1 | 6649,175 | 44211528,18 | |
110318,6 | -34550,325 | ||
155144,1 | 10275,175 | 105579221,3 | |
129398,2 | -15470,725 | ||
-26832,925 | 720005864,1 | ||
153232,6 | 8363,675 | 69951059,51 | |
174761,2 | 29892,275 | 893548104,7 | |
158744,2 | 13875,275 | 192523256,3 | |
151702,4 | 6833,475 | 46696380,58 | |
143872,3 | -996,625 | 993261,3906 | |
166110,4 | 21241,475 | 451200260,2 | |
19624,075 | 385104319,6 | ||
114337,7 | -30531,225 | ||
136811,3 | -8057,625 | 64925320,64 | |
135744,2 | -9124,725 | 83260606,33 | |
120100,7 | -24768,225 | 613464969,7 | |
169115,2 | 24246,275 | 587881851,4 | |
156830,3 | 11961,375 | 143074491,9 | |
Итого | |||
Среднее значение | 144868,9 |
Значение критерия Стьюдента определим по приложению 2: t 1-0,05;18=2,1.
Нетрудно видеть, что при подстановке любого числа, большего 1 по абсолютной величине, данное неравенство выполняется. Так как наблюдаемое значение отношения больше табличного по абсолютной величине, такую гипотезу с вероятностью 0,95 следует отвергнуть. Это означает слишком большое отклонение оценки b от гипотетического значения параметра в сравнении с оценкой стандартного отклонения этого параметра.
Аналогично проверим гипотезу Б, состоящую в том, что потребление данного товара неэластично по отношению к располагаемому доходу (В: ). Данная гипотеза будет выполняться только при условии подстановки в неравенство чисел из интервала или .
Таким образом, гипотеза Б (потребление товара неэластично по отношению к располагаемому доходу) с вероятностью 0,95 принимается для значений , и отвергается с этой же вероятностью для других значений эластичности, меньших 1.
Как видим, при значениях параметра, не принадлежащих 0,95-процентному доверительному интервалу, обе гипотезы отвергаются. Следовательно, проверить обе гипотезы, то есть осуществить прогноз по подобранной модели, можно только в рассчитанном интервале.