Задача 1. Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена следующими данным[1] (табл

Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена следующими данным[1] (табл. 3).

Таблица 3

№ мага-зина Среднее число посетителей в день, тыс. чел, х Годовой товарооборот, млн руб., у № мага-зина Среднее число посетителей в день, тыс. чел, х Годовой товарооборот, млн руб., у
  8,25 19,76   12,36 75,01
  10,24 38,09   10,81 89,05
  9,31 40,95   9,89 91,13
  11,01 41,08   13,72 91,26
  8,54 56,29   12,27 99,84
  7,51 68,51   13,92 108,55

Задания:

1. Построить линейную модель y = b 0 + b 1 x, параметры которой оценить методом наименьших квадратов.

2. Оценить тесноту и направление связи между переменными с помощью коэффициента корреляции, найти коэффициент детерминации и пояснить его смысл.

3. Проверить значимость уравнения регрессии на 5%-м уровне по
F -критерию, проверить значимость коэффициента регрессии по
t -статистике.

Решение:

При анализе статистических зависимостей широко используются графические методы, которые задают направление его дальнейшего анализа. В Excel для этого можно использовать средство Мастер диаграмм. Для создания диаграммы необходимо выделить данные, запустить мастер диаграмм, выбрать тип и вид диаграммы (для нашего примера тип диаграммы – Точечная), выбрать и уточнить ориентацию диапазона данных и ряда, настроить параметры диаграммы.

Для описания закономерностей в исследуемой выборке наблюдений строится линия тренда.

Для добавления линии тренда в диаграмму необходимо выполнить следующие действия:

1) щелкнуть правой кнопкой мыши по ряду данных;

2) в динамическом меню выбрать команду Добавить линию тренда. На экране появится окно Линия тренда (рис. 2);

3) выбрать вид зависимости регрессии. Для нашего примера тип тренда определим, как Линейный;

4) перейти на вкладку Параметры. В поле Показать уравнение на диаграмме установить подтверждение;

5) в случае необходимости можно задать остальные параметры.

Изобразим полученную зависимость графически точками координатной плоскости (рис. 2). Такое изображение статистической зависимости называется полем корреляции.

По расположению эмпирических точек можно предполагать наличие линейной корреляционной (регрессионной) зависимости между переменными х и у.

По данным табл. 2 найдем уравнение регрессии у по х. Расчеты произведем в Excel по формулам (4) – (10), промежуточные вычисления представим в табл. 4.

Рис. 3. Поле корреляции

Таблица 4

N X Y X*Y X*X Y*Y
  8,25 19,76 163,02 68,0625 390,4576
  10,24 38,09 390,0416 104,8576 1450,848
  9,31 40,95 381,2445 86,6761 1676,903
  10,01 41,08 411,2108 100,2001 1687,566
  8,54 56,29 480,7166 72,9316 3168,564
  7,51 68,51 514,5101 56,4001 4693,62
  12,36 75,01 927,1236 152,7696 5626,5
  10,81 89,05 962,6305 116,8561 7929,903
  11,89 91,13 1083,536 141,3721 8304,677
  13,72 91,26 1252,087 188,2384 8328,388
  12,27 99,84 1225,037 150,5529 9968,026
  13,92 108,55 1511,016 193,7664 11783,1
Сумма 128,83 819,52 9302,173 1432,684 65008,55
Среднее 10,73583333 68,2933 775,1811 119,3903 5417,38
Дисперсия 4,132174306 753,4001222 b1 10,163  
Cov(x,y) 41,99527222   b0 -40,8149  

Итак, уравнение регрессии у по х:

= -40,81 + 10,16 x.

Из полученного уравнения регрессии следует, что при увеличении среднего числа посетителей на 1 тыс. чел. годовой товарооборот увеличивается в среднем на 10,16 млн руб.

По исходным данным вычислим коэффициент корреляции.

Расчеты произведем в Excel, промежуточные вычисления см. табл. 4 и формулы (11), (12).

= 0,753,

т.е. связь между переменными достаточно тесная.

Оценим на уровне значимости a = 0,05 значимость уравнения регрессии у по х.

1-й способ. Используя данные табл. 5 вычислим необходимые суммы по формулам табл. 1:

= 9040,801 (см. столбец 6);

QR = = 5121,574 (см. столбец 7);

Qe = Q - QR = 9040,801 – 5121,574 = 3919,228

По формуле (19)

F = = 13,07.

По статистическим таблицам F -распределения F0,05;1;10 = 4,96. Так как
F > F 0,05;1;26, то уравнение регрессии значимо.

Таблица 5

N X Y Yрег Yi-Yрег (Yi-Yср)^2 (Yрег-Yср)^2 (Xi-Xcp)^2
  8,25 19,76 43,03 -23,2698 2355,484 638,2452 6,179367
  10,24 38,09 63,254 -25,1642 912,2413 25,39306 0,245851
  9,31 40,95 53,802 -12,8526 747,6579 209,9815 2,033001
  10,01 41,08 60,916 -19,8367 740,5655 54,41484 0,526834
  8,54 56,29 45,977 10,3129 144,08 498,0148 4,821684
  7,51 68,51 35,509 33,0008 0,046944 1074,799 10,406
  12,36 75,01 84,799 -9,7897 45,11361 272,4612 2,637917
  10,81 89,05 69,047 20,0029 430,8392 0,568147 0,005501
  11,89 91,13 80,023 11,1069 521,5133 137,588 1,332101
  13,72 91,26 98,621 -7,3614 527,4678 919,7921 8,905251
  12,27 99,84 83,886 15,9549 995,1922 243,102 2,353667
  13,92 108,55 100,654 7,8960 1620,599 1047,213 10,13892
Сумма 128,83 819,52   0,00 9040,801 5121,574 49,58609
Среднее 10,736 68,293          
b1 10,163            
b0 -40,8149            

2-й способ. Учитывая, что b 1 = 10,163, = 49,586
(табл. 4), = =391,92 (табл. 1), по формуле (20)

t = = 3,61.

По таблице t -распределения t 0,95;10 = 2,23. Так как t > t 0,95;26, то коэффициент регрессии b 1, а значит, и уравнение парной линейной регрессии значимо.

Найдем коэффициент детерминации и поясним его смысл. Ранее было получено QR = 5121,574, Q = 9040,801. По формуле (22) = 0,5665 (или R 2 = r 2 = 0,7532 = 0,95665). Это означает, что изменения зависимой переменной у – годовой товарооборот – на 56,7% объясняется вариацией объясняющей переменной х – численностью покупателей.

Задача 2.

При изучении зависимости потребления материалов у от объема производства продукции х по 20 наблюдениям были получены следующие варианты уравнения регрессии:

1. у = 3 + 2 х + е.

(6,48)

2. ln у = 2,5 + 0,2ln x + e, r 2 = 0,68.

(6,19)

3. у = 1,1 + 0,8ln х + е, r 2 = 0,69.

(6,2)

4. у = 3 + 1,5 х + 0,1 х 2 + е, r 2 = 0,701.

(3,0) (2,65)

В скобках указаны фактические значения t -критерия.

Задания:

1. Определите коэффициент детерминации для 1-го уравнения.

2. Запишите функцию, характеризующую зависимость у от х во 2-м уравнении.

3. Определите коэффициенты эластичности для каждого из уравнений для х 0 = 2,5 тыс. шт.

Решение:

1. Чтобы определить коэффициент детерминации воспользуемся формулой (21).

Для уравнения парной линейной регрессии коэффициент детерминации r 2 = 0,70.

2. Уравнение 2 – это степенная функция, к которой применили преобразование. В качестве преобразования выполнили логарифмирование. Чтобы записать функцию проведем обратные преобразования.

ln у = 2,5 + 0,2ln x + e Þ у = е 2,5х 0,2 Þ у = 1,28 х 0,2.

3. Чтобы рассчитать коэффициенты эластичности воспользуемся данными табл. 2. Результаты расчетов объединим в табл. 6.

Таблица 6

Вид функции Коэффициент эластичности
Линейная у = 3 + 2 х + е
Парабола у = 3 + 1,5 х + 0,1 х 2 + е
Степенная у = 1,28 х 0,2 Э = 1,28
Полулогарифмическая у = 1,1 + 0,8ln x

Рассчитаем точечный коэффициент эластичности для значения
х 0 = 2,5.

1. Для линейной модели у = 3 + 2 х + е.

= 0,625.

2. Для параболы у = 3 + 1,5 х + 0,1 х 2 + е.

= 0,678.

3. Для степенной функции у = 1,28 х 0,2.

Э = 1,28.

4. Для полулогарифмической функции у = 1,1 + 0,8ln x.

= 0,436.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: