Торговое предприятие имеет сеть, состоящую из 12 магазинов, информация о деятельности которых представлена следующими данным[1] (табл. 3).
Таблица 3
№ мага-зина | Среднее число посетителей в день, тыс. чел, х | Годовой товарооборот, млн руб., у | № мага-зина | Среднее число посетителей в день, тыс. чел, х | Годовой товарооборот, млн руб., у |
8,25 | 19,76 | 12,36 | 75,01 | ||
10,24 | 38,09 | 10,81 | 89,05 | ||
9,31 | 40,95 | 9,89 | 91,13 | ||
11,01 | 41,08 | 13,72 | 91,26 | ||
8,54 | 56,29 | 12,27 | 99,84 | ||
7,51 | 68,51 | 13,92 | 108,55 |
Задания:
1. Построить линейную модель y = b 0 + b 1 x, параметры которой оценить методом наименьших квадратов.
2. Оценить тесноту и направление связи между переменными с помощью коэффициента корреляции, найти коэффициент детерминации и пояснить его смысл.
3. Проверить значимость уравнения регрессии на 5%-м уровне по
F -критерию, проверить значимость коэффициента регрессии по
t -статистике.
Решение:
При анализе статистических зависимостей широко используются графические методы, которые задают направление его дальнейшего анализа. В Excel для этого можно использовать средство Мастер диаграмм. Для создания диаграммы необходимо выделить данные, запустить мастер диаграмм, выбрать тип и вид диаграммы (для нашего примера тип диаграммы – Точечная), выбрать и уточнить ориентацию диапазона данных и ряда, настроить параметры диаграммы.
|
|
Для описания закономерностей в исследуемой выборке наблюдений строится линия тренда.
Для добавления линии тренда в диаграмму необходимо выполнить следующие действия:
1) щелкнуть правой кнопкой мыши по ряду данных;
2) в динамическом меню выбрать команду Добавить линию тренда. На экране появится окно Линия тренда (рис. 2);
3) выбрать вид зависимости регрессии. Для нашего примера тип тренда определим, как Линейный;
4) перейти на вкладку Параметры. В поле Показать уравнение на диаграмме установить подтверждение;
5) в случае необходимости можно задать остальные параметры.
Изобразим полученную зависимость графически точками координатной плоскости (рис. 2). Такое изображение статистической зависимости называется полем корреляции.
По расположению эмпирических точек можно предполагать наличие линейной корреляционной (регрессионной) зависимости между переменными х и у.
По данным табл. 2 найдем уравнение регрессии у по х. Расчеты произведем в Excel по формулам (4) – (10), промежуточные вычисления представим в табл. 4.
Рис. 3. Поле корреляции
Таблица 4
N | X | Y | X*Y | X*X | Y*Y |
8,25 | 19,76 | 163,02 | 68,0625 | 390,4576 | |
10,24 | 38,09 | 390,0416 | 104,8576 | 1450,848 | |
9,31 | 40,95 | 381,2445 | 86,6761 | 1676,903 | |
10,01 | 41,08 | 411,2108 | 100,2001 | 1687,566 | |
8,54 | 56,29 | 480,7166 | 72,9316 | 3168,564 | |
7,51 | 68,51 | 514,5101 | 56,4001 | 4693,62 | |
12,36 | 75,01 | 927,1236 | 152,7696 | 5626,5 | |
10,81 | 89,05 | 962,6305 | 116,8561 | 7929,903 | |
11,89 | 91,13 | 1083,536 | 141,3721 | 8304,677 | |
13,72 | 91,26 | 1252,087 | 188,2384 | 8328,388 | |
12,27 | 99,84 | 1225,037 | 150,5529 | 9968,026 | |
13,92 | 108,55 | 1511,016 | 193,7664 | 11783,1 | |
Сумма | 128,83 | 819,52 | 9302,173 | 1432,684 | 65008,55 |
Среднее | 10,73583333 | 68,2933 | 775,1811 | 119,3903 | 5417,38 |
Дисперсия | 4,132174306 | 753,4001222 | b1 | 10,163 | |
Cov(x,y) | 41,99527222 | b0 | -40,8149 |
Итак, уравнение регрессии у по х:
|
|
= -40,81 + 10,16 x.
Из полученного уравнения регрессии следует, что при увеличении среднего числа посетителей на 1 тыс. чел. годовой товарооборот увеличивается в среднем на 10,16 млн руб.
По исходным данным вычислим коэффициент корреляции.
Расчеты произведем в Excel, промежуточные вычисления см. табл. 4 и формулы (11), (12).
= 0,753,
т.е. связь между переменными достаточно тесная.
Оценим на уровне значимости a = 0,05 значимость уравнения регрессии у по х.
1-й способ. Используя данные табл. 5 вычислим необходимые суммы по формулам табл. 1:
= 9040,801 (см. столбец 6);
QR = = 5121,574 (см. столбец 7);
Qe = Q - QR = 9040,801 – 5121,574 = 3919,228
По формуле (19)
F = = 13,07.
По статистическим таблицам F -распределения F0,05;1;10 = 4,96. Так как
F > F 0,05;1;26, то уравнение регрессии значимо.
Таблица 5
N | X | Y | Yрег | Yi-Yрег | (Yi-Yср)^2 | (Yрег-Yср)^2 | (Xi-Xcp)^2 |
8,25 | 19,76 | 43,03 | -23,2698 | 2355,484 | 638,2452 | 6,179367 | |
10,24 | 38,09 | 63,254 | -25,1642 | 912,2413 | 25,39306 | 0,245851 | |
9,31 | 40,95 | 53,802 | -12,8526 | 747,6579 | 209,9815 | 2,033001 | |
10,01 | 41,08 | 60,916 | -19,8367 | 740,5655 | 54,41484 | 0,526834 | |
8,54 | 56,29 | 45,977 | 10,3129 | 144,08 | 498,0148 | 4,821684 | |
7,51 | 68,51 | 35,509 | 33,0008 | 0,046944 | 1074,799 | 10,406 | |
12,36 | 75,01 | 84,799 | -9,7897 | 45,11361 | 272,4612 | 2,637917 | |
10,81 | 89,05 | 69,047 | 20,0029 | 430,8392 | 0,568147 | 0,005501 | |
11,89 | 91,13 | 80,023 | 11,1069 | 521,5133 | 137,588 | 1,332101 | |
13,72 | 91,26 | 98,621 | -7,3614 | 527,4678 | 919,7921 | 8,905251 | |
12,27 | 99,84 | 83,886 | 15,9549 | 995,1922 | 243,102 | 2,353667 | |
13,92 | 108,55 | 100,654 | 7,8960 | 1620,599 | 1047,213 | 10,13892 | |
Сумма | 128,83 | 819,52 | 0,00 | 9040,801 | 5121,574 | 49,58609 | |
Среднее | 10,736 | 68,293 | |||||
b1 | 10,163 | ||||||
b0 | -40,8149 |
2-й способ. Учитывая, что b 1 = 10,163, = 49,586
(табл. 4), = =391,92 (табл. 1), по формуле (20)
t = = 3,61.
По таблице t -распределения t 0,95;10 = 2,23. Так как t > t 0,95;26, то коэффициент регрессии b 1, а значит, и уравнение парной линейной регрессии значимо.
Найдем коэффициент детерминации и поясним его смысл. Ранее было получено QR = 5121,574, Q = 9040,801. По формуле (22) = 0,5665 (или R 2 = r 2 = 0,7532 = 0,95665). Это означает, что изменения зависимой переменной у – годовой товарооборот – на 56,7% объясняется вариацией объясняющей переменной х – численностью покупателей.
Задача 2.
При изучении зависимости потребления материалов у от объема производства продукции х по 20 наблюдениям были получены следующие варианты уравнения регрессии:
1. у = 3 + 2 х + е.
(6,48)
2. ln у = 2,5 + 0,2ln x + e, r 2 = 0,68.
(6,19)
3. у = 1,1 + 0,8ln х + е, r 2 = 0,69.
(6,2)
4. у = 3 + 1,5 х + 0,1 х 2 + е, r 2 = 0,701.
(3,0) (2,65)
В скобках указаны фактические значения t -критерия.
Задания:
1. Определите коэффициент детерминации для 1-го уравнения.
2. Запишите функцию, характеризующую зависимость у от х во 2-м уравнении.
3. Определите коэффициенты эластичности для каждого из уравнений для х 0 = 2,5 тыс. шт.
Решение:
1. Чтобы определить коэффициент детерминации воспользуемся формулой (21).
Для уравнения парной линейной регрессии коэффициент детерминации r 2 = 0,70.
2. Уравнение 2 – это степенная функция, к которой применили преобразование. В качестве преобразования выполнили логарифмирование. Чтобы записать функцию проведем обратные преобразования.
ln у = 2,5 + 0,2ln x + e Þ у = е 2,5 ∙ х 0,2 Þ у = 1,28 х 0,2.
3. Чтобы рассчитать коэффициенты эластичности воспользуемся данными табл. 2. Результаты расчетов объединим в табл. 6.
Таблица 6
Вид функции | Коэффициент эластичности |
Линейная у = 3 + 2 х + е | |
Парабола у = 3 + 1,5 х + 0,1 х 2 + е | |
Степенная у = 1,28 х 0,2 | Э = 1,28 |
Полулогарифмическая у = 1,1 + 0,8ln x |
Рассчитаем точечный коэффициент эластичности для значения
х 0 = 2,5.
|
|
1. Для линейной модели у = 3 + 2 х + е.
= 0,625.
2. Для параболы у = 3 + 1,5 х + 0,1 х 2 + е.
= 0,678.
3. Для степенной функции у = 1,28 х 0,2.
Э = 1,28.
4. Для полулогарифмической функции у = 1,1 + 0,8ln x.
= 0,436.