Постановка задачи №1
Торговая компаниярасполагаетсемью магазинами типа «Морепродукты».
Компания планирует построить 8-й магазин с торговой площадью 1100 м2, для чего она разрабатывает бизнес-план и, в частности, эконометрическую модель магазина. На этой модели специалисты должны исследовать зависимость объема продаж (у - в десятках тыс.руб./день) от размера торговой площади (х – в сотнях м2).
Решение задачи №1
1) Нанести в координатах ХY точки на плоскость (построить корреляционное поле).
Решение. Для наглядности выберем наши данные из таблицы 1.2:
Таблица 2.1
xi | 1 | 1 | 2 | 3 | 4 | 5 | 8 |
yi | 2 | 3 | 4 | 5 | 5 | 7 | 14 |
На рисунке 2.1 представлено корреляционное поле. Как видно, зависимость между Х и Yтесная и прямая. она хорошо аппроксимируется прямой линиейс уравнением (2.1). Построим линию «на глаз» и найдём приближённые «графические» значения параметров регрессии: b0г=0,5; b1г=17/11=1,55. Ниже мы сравним их с расчётными значениями.
2) Найти методом наименьших квадратов уравнение регрессии Y по Х в линейной форме:
|
|
=b0+ b1x. | (2.1) |
Решение. Расчетные формулы для неизвестных параметров регрессии:
(2.2)
На основе таблиц2.1и 2.2 рассчитаем необходимые суммы, входящие в формулу (2.2).
Искомые оценки параметров регрессии и само уравнение регрессии:
b1= (27,86-3,43×5,71)/(17,14-11,76) =8,27/5,38=1,54 b0=5,71-1,54×3,43=0,43 =0,43+1,54x. |
Как видим, «графические» и расчётные значения параметров регрессии очень близки, значит расчёты сделаны верно.
у |
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||
16 |
|
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||||
14 |
|
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||
12 |
|
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||
10 |
|
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||
8 |
|
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||||
6 |
|
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||||
4 |
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
| ||||||||||||||||||
2 |
|
|
|
|
|
|
|
|
|
|
|
|
| |||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
| х | ||||||||||||||||||
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | ||||||||||||||||||
Рисунок 2.1
3) Построить расчётную линию регрессии на координатной плоскости XY.
Решение. Искомую линию проще всего построить по двум точкам (см. рис. 2.1), например (0; 0,43) и (8,00; 12,75).
Таблица 2.2
xi | yi | x2 | y2 | xiyi | (xi- )2 | xi | ei2=( xi-yi)2 |
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
1 | 2 | 1 | 4 | 2 | 5,90 | 1,97 | 0,00 |
1 | 3 | 1 | 9 | 3 | 5,90 | 1,97 | 1,06 |
2 | 4 | 4 | 16 | 8 | 2,04 | 3,51 | 0,22 |
3 | 5 | 9 | 25 | 15 | 0,18 | 5,05 | 0,00 |
4 | 5 | 16 | 25 | 20 | 0,32 | 6,59 | 2,53 |
5 | 7 | 25 | 49 | 35 | 2,46 | 8,13 | 1,28 |
8 | 14 | 64 | 196 | 112 | 20,88 | 12,75 | 1,56 |
24 | 40 | 120 | 324 | 195 | 37,68 | 6,65 |
(2.3) |
4) Показать графически и аналитически, что линия регрессии проходит через точку (, ).
Решение. Из графика на рисунке 2.1 видно, что линия регрессии проходит через точку “средних” ( =3,43; =5,71). Проверим это аналитически: =0,43+1,54×3,43 = 5,71, что и требовалось доказать.
5) На сколько вырастет средний объем продаж при увеличении х на 1.
Решение. При увеличении торговой площади на 1 (100 м2) в среднем объем продаж увеличится на b1= 1,54 (т.е. на 15400 руб./день).
6) Имеет ли смысл свободный член в уравнении регрессии.
Решение. Свободный член b0=0,43 смысла не имеет, т.к. при нулевой торговой площади положительного объема продаж быть не может.
7) Вычислить коэффициент корреляции между переменными X и Y.
Решение. Используем формулу:
(2.4)
Здесь известно все, кроме
Окончательно
Полученное значение коэффициента корреляции говорит о высокой (почти функциональной) зависимости объема продаж от размера торговой площади.
8) Определить графически и аналитически прогнозное среднее значение объема продаж для проектируемого магазина "СИ" с торговой площадью х=11 (напомним, что это 1100 м2).
Решение. Прогнозное значение из рисунка 2.1 и из формулы совпадают:
=0,43+1,54×11=17,37 (173700 руб./день)
9.а) Найти 95%-ный доверительный интервал для среднего прогнозного значения объема продаж.
Решение. Оценка значения условного МО Мх=11(Y) равна 17,37. Чтобы построить доверительный интервал для СВ х=11, нужно оценить дисперсию ее оценки .
Для этого определим дисперсию возмущений (см. табл. 2.2 графы 4-6):
Искомая дисперсия
Для статистики Стьюдента число степеней свободы k = n – 2 = 7 – 2 = 5. По табл.П2 находим значение t0,95;5=2,57 критерия Стьюдента. Искомый 95%-ный доверительный интервал для среднего прогнозного значения объема продаж магазина "СИ":
Нижнее значение интервала: 17,37-2,57×1,48=13,57.
Верхнее значение интервала: 17,37+2,57×1,48=21,37.
Окончательно интервал имеет вид:
9.б) Найти 95%-ный доверительный интервал для индивидуального прогнозного значения объема продаж xo=11.
Решение. Чтобы построить доверительный интервал для СВ хo=11, нужно оценить ее дисперсию:
Нижнее значение интервала: 17,37-2,57×1,88=12,54.
Верхнее значение интервала: 17,37+2,57×1,88=22,20.
Окончательно интервал имеет вид:
12,54 £ £ 22,20.
Как и следует из теории, этот интервал больше предыдущего и большой по величине. Коэффициент осцилляции для него:
Ко=(R/ )100%= ((22,2-12,54)/17,37)100%=55,6%.
10а) Найти с надежностью 0,95 интервальные оценки коэффициента регрессии b1.
Решение. Общая формула для расчета интервала:
|
|
b1-D£b1£b1+D,
где
Нижнее значение интервала: 1,54-0,48=1,06.
Верхнее значение интервала: 1,54+0,48=2,02.
Окончательно интервал имеет вид:
1,06 £b1£ 2,02.
10.б) Найти с надежностью 0,95 интервальные оценки дисперсии возмущений s2.
Решение. Найдем по табл.П3 (критерий Пирсона) табличное значение статистики хи-квадрат:
Формула для доверительного интервала:
11а) Оценить на уровне a=0,05 значимость уравнения регрессии Y по Х по критерию Фишера.
Решение. Вычислим суммы квадратов.
Общая сумма:
Q=å(yi- )2=13,77+7,35+2,93+0,51+0,51+1,67+68,73= 95,47.
Регрессионная сумма:
QR=å( i- )2=13,99+13,99+4,84+0,44+0,78+8,56+49,56=92,16.
Остаточная сумма: Qe=å( i-уi)2=6,65 (см.табл. 4).
Значение статистики Фишера:
Уравнение регрессии значимо, если F>Fa,k1,k2, где степени свободы k1=m-1=2-1=1, k2=n-m=7-2=5. По табл.П4 находим критическое значение F0,05;1;5=6,61. Так как 69,66 >6,61, то уравнение значимо: коэффициент регрессии b1 =1,54 значимо отличается от нуля.
11б) Оценить на уровне a=0,05 значимость уравнения регрессии Y по Х по критерию Стьюдента.
Решение. Уравнение парной регрессии значимо, если t>tкрит. Значение статистики Стьюдента:
По табл. П2 находим tкрит.=t0,95;7-2=5=2,57. Так как 8,22 > 2,57, то гипотезу Но(Но : β1=0) отвергаем и принимаем противоположную гипотезу Н1: уравнение значимо.
12) Определить коэффициент детерминации R2и раскрыть его смысл: на сколько процентов в среднем объем продаж зависит от размера торговой площади.
Решение. Используем формулу: R2= QR/Q = 92,16 / 95,47 = 0,97. R2 показывает, какая доля вариации зависимой переменной обусловлена вариацией объясняющей переменной. Ответ: эта доля составляет 97%.