Пример
Множественная регрессия
Прогнозирование
Регрессия на PC
Выбор зависимости
Преобразование функции
Регрессия для степенной функции
Как вы помните, спрос может описываться степенной функцией:
Q=aPb
Ее можно довольно просто привести к линейной, взяв натуральные логарифмы:
lnQ=lna+bln(P)
Это значит, что нужно просто преобразовать переменные — а потом считать по обычным формулам
Преобразовать переменные можно даже в Excel (функция LN())
Для наших данных зависимость получается такая:
lnQ=10.02 −2.089lnP
Отсюда выводится уравнение спроса:
Q=22421P−2.089
Как получилось 22421?
22421=e10.02
Если рассчитать R2 для новой модели, то мы получим 0.6618
А было — 0.6829
Это значит, что степенная функция не так хорошо описывает наши данные, как линейная, поэтому лучше выбрать последнюю
Для регрессионного анализа обычно используют специальные статистические пакеты (SPSS, Stata, Statistica и другие) — в них все делается автоматически и очень быстро
|
|
Для чего нужно уравнение?
Мы уже говорили в прошлой теме — как миниму, для оценки эластичности
Кроме того, для прогнозирования — теперь, подставив в уравнение нашу цену, мы можем с точностью в 68% оценить, каков будет объем продаж
Как повысить точность?
Самый лучший способ — ввести в уравнение другие переменные, которые влияют на спрос:
Q=α+β1P+β2P’+β3Y+β4A+...+ε
Преимущества множественной регрессии:
• оцениваем эффекты нескольких переменных
• даже если нам нужно оценить эффект только цены, это позволяет нам устранить влияние других факторов
• повышается R2, точность оценок и прогнозов
Например, в нашу модель можно ввести цену в прошлом месяце:
Фирма | Продажи (тыс. штук) | Цена | Прошлая цена |
A | |||
B | |||
C | |||
D | |||
E | |||
F | |||
G |
Это дает нам следующую модель (вручную расчеты слишком сложные, поэтому это сделано в статистическом пакете):
Q=235.2 −3.890Pt−6.394Pt−1
Результат: R2 увеличился до 0.965. Значит, наш спрос во многом определялся прошлой ценой
Множественная регрессия может быть в самых разных математических формах:
Модель | Форма | Преобразование | Понимание |
Линейная | Y = a + bX | никакого | X растет на 1 Y растет на b |
Степенная (лог-лог) | Y = aXb | InY = Ina + blnX | X растет на 1% Y растет на b% |
Экспоненциальная (лог-лин) | Y = aebX | InY = Ina + bX | X растет на 1 Y растет на bX % |
Логарифмическая (лин-лог) | Y = a + blnX | Y = a + blnX | X растет на 1% Y растет на b/100 |
Что это значит
• Стандартные ошибки — показывают границы ошибок в наших оценках, вспомогательная графа
|
|
• t-статистики: используются для оценки значимости коэффициентов (должны превышать определенное табличное значение)
• Уровни значимости (P>|t|): показывают, насколько статистически значимы наши оценки. Обычно считается, что они должны быть меньше 0.05 — значит, переменная действительно влияет
• Доверительные интервалы: показывают, в каких пределах в нашей модели изменяются переменные
Выбор модели
Если попробовать сделать регрессии для всех математических форм, то получим такие R2:
Модель | Только P | P и P’ |
Линейная | 0.62 | 0.95 |
Степенная | 0.59 | 0.93 |
Экспоненциальная | 0.56 | 0.96 |
Логарифмическая | 0.66 | 0.95 |
Судя по всему, эксспоненциальная предсказывает немного лучше. На ней и стоит остановиться
Важно отметить единицы измерения каждой переменной.
Например, оценка спроса на пиццу у студентов американских колледжей
Y= 26,67 - 0,088Х, + 0.138Х, - 0,076Х3 - 0,544Х4
Х1 – цена на пиццу - в центах
Х2 – стоимость обучения – в тыс.долл.
Х3 – цена прохладительных напитков - в центах
Х4 – месторасположение - принимает значение 1, если студенческий городок расположен в черте города, и равняется 0, если студенческий городок расположен где-то в другом месте
Y= 26,67 - 0,088Х1 + 0.138Х, - 0,076Х3 - 0,544Х4
Коэффициент перед X1 отрицателен, что соответствует закону спроса: при изменении цены на пиццу (Х1) величина спроса на нее будет меняться в противоположном направлении.
Положительный знак коэффициента платы за обучение говорит нам о том, что стоимость обучения и величина спроса на пиццу имеют прямую связь. Более высокая стоимость обучения связана с более высоким спросом на пиццу, и наоборот. Таким образом, пицца оказывается нормальным товаром.
Y= 26,67 - 0,088Х, + 0.138Х, - 0,076Х3 - 0,544Х4
Отрицательный знак цен на прохладительные напитки подтверждает тот факт, что пицца и лимонад являются дополняющими товарами. Когда цена на прохладительные напитки повышается, студенты колледжа начинают покупать меньше пиццы. При снижении цены на прохладительные напитки спрос на пиццу будет расти.
Отрицательный знак дами-переменной, отвечающей за расположение студенческого городка, говорит нам о том, что студенты, учащиеся в колледжах в черте города, в месяц будут покупать примерно на половину куска пиццы меньше (0,544), чем студенты из пригородов и окрестностей.
Y= 26,67 - 0,088Х1 + 0.138Х2 - 0,076Х3 - 0,544Х4
Каждый коэффициент говорит нам о том, насколько изменится величина спроса на пиццу по отношению к единичному изменению каждой объясняющей переменной.
Коэффициент перед X1 равняется -0,088: единичное изменение в цене приведет к изменению величины спроса на 0,088 в противоположном направлении – увеличение цены на 100 центов (или $1,00), приведет к снижению величины спроса на пиццу на 8,8 (100 х 0,088).
Увеличение платы за обучение на одну единицу (в данном случае $1 тыс.) приводит к увеличению спроса на пиццу на 0,138.