ШАГ 3. ВЫБОР ЛУЧШЕЙ МОДЕЛИ ИЗ ВСЕХ ЗНАЧИМЫХ МОДЕЛЕЙ Эта процедура может быть рассмотрена с помощью примера, в котором определились три важнейших модели. Первоначально было пять независимых переменных х: х,, х2, х3, х4, х5, но три из них — х2, х4 и х5 — исключены из всех моделей. Эти переменные не помогают в прогнозировании у. Поэтому значимыми моделями оказались:
Модель 1: у прогнозируется только Xj. Модель 2: у прогнозируется только Х3. Модель 3: у прогнозируется X) и х3 вместе.
Для того, чтобы сделать выбор из этих моделей, проверим значения коэффициента корреляции и стандартного отклонения остатков ое. Коэффициент множественной корреляции — есть отношение "объясненной" вариации у к общей вариации у и вычисляется так же, как и коэффициент парной корреляции для простой регрессии при двух переменных. Модель, которая описывает связь между у и несколькими значениями х, имеет множественный коэффициент корреляции R,
который близок к + 1 и значение ас очень мало. Коэффициент детерминации г, который часто предлагается в ППП, описывает процент изменяемости у, которая обменяется моделью. Модель имеет значение в том случае, когда г близко к 100%.
|
|
Гл. 8. Линейная регрессия 26 7
В данном примере мы просто выбираем модель с наибольшим значением г2 и наименьшим значением сге. Предпочтительной моделью оказалась модель l.Ha следующем шаге необходимо сравнить модели 1 и 3. Различие между этими моделями состоит во включении переменной Хз в модель 3. Вопрос в том повышает ли значительно х3 точность предсказания значения у или же нет! Следующий критерий поможет ответить нам на этот вопрос — это частный F-критерий. Рассмотрим пример, иллюстрирующий всю процедуру построения множественной регрессии.
□ Пример 8.2. Руководство большой шоколадной фабрики заинтересовано в построении модели для того, чтобы предсказать реализацию одной из своих уже долго существующих торговых марок. Были собраны следующие данные.
Таблица 8.5. Построение модели для прогноза объема реализации
Дата | Реализация за 6 мес, млн. ф.ст. | Реклама, млн. ф.ст. | Цена, пенсы за ед. | Цена конкурента, пенсы за ед. | Индекс потребительских расходов |
19X0 январь-июнь июль-декабрь | 126 137 | 4,0 4,8 | 15,0 14,8 | 17,0 17,3 | 100,0 98,4 |
19X1 январь-июнь июль-декабрь | 148 191 | 3,8 8,7 | 15,2 15,5 | 16,8 16,2 | 101,2 103,5 |
19X2 январь-июнь июль-декабрь | 274 370 | 8.2 9,7 | 15,5 16,0 | 16,0 18,0 | 104,1 107,0 |
19X3 январь-июнь июль-декабрь | 432 445 | 14,7 18,7 | 18,1 13,0 | 20,2 15,8 | 107,4 108,5 |
19X4 январь-июнь июль-декабрь | 367 367 | 19,8 10,6 | 15,8 16,9 | 18,2 16,8 | 108,3 109,2 |
19X5 январь-июнь июль-декабрь | 321 307 | 8,6 6,5 | 16,3 16,1 | 17,0 18,3 | 110,1 110,7 |
19X6 январь-июнь июль-декабрь | 331 345 | 12,6 6,5 | 15,4 15,7 | 16,4 16,2 | 110,3 111,8 |
19X7 январь-июнь июль-декабрь | 364 384 | 5.8 5,7 | 16,0 15,1 | 17,7 16,2 | 112,3 112,9 J |
»иЛ4.2. Анализ данных как составная часть принятия решений
|
|
Определим "лучшую" модель для прогноза объема реализации.