Гл. 8. Линейная регрессия 271
Так как все независимые переменные подчиняются этому правилу, то результаты проверки значимости для пяти переменных в данной модели обобщены в следующей таблице:
Таблица 8.7. Проверка значимости коэффициентов регрессии для пяти переменных
Независимая | Коэффициент | Значение | Достоверность |
переменная | регрессии Ь | t критерия | на 5%-ном уровне |
Время | -13,4 | -1,29 | не достоверно |
Реклама | 6,6 | 2,21 | почти достоверно |
Цена | -6,4 | -0,41 | не достоверно |
Конкурентная цена | 12,1 | 0,84 | не достоверно |
Индекс | 30,5 | 2,65 | достоверно |
Сейчас мы видим, что наша модель не достоверна, потому что четыре коэффициента регрессии не значимо отличны от нуля. Нам нужно решить, какую переменную следует исключить из модели.
В табл. 8.8 представлены шаги, предпринятые по мере того, как мы сокращаем число переменных в модели от 5 до 4, затем до 3, до 2 и, наконец, до 1 независимой переменной. Прочерки показывают, что переменная не включена в модель. Пользуясь результатами наших исследований, можно решить, какая переменная должна быть исключена из рассмотрения. Для каждой модели мы испытываем всю регрессию и отдельные коэффициенты регрессии. Если модель подходит по всем
|
|
критериям, то ае должно быть малым, а г — как можно ближе к 1.
Таблица 8.8. Исследование различных моделей регрессии
Количество переменных в модели | Значимость всей модели на 5%-ном уровне по F-критерию | Значимость коэффициентов регрессии по t-критерию | Имеет ли значимость модель | ос | г | ||||
Время | Реклама | Цена | Конкурентная цена | Индекс | |||||
5 4 3 2 2 1 | да да да да да да | нет да | да да да да | нет нет | нет нет нет | да да да да да | нет нет нет да да да | 42 43 41 41 50 62 | 0,94 0,93 0,93 0,93 0,89 0,82 |
Шаг 3. Какую из значимых моделей нужно использовать?
В нашем примере значение модели появились лишь тогда, когда количество переменных сократилось до двух. Сравнение моделей необходимо проводить через сопоставление стандартных отклонений остатков. Отклонение должно быть предельно малым числом. Первая модель с расходами на рекламу н индексом
2 724.2. Анализ данных как составная часть принятия решений
потребительских расходов является наилучшей, так как о( =41 по сравнению с
а =50 для модели с расходами на рекламу и временем как независимыми переменными. Последний шаг — сравнение лучшей модели с двумя переменными с лучшей моделью с одной переменной. По величине корреляции выбираем лучшую модель с одной переменной при г=0,82. Если бы добавление еще одной независимой переменной значительно улучшило модель, то мы смогли бы применить частный F-критерий для проверки. Этог критерий показывает, что введение величины расходов на рекламу значительно улучшает модель и нам нужно использовать две переменные: индекс потребительских расходов и расходы на рекламу. Окончательная модель:
|
|
Объем реализации = -1476 + Э,54х (реклама) + 15,8х (индекс) (млн. ф. ст./6 мес.).
Коэффициенты регрессии для расходов на рекламу и индекса потребительских расходов положительны, как мы и предполагали. Постоянная - 1476 (ф. ст.) выглядит абсурдной, но вспомним, что модель имеет силу только для значений, входящих в выборочную совокупность. Расходы на рекламу изменяются от 3,8 млн. ф. ст. до 19,8 млн. ф. ст., а индекс — от 98,4 до 112,9.
Этот пример хорошо показывает все сложности объяснения и расчета каждой отдельной величины многофакторной модели. Цель статистической модели — объяснить вариацию продаж, а не предоставить особую информацию по изолированному влиянию рекламы или индекса потребительских цен на реализацию. По данным выборки модель.дает некоторое представление о таких эффектах. В выборочной совокупности всегда возникает противоречие между теми или иными переменными. Поэтому коэффициенты регрессии при отдельных переменных должны использоваться с особым вниманием.
Наконец, при анализе мы должны проверить структуру и размер ошибок, а потому мы должны заранее предполагать большие ошибки. Ошибки рассчитываются следующим образом:
Ошибка = фактический объем реализации — ожидаемая реализация.
Таблица 8.9. Размер ошибок (млн. ф. ст.)
Фактическая | Ожидаемая | Ошибка | Фактическая | Ожидаемая | Ошибка | |
реализация | реализация | реализация | реализация | |||
-16 | -57 | |||||
-И | -25 | |||||
-51 | -28 | |||||
-56 | ||||||
-5 | ||||||