Остатки, млн. ф. ст.
60 -
40 -
20 -
О
-20
-40
-40
-80-1
о
О
© 0 0 0
эбо О Л
©0 0 ©
Продажи в мес, млн. ф. ст.
Рис. 8.20. Распределение остатков для модели с двумя переменными
Оказалось восемь ошибок с отклонениями 10% или более от фактического объема продаж. Наибольшая из них — 27%. Будет ли размер ошибки принят компанией при планировании деятельности? Ответ на этот вопрос будет зависеть от степени надежности других методов.
НЕЛИНЕЙНЫЕ СВЯЗИ
Вернемся к ситуации, когда у нас всего две переменные, но связь между ними нелинейная. На практике многие связи между переменными являются криволинейными. Например, связь может быть выражена уравнением:
у = ах + Ьх + с;
или: у = ах3 + Ьх2 + сх + d;
или: у = а + Ь/х;
или: у = ае х.
Если связь между переменными сильная, т.е. отклонение от криволинейной модели относительно небольшое, то мы сможем догадаться о природе наилучшей модели по диаграмме (полю корреляции). Однако трудно применить нелинейную модель к выборочной совокупности. Было бы легче, если бы мы могли манипулировать нелинейной моделью в линейной форме. В первых двух записанных моделях функциям х и х могут быть присвоены разные имена, и тогда будет использоваться множественная модель регрессии. Например, если модель:
у = ах3 + Ьх2 + сх + d
лучше всего описывает связь между у и х, то перепишем нашу модель, используя независимые переменные х, х, х:
4.2. Анализ данных как составная часть принятия решений
у = aZ + ЬХ + ex + d,
- 3 v 2 где Z = x и X = x.
Эти переменные рассматриваются как обыкновенные независимые переменные, даже если мы знаем, что Z, X и х не могут быть независимы друг от друга. Лучшая модель выбирается так же, как и в предыдущем разделе.
Третья и четвертая модели рассматриваются по-другому. Тут мы уже встречаемся с необходимостью так называемой линейной трансформации. Например, если связь
у = 1 + 4 / х,
то на графике это будет изображено кривой линией. Все необходимые действия могут быть представлены следующим образом:
Таблица 8.10. Расчет у - 1 + 4/х и х - 1/х
X | у = / + 4/х | х= 1/х |
0 1 2 3 4 | бесконечность 5 3 2,33 2 | бесконечность 1 0,5 0,33 0,25 |
2-
12 3 4х
Рис. 8.21. Нелинейная связь
Линейная модель, при трансформированной связи:
у = 1 + 4/х, где X = 1/х.
Гл. 8. Линейная регрессия
. Трансформировано ■ линию | |
5- | / |
4- | / |
3- | / |
2- 1- | 1--------,---------.------------------------------- ► |
Х-1/х
Рис. 8.22. Линейная трансформация связи
В общем, если исходная диаграмма показывает, что связь может быть изображена в форме: у = а + р/х, то представление у против X, где Х=1/х определит прямую линию. Воспользуемся простой линейной регрессией для установления модели: у = а + ЬХ. Рассчитанные значения а и b — лучшие значения а и р.
Четвертая модель, приведенная выше, включает трансформацию у с использованием натурального логарифма:
у = аеЬх.
Взяв логарифмы по е обеих сторон уравнения, получим:
In (у) = In (a) + In (еЬх),
поэтому: In (у) = In (а) + Ьх, где In = log и In (e) = 1.
Если Y=ln (у) и А=1п (а), то Y=A+b - уравнение линейной связи между Y и х. Пусть у = ае — связь между у и х, тогда мы должны трансформировать каждое значение у взятием логарифма по е. Определяем простую линейную регрессию Y (=1п (у)) по х для того, чтобы найти значения А и Ь. Антилогарифм записан ниже.
Таким образом, метод линейной регрессии может быть применен к нелинейным связям. Однако в этом случае требуется алгебраическое преобразование при записи исходной модели.
□ Пример 8.3. Следующая таблица содержит данные об общем годовом объеме производства промышленной продукции в определенной стране за период 19Х0-Х/-
4.2. Анализ данных как составная часть принятия решений Таблица 8.11. Годовой объем продукции 19ХО-Х7
Год | Годовая продукция, |
тыс. т | |
19X0 | |
19X1 | |
19X2 | |
19X3 | |
19X4 | |
19X5 | |
19X6 | |
19X7 |
Требуется:
1. Нарисовать диаграмму, прокомментировать ее.
2. Нарисовать новую диаграмму за следующий год.
3. Предположим, что связь между общей годовой продукцией и временем может быть описана как:
У = ab*.
где у — общий объем годовой продукции их — число лет с 19X0.
Используйте выборочную совокупность для оценки а и Ь. Объяснить получение Ь. 4. Используйте модель, описанную в п.З, для прогнозирования общего объема
продукции. Прокомментируйте ваш прогноз. Решение 1. Диаграмма по указанным данным.