Гл. 8. Линейная регрессия



Остатки, млн. ф. ст.


60 -

40 -

20 -

О

-20

-40

-40

-80-1


о




О

© 0 0 0

 

эбо О Л

©0 0 ©



Продажи в мес, млн. ф. ст.


Рис. 8.20. Распределение остатков для модели с двумя переменными

Оказалось восемь ошибок с отклонениями 10% или более от фактического объема продаж. Наибольшая из них — 27%. Будет ли размер ошибки принят компанией при планировании деятельности? Ответ на этот вопрос будет зависеть от степени надежности других методов.

НЕЛИНЕЙНЫЕ СВЯЗИ

Вернемся к ситуации, когда у нас всего две переменные, но связь между ними нелинейная. На практике многие связи между переменными являются криволи­нейными. Например, связь может быть выражена уравнением:

у = ах + Ьх + с;

или: у = ах3 + Ьх2 + сх + d;

или: у = а + Ь/х;

или: у = ае х.

Если связь между переменными сильная, т.е. отклонение от криволинейной модели относительно небольшое, то мы сможем догадаться о природе наилучшей модели по диаграмме (полю корреляции). Однако трудно применить нелинейную модель к выборочной совокупности. Было бы легче, если бы мы могли манипули­ровать нелинейной моделью в линейной форме. В первых двух записанных моделях функциям х и х могут быть присвоены разные имена, и тогда будет использоваться множественная модель регрессии. Например, если модель:

у = ах3 + Ьх2 + сх + d

лучше всего описывает связь между у и х, то перепишем нашу модель, используя независимые переменные х, х, х:



4.2. Анализ данных как составная часть принятия решений


у = aZ + ЬХ + ex + d,

- 3 v 2 где Z = x и X = x.

Эти переменные рассматриваются как обыкновенные независимые перемен­ные, даже если мы знаем, что Z, X и х не могут быть независимы друг от друга. Лучшая модель выбирается так же, как и в предыдущем разделе.

Третья и четвертая модели рассматриваются по-другому. Тут мы уже встречаемся с необходимостью так называемой линейной трансформации. Например, если связь

у = 1 + 4 / х,

то на графике это будет изображено кривой линией. Все необходимые действия могут быть представлены следующим образом:

Таблица 8.10. Расчет у - 1 + 4/х и х - 1/х

X у = / + 4/х х= 1/х
0 1 2 3 4 бесконечность 5 3 2,33 2 бесконечность 1 0,5 0,33 0,25

2-

12 3 4х

Рис. 8.21. Нелинейная связь

Линейная модель, при трансформированной связи:

у = 1 + 4/х, где X = 1/х.


Гл. 8. Линейная регрессия



. Трансформировано ■ линию
5- /
4- /
3- /
2- 1- 1--------,---------.------------------------------- ►

Х-1/х

Рис. 8.22. Линейная трансформация связи

В общем, если исходная диаграмма показывает, что связь может быть изобра­жена в форме: у = а + р/х, то представление у против X, где Х=1/х определит прямую линию. Воспользуемся простой линейной регрессией для установления модели: у = а + ЬХ. Рассчитанные значения а и b — лучшие значения а и р.

Четвертая модель, приведенная выше, включает трансформацию у с использо­ванием натурального логарифма:

у = аеЬх.

Взяв логарифмы по е обеих сторон уравнения, получим:

In (у) = In (a) + In (еЬх),

поэтому: In (у) = In (а) + Ьх, где In = log и In (e) = 1.

Если Y=ln (у) и А=1п (а), то Y=A+b - уравнение линейной связи между Y и х. Пусть у = ае — связь между у и х, тогда мы должны трансформировать каждое значение у взятием логарифма по е. Определяем простую линейную регрессию Y (=1п (у)) по х для того, чтобы найти значения А и Ь. Антилогарифм записан ниже.

Таким образом, метод линейной регрессии может быть применен к нелинейным связям. Однако в этом случае требуется алгебраическое преобразование при записи исходной модели.

□ Пример 8.3. Следующая таблица содержит данные об общем годовом объеме производства промышленной продукции в определенной стране за период 19Х0-Х/-


4.2. Анализ данных как составная часть принятия решений Таблица 8.11. Годовой объем продукции 19ХО-Х7

Год Годовая продукция,
  тыс. т
19X0  
19X1  
19X2  
19X3  
19X4  
19X5  
19X6  
19X7  

Требуется:

1. Нарисовать диаграмму, прокомментировать ее.

2. Нарисовать новую диаграмму за следующий год.

3. Предположим, что связь между общей годовой продукцией и временем может быть описана как:

У = ab*.

где у — общий объем годовой продукции их — число лет с 19X0.

Используйте выборочную совокупность для оценки а и Ь. Объяснить получение Ь. 4. Используйте модель, описанную в п.З, для прогнозирования общего объема

продукции. Прокомментируйте ваш прогноз. Решение 1. Диаграмма по указанным данным.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: