Гл. 8. Линейная регрессия. Таблица 8.1. Исходные данные о расстоянии и времени поставок Расстояние, миль Время



Таблица 8.1. Исходные данные о расстоянии и времени поставок

Расстояние, миль Время, мин
3,5  
2,4  
4,9  
4,2  
3,0  
1,3  
1,0 б
3,0  
1,5  
4.1  

Нам нужно объяснить изменения времени (переменная у), принимая расстоя­ние в качестве независимой переменной х. Предположим, что затраченное время растет по мере увеличения расстояния. Представим данные на графике, чтобы определить связь, которая существует между переменными (рис. 8.4).

Врама

Одной постами,



о



12 -


О о


о


CL


т---------------- 1-------------- 1— w

3 4 5

Росстоннив одной постами, миль


Рис. 8.4. Зависимость времени поставок от расстояния по совокупности случайных данных о поставках

Рис. 8.4 свидетельствует об общем увеличении времени с увеличением рассто­яния. Точки на графике собраны в пучки вокруг прямой линии. Это означает, что мы можем использовать линейную модель для описания связи между двумя переменными. Точки не находятся точно на линии. Но было бы удивительно, если бы это было так, с точки зрения остальных факторов, которые могут повлиять на время поездки. Линейная модель, описывающая связь между двумя переменными,


74 6 4.2. Анализ данных как составная часть принятия решений

будет приближением к действительности — к истинному времени и расстоянию. Рис. 8-6 показывает наилучший вариант.

Для совокупности, данные из которой мы используем, существует множество различных расстояний при различном времени. Фактически, для любого расстоя­ния существует распределение возможного времени поставок. Наш пример вклю­чает десять поездок. Их можно сгруппировать по дальности поставки. Например, поставки на расстояние 1,0 мили 1,3, 1,5, 2,4, 3,0 миль и т.д.


Врем*, мии
и   .
20 - :!  
10 - 5 •  
  1 1 1 1 1  

I 2 3 4 5 6

Росстояни., миль

Рис. 8.5. Распределение времени поставок при определенном расстоянии

Эта идея важна для последующего анализа. Вернемся к нашим предположениям: наилучшей моделью для описания связи между временем поездки и расстоянием будет линейная модель. Теперь нам необходимо найти способ для нахождения приемлемой схемы определения точек этой линии по исходным данным. Эта линия называется линией наилучшего подбора.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: