Остановимся на следующем предположении для данной модели, что значения у распределены вдоль линии регрессии с вариацией ае, которая одинакова для всех значений х. Так как мы используем выборку, то существуют два элемента изменяемости признака у. Один исходит из оцененной позиции математического ожидания (среднего) ц ■, а другой — из отклонений индивидуальных значений от своего среднего значения.
Эти два элемента различны: во-первых, благодаря колебаниям внутри выборки, которые могут быть сокращены, если увеличится размер выборки; во-вторых, благодаря природе переменных эти колебания неизбежны. Поэтому утверждать доверительный интервал для индивидуальных значений у не похож на другие доверительные интервалы, которые полностью подвержены эффекту выборочных колебаний. Некоторые исследователи считают их интервалами «прогноза», а не доверительными интервалами. Но как бы их ни называли, важно понять различие между (1-р) 100%, интервалом для цу/х и интервалом для индивидуальных значений у при данном х.
|
|
Гл. 8. Линейная регрессия
Выражения доверительных интервалов очень похожи между собой. Единственным значимым различием является то, что вариация для индивидуальных у при
данном значении х увеличивается на величину о£ • (1-р). 100%-ный доверительный интервал для индивидуальных значений у при х = xq имеет вид:
-. ' \Г, i ("о - *f
£ (х - xf
где: у = а + Ьх0.
С вероятностью 95% доверительный интервал в примере 8.1 составит:
J \ (х0 - 2,89/ y±2,31.1,12>/l+-l + -^-.
Табл. 8.4 и рис. 8.19 показывают изменения двух доверительных интервалов по мере того, как меняется xq.
Таблица 8.4. Вычисление доверительных интервалов для nyfx и для у при данном значении х«, по данным примера 8.1
Расстояние, хо, миль | Время, мин y=5,9i+2,66xo | 95%-ные доверительные интервалы для | |
\ь&±мин | у при данном Хо ±MUH | ||
1,0 2,0 2,89 (х) 3,0 4,0 4,9 | 8,57 11,23 13,60 13,89 16,55 18,94 | 1,47 1,00 0,82 0,82 1,09 1,54 | 2,98 2,77 2,71 2,71 2,81 3,01 |
Даже всего лишь при 20-ти значениях приходится делать долгие и сложные вычисления. Используя ППП, большую часть работы можно сделать очень быстро. Важно понять, что делает та или иная программа и как интерпретировать ее результаты. К сожалению, различные программы имеют небольшое количество символов и знаков. Если вы имеете пакет программ по регрессионному анализу, то разберитесь сначала с простым примером, как в этой книге, а затем используйте ППП. Сравните производительность компьютера и вычислений вручную и тогда вы все поймете. Доскональное понимание двух различных линейных моделей также поможет, когда вы приступите к множественной регрессии, расчеты по которой всегда должны производиться на компьютере.
|
|
264 4.2. Анализ данных как составная часть принятия решений
Доверительный интервал дя* индикидуапших значений у |
Оцененное |
^*ч по регрессии |
Доверительный интервал для линии, т.е. ц y/i |