Доверительный интервал для индивидуальных значений у при данном значения Х

Остановимся на следующем предположении для данной модели, что значения у распределены вдоль линии регрессии с вариацией ае, которая одинакова для всех значений х. Так как мы используем выборку, то существуют два элемента изменя­емости признака у. Один исходит из оцененной позиции математического ожида­ния (среднего) ц ■, а другой — из отклонений индивидуальных значений от своего среднего значения.

Эти два элемента различны: во-первых, благодаря колебаниям внутри выбор­ки, которые могут быть сокращены, если увеличится размер выборки; во-вторых, благодаря природе переменных эти колебания неизбежны. Поэтому утверждать доверительный интервал для индивидуальных значений у не похож на другие доверительные интервалы, которые полностью подвержены эффекту выборочных колебаний. Некоторые исследователи считают их интервалами «прогноза», а не доверительными интервалами. Но как бы их ни называли, важно понять различие между (1-р) 100%, интервалом для цу/х и интервалом для индивидуальных значений у при данном х.


Гл. 8. Линейная регрессия



Выражения доверительных интервалов очень похожи между собой. Единствен­ным значимым различием является то, что вариация для индивидуальных у при

данном значении х увеличивается на величину о£ • (1-р). 100%-ный доверительный интервал для индивидуальных значений у при х = xq имеет вид:

-. ' \Г, i ("о - *f

£ (х - xf

где: у = а + Ьх0.

С вероятностью 95% доверительный интервал в примере 8.1 составит:

J \0 - 2,89/ y±2,31.1,12>/l+-l + -^-.

Табл. 8.4 и рис. 8.19 показывают изменения двух доверительных интервалов по мере того, как меняется xq.

Таблица 8.4. Вычисление доверительных интервалов для nyfx и для у при данном значении х«, по данным примера 8.1

Расстояние, хо, миль Время, мин y=5,9i+2,66xo 95%-ные доверительные интервалы для
\ь&±мин у при данном Хо ±MUH
1,0 2,0 2,89 (х) 3,0 4,0 4,9 8,57 11,23 13,60 13,89 16,55 18,94 1,47 1,00 0,82 0,82 1,09 1,54 2,98 2,77 2,71 2,71 2,81 3,01

Даже всего лишь при 20-ти значениях приходится делать долгие и сложные вычисления. Используя ППП, большую часть работы можно сделать очень быстро. Важно понять, что делает та или иная программа и как интерпретировать ее результаты. К сожалению, различные программы имеют небольшое количество символов и знаков. Если вы имеете пакет программ по регрессионному анализу, то разберитесь сначала с простым примером, как в этой книге, а затем используйте ППП. Сравните производительность компьютера и вычислений вручную и тогда вы все поймете. Доскональное понимание двух различных линейных моделей также поможет, когда вы приступите к множественной регрессии, расчеты по которой всегда должны производиться на компьютере.


264 4.2. Анализ данных как составная часть принятия решений



Доверительный интервал дя* индикидуапших значений у

Оцененное

^*ч по регрессии

Доверительный интервал для линии, т.е. ц y/i



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: