Интервальная оценка функции регрессии

Построим доверительный интервал для функции регрессии, т.е. для условного математического ожидания , который с заданной надежностью (доверительной вероятностью) =1—  накрывает неизвестное значение

Найдем дисперсию групповой средней , представляющей выборочную оценку С этой целью уравнение регрессии (1.15) представим в виде:

                                               (2.7)

На рис. 2.1 линия регрессии (2.7) изображена графически. Для произвольного наблюдаемого значения , выделены его составляющие: средняя , приращение , образующие расчетное значение , и возмущение ,.

Дисперсия групповой средней равна сумме дисперсий двух независимых слагаемых выражения (2.7):

                                        (2.8)

Дисперсия выборочной средней

=                                                     (2.9)

Для нахождения дисперсии представим коэффициент регрессии в виде:

                                     (2.10)

тогда

                          (2.11)

Найдем оценку дисперсии групповых средних (2.8), учитывая (2.9) и (2.11) и заменяя  ее оценкой :

                                    (2.12)

Исходя из того, что статистика t = имеет -распределение Стьюдента с k=n—2 степенями свободы, можно построить доверительный интервал для условного математического ожидания

                                  (2.13)

                                                                                                    

где — стандартная ошибка групповой средней .

Из формул (2,12) и (2,13) видно, что величина доверительного интервала зависит от значения объясняющей переменной х: при х =  она минимальна, а по мере удаления х от  величина доверительного интервала увеличивается (рис. 2.2). Таким образом, прогноз значений (определение неизвестных значений) зависимой переменной у по уравнению регрессии оправдан, если значение объясняющей переменной не выходит за диапазон ее значений по выборке (причем тем более точный, чем ближе х к ). Другими словами, экстраполяция кривой регрессии, т.е. ее использование вне пределов обследованного диапазона значений объясняющей переменной (даже если она оправдана для рассматриваемой переменной исходя из смысла решаемой задачи) может привести к значительным погрешностям.

Построенная доверительная область для  (см. рис. 2.2) определяет местоположение модельной линии регрессии (т.е. условного математического ожидания), но не отдельных возможных значений зависимой переменной, которые отклоняются от средней. Поэтому при определении доверительного интервала для индивидуальных значений  зависимой переменной необходимо учитывать еще один источник вариации — рассеяние вокруг линии регрессии, т.е. в оценку суммарной дисперсии  следует включить величину . В результате оценка дисперсии индивидуальных значений при х = равна:

                                        (2.14)

а соответствующий доверительный интервал для прогнозов индивидуальных значений будет определяться по формуле:

                    (2.15)


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: