Интервальный прогноз на основе линейного уравнения регрессии

В прогнозных расчетах по уравнению регрессии определяется предсказываемое ур значение как точечный прогноз при т. е. путем подстановки в линейное уравнение регрессии соответствующего значения х. Однако точечный прогноз явно нереален, поэтому он дополняется расчетом стан­дартной ошибки , т. е. и соответственно мы получаем ин­тервальную оценку прогнозного значения у*: .

Для того чтобы понять, как строится формула для определе­ния величин стандартной ошибки подставим в уравнение линейной регрессии выражение параметра а:

тогда уравнение регрессии примет вид:

Отсюда следует, что стандартная ошибка зависит от ошиб­ки и ошибки коэффициента регрессии b, т. е.

(2.23)

Из теории выборки известно, что Используя в каче­стве оценки остаточную дисперсию на одну степень свободы S2, получим формулу расчета ошибки среднего значения пере­менной у:

(2.24)

Ошибка коэффициента регрессии, как уже было показано, определяется формулой:

Считая, что прогнозное значение фактора получим следующую формулу расчета стандартной ошибки предсказывае­мого по линии регрессии значения, т. е. :

(2.25)

Соответственно имеет выражение:

(2.26)

Рассмотренная формула стандартной ошибки предсказываемого среднего значения у при заданном значении характеризует ошибку положение линейной регрессии. Величина стандартной ошибку достигает минимума при и возрастает по мере ошибки того, как «удаляется» от в любом направлении. Иными словами, чем больше разность между и тем больше ошибка с которой предсказывается среднее значение у для заданного значения . Можно ожидать наилучшие результаты прогноза, если признак – факторов х находиться в центре области наблюдений х, и нельзя ожидать хороших результатов прогноза при удалении от . Если же значение оказывается за пределом наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько отклоняется от области наблюдаемых значений фактора х.

Для примера 2.1 составит:

При ,

При

Соответственно составит эту же величину и при . Для прогнозируемого значения 95% доверительные интервалы при заданном определяются выражением: т.е. или

При прогнозное значение у составит:

ур = -5,79+ 36,84-4= 141,57, которое представляет собой точечный прогноз.

Прогноз линии регрессии в интервале составит:

На графике, приведенном на рис. 2.5, доверительные грани­цы для представляют собой гиперболы, расположенные по обе стороны от линии регрессии. Рис. 2.5 показывает, как изменяют­ся пределы в зависимости от изменения : две гиперболы по обе стороны от линии регрессии определяют 95 % доверитель­ные интервалы для среднего значения у при заданном значении х.

Однако фактические значения у варьируют около среднего значения . Индивидуальные значения у могут отклоняться от на величину случайной ошибки, дисперсия которой оценивает­ся как остаточная дисперсия на одну степень свободы S2. Поэто­му ошибка предсказываемого индивидуального значения у долж­на включать не только стандартную ошибку но и случайную ошибку S.

 
 


Рис. 2.5. Доверительный интервал линии регрессии:

а — верхняя доверительная граница; б — линия регрессии;

в — доверительный интервал для при ;

г - нижняя доверительная граница.

Средняя ошибка прогнозируемого индивидуального значения у составит:

(2.27)

По данным примера 2.1 получим:

Доверительные интервалы прогноза индивидуальных значений у при с вероятностью 0,95 составят: 141,57 ± 2,57 • 8,01, или 141,57 ± 20,59, это означает, что .

Интервал достаточно широк прежде всего за счет малого объема наблюдений.

При прогнозировании на основе уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной прогноза ошибки индивидуального значения у, но и от точности прогноза значение фактора х. Его величина может задаваться на основе анализа других моделей исходя из конкретной ситуации, а также анализа динамики данного фактора.

Рассмотренная формула средней ошибки индивидуального значения признака может быть использована также для оценки существенности различия предсказываемого значения и некоторого гипотетического значения.

Предположим для примера 2.1, что в предстоящем году в связи со стабилизацией экономики при выпуске продукции в 8 тыс.ед. затраты на производство не превысят 250 млн. руб. Означает величина ли это действие изменение закономерности или же данная величина затрат соответствует регрессионной модели?

Для того чтобы ответить на это вопрос, найдем точечный прогноз при х=8, т.е.

Предполагаем значение затрат, исходя из экономической ситуации, составляет 250,0. Для оценки существенности, различая этих величин, определим среднюю ошибку прогнозируемого значения:

Сравним ее с величиной предполагаемого снижения издер­жек производства,

т. е. 38,93.

Поскольку оценивается значимость только уменьшения зат­рат, то используется односторонний t - критерий Стьюдента. При ошибке в 5% с пятью степенями свободы tтабл = 2,015. Следова­тельно, предполагаемое уменьшение затрат значимо отличается от прогнозируемого по модели при 95 % - ном уровне доверия. Од­нако если увеличить вероятность до 99 %, при ошибке в 1 % фак­тическое значение t - критерия оказывается ниже табличного 3,365, и рассматриваемое различие в величине затрат статисти­чески незначимо.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: