Прогнозирование на основе регрессионной модели

Одна из важнейших задач регрессионного анализа состоит в прогнозировании на основе построенной модели развития изучаемого явления. При этом можно рассматривать точечный и интервальный прогноз значений зависимой переменной Y, т.е. определять точечные и интервальные оценки зависимой переменной Y, расположенные вне пределов обследованного диапазона значений независимой переменной X.

Пусть требуется оценить прогнозное среднее значение результирующей переменной Y для заданного значения x_p объясняющей переменной X.

Точечный прогноз рассчитывается по выборочному уравнению регрессии:

y_p ^* = a ^* × x_p + b ^*. (2.30)

Интервальный прогноз для среднего значения результирующей переменной Y при заданном значении x_p объясняющей переменной X с надежностью g определяется доверительным интервалом (2.23) при x = x_p:

прогнозируемое среднее значение результирующей переменной Y при

x = x_p с надежностью g = 1 – a накрывается интервалом

, (2.31)

где

y_p ^* = a ^* × x_p + b ^* – точечный прогноз среднего значения зависимой

переменной Y,

– значение выборочного

среднеквадратического отклонение (стандартной ошибки)

уравнения регрессии в прогнозируемой точке x_p.

Интервальный прогноз для индивидуального значения результирующей переменной Y при заданном значении x_p объясняющей переменной X с надежностью g определяется доверительным интервалом (2.24) при x = x_p:

прогнозируемое значение результирующей переменной Y при x = x_p с надежностью g = 1 – a принадлежит интервалу

, (2.32)

где

y_p ^* = a ^* × x_p + b ^* – точечный прогноз среднего значения зависимой

переменной Y,

– значение выборочного

среднеквадратического отклонение (стандартной ошибки)

индивидуальных значений зависимой переменной Y в

прогнозируемой точке x_p.

Пример 2.5. По данным примера 2.2 необходимо:

1) найти с надежностью 0,95 интервальные оценки коэффициентов a, b линейной регрессионной модели и дисперсии возмущения s ²;

2) оценить среднее потребление одним членом семьи при доходе 160 у.е.;

3) найти 95%-ные доверительный интервал для индивидуального значения потребления на одного члена семьи при доходе 160 у.е.

Решение. 1). При решении примера 2.2 было вычислено, что , и , а при решении примера 2.3 – = 2 366,256.

По таблицам 1 и 2 Приложения находим t _{1 –} _a _/2(n – 2) = t _{0, 975}(10) = 2,2281; ;

Искомые доверительные интервалы получим по формулам (2.20) – (2.22):

или

0,8478 < a < 1,0196;

–7,1473 < b < 14,5453;

2,0681 < s ² < 18,8518.

2). Уравнение регрессии было получено в примере 2.2: y ^* = 0,9339 x + 3,699. Оценкой среднего потребления y = M (Y/ X = x) при x = 160 является величина y ^*(160), которая находится по уравнению регрессии:

y ^*(160) = 0,9339×160 + 3,699 = 153,123 (у.е.).

3). Воспользовавшись формулой (2.32), рассчитываем границы интервала, в котором с надежностью 0,95 будет находиться возможное значение потребления при уровне дохода x = 160: