Одна из важнейших задач регрессионного анализа состоит в прогнозировании на основе построенной модели развития изучаемого явления. При этом можно рассматривать точечный и интервальный прогноз значений зависимой переменной Y, т.е. определять точечные и интервальные оценки зависимой переменной Y, расположенные вне пределов обследованного диапазона значений независимой переменной X.
Пусть требуется оценить прогнозное среднее значение результирующей переменной Y для заданного значения xp объясняющей переменной X.
Точечный прогноз рассчитывается по выборочному уравнению регрессии:
yp * = a * × xp + b *. (2.30)
Интервальный прогноз для среднего значения результирующей переменной Y при заданном значении xp объясняющей переменной X с надежностью g определяется доверительным интервалом (2.23) при x = xp:
прогнозируемое среднее значение результирующей переменной Y при
x = xp с надежностью g = 1 – a накрывается интервалом
, (2.31)
где
yp * = a * × xp + b * – точечный прогноз среднего значения зависимой
|
|
переменной Y,
– значение выборочного
среднеквадратического отклонение (стандартной ошибки)
уравнения регрессии в прогнозируемой точке xp.
Интервальный прогноз для индивидуального значения результирующей переменной Y при заданном значении xp объясняющей переменной X с надежностью g определяется доверительным интервалом (2.24) при x = xp:
прогнозируемое значение результирующей переменной Y при x = xp с надежностью g = 1 – a принадлежит интервалу
, (2.32)
где
yp * = a * × xp + b * – точечный прогноз среднего значения зависимой
переменной Y,
– значение выборочного
среднеквадратического отклонение (стандартной ошибки)
индивидуальных значений зависимой переменной Y в
прогнозируемой точке xp.
Пример 2.5. По данным примера 2.2 необходимо:
1) найти с надежностью 0,95 интервальные оценки коэффициентов a, b линейной регрессионной модели и дисперсии возмущения s 2;
2) оценить среднее потребление одним членом семьи при доходе 160 у.е.;
3) найти 95%-ные доверительный интервал для индивидуального значения потребления на одного члена семьи при доходе 160 у.е.
Решение. 1). При решении примера 2.2 было вычислено, что , и , а при решении примера 2.3 – = 2 366,256.
По таблицам 1 и 2 Приложения находим t 1 – a /2(n – 2) = t 0, 975 (10) = 2,2281; ;
Искомые доверительные интервалы получим по формулам (2.20) – (2.22):
,
или
0,8478 < a < 1,0196;
–7,1473 < b < 14,5453;
2,0681 < s 2 < 18,8518.
2). Уравнение регрессии было получено в примере 2.2: y * = 0,9339 x + 3,699. Оценкой среднего потребления y = M (Y/ X = x) при x = 160 является величина y *(160), которая находится по уравнению регрессии:
y *(160) = 0,9339×160 + 3,699 = 153,123 (у.е.).
|
|
3). Воспользовавшись формулой (2.32), рассчитываем границы интервала, в котором с надежностью 0,95 будет находиться возможное значение потребления при уровне дохода x = 160:
,
или
(147,838; 158,408).
Следовательно, при доходе 160 у.е. возможное потребление с вероятностью 0,95 будет находиться в интервале (147,838 у.е.; 158,408 у.е.). g