Задача 8. Пусть имеются следующие данные об урожайности озимой пшеницы yt (ц/га) за 10 лет (табл

Пусть имеются следующие данные об урожайности озимой пшеницы y_t (ц/га) за 10 лет (табл. 13):

Таблица 13

t
y_t	16,3	20,2	17,1	7,7	15,3	16,3	19,9	14,4	18,7	20,7

Задания:

1. Построить линейную модель Y (t) = a ₀ + a ₁ t, параметры которой оценить методом наименьших квадратов (МНК).

2. Оценить адекватность построенной модели на основе исследования:

- случайной остаточной компоненты по критерию пиков;

- независимости уровней ряда остатков по d -критерию (d_н = 1,08 и
d_в = 1,36) и по первому коэффициенту автокорреляции (r _a = 0,36);

- нормальности распределения остаточной компоненты по
RS -критерию (критические уровни 2,67 – 3,69).

3. Построить точечный и интервальный прогнозы на два шага вперед (t _a = 1,12 для уровня вероятности 70% и n = 10).

4. Отобразить на графике фактические данные, результаты расчетов и прогнозирования.

Решение:

1. Расчеты коэффициентов модели будем проводить по формулам кривых роста оцененных МНК:

(40)

a ₀ = - a ₁× , (41)

где , - средние значения уровней ряда и моментов наблюдения соответственно.

Промежуточные расчеты приведены в табл. 14.

Оценка параметров регрессии:

а ₁ = » 0,3224;

а ₀ = 16,66 – 0,3224 × 5,5» 14,8867.

Таблица 14

	t	yt	(t-tcp)	(t-tcp)^2	(y-ycp)	(t-tcp)*(y-ycp)
		16,3	-4,5	20,25	-0,36	1,62
		20,2	-3,5	12,25	3,54	-12,39
		17,1	-2,5	6,25	0,44	-1,1
		7,7	-1,5	2,25	-8,96	13,44
		15,3	-0,5	0,25	-1,36	0,68
		16,3	0,5	0,25	-0,36	-0,18
		19,9	1,5	2,25	3,24	4,86
		14,4	2,5	6,25	-2,26	-5,65
		18,7	3,5	12,25	2,04	7,14
		20,7	4,5	20,25	4,04	18,18
сумма		166,6		82,5		26,6
среднее	5,5	16,66

В результате ручного расчета получено линейное уравнение зависимости y_t (урожайности) от t (время) в виде:

Y (t) = 14,89 + 0,32 t.

Оценка параметров модели средствами мастера диаграмм представлена на рис. 4.

Рис. 4. Корреляционное поле и тренд

2. Оценим качество построенной модели.

Модель является адекватной, если математическое ожидание значений остатков близко или равно нулю, и если значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения;

Проверка равенства нулю математического ожидания
уровней ряда остатков

Для этого найдем значения ряда остатков и произведем суммирование (табл. 15). В нашем случае » 0, поэтому гипотеза о равенстве математического ожидания значений остаточного ряда нулю выполняется.

Таблица 15

	t	Урожайность	Yрег	Е
		16,3	15,20909	1,090909
		20,2	15,53152	4,668485
		17,1	15,85394	1,246061
		7,7	16,17636	-8,47636
		15,3	16,49879	-1,19879
		16,3	16,82121	-0,52121
		19,9	17,14364	2,756364
		14,4	17,46606	-3,06606
		18,7	17,78848	0,911515
		20,7	18,11091	2,589091
сумма		166,6

Модель по данному свойству адекватна.

Проверка независимости (отсутствие автокорреляции)

Данное свойство проверяют с помощью критерия Дарбина-Уотсона. Для этого находится статистика Дарбина-Уотсона (d -статистика):

. (42)

Для проверки используют два пороговых значения d_в и d_н, зависящие только от числа наблюдений, числа регрессоров и уровня значимости.

Графически результат теста Дарбина-Уотсона можно изобразить следующим образом (рис. 5).

Расчетное значение d равно: = 1,9224

Значение рассчитанного параметра d больше d_в и меньше 4- d_в, поэтому принимаем гипотезу об отсутствии автокорреляции по критерию Дарбина-Уотсона.

Также для проверки наличия автокорреляции можно воспользоваться первым коэффициентом автокорреляции:

. (43)

Для принятия решения об отсутствии или наличие автокорреляции в исследуемом ряду расчетное значение r (1) сопоставляют с табличным (критическим) значением r _a для a = 0,05. Если r (1) < r _a, то гипотеза об отсутствии автокорреляции в исследуемом ряду может быть принята, иначе – делают вывод о наличии автокорреляции в ряду.

Вычислим r (1) для нашего примера:

r (1) = = 0,00662.

Рассчитанное значение меньше табличного. Это означает, что гипотеза об отсутствии автокорреляции в ряду урожайности может быть принята.

Модель по параметру независимости адекватна.

Проверка случайности возникновения отдельных
отклонений от тренда

Используем критерий, основанный на поворотных точках. Значение случайной переменной считается поворотной точкой, если оно одновременно больше (меньше) соседних с ним элементов. Если остатки случайны, то поворотная точка приходится примерно на каждые 1,5 наблюдения. Если их больше, то возмущения быстро колеблются, и это не может быть объяснено только случайностью. Если же их меньше, то последовательные значения случайного компонента положительно коррелированны.

Критерий случайности отклонений от тренда при уровне вероятности 0,95 можно представить как

, (44)

где р - фактическое количество поворотных точек в случайном ряду; 1,96 - квантиль нормального распределения для 5%-го уровня значимости.

Квадратные скобки означают, что от результата вычисления следует взять целую часть (не путать с процедурой округления!).

Если неравенство не соблюдается, то ряд остатков нельзя считать случайным (т.е. он содержит регулярную компоненту), стало быть, модель не является адекватной.

Построим график остатков (рис. 6).

Рис. 6. График остатков

Количество поворотных точек равно 4.

Значение = [2,9687] = 2.

Неравенство выполняется 4 > 2. Следовательно, свойство случайности выполняется. Модель по данному параметру адекватна.

Соответствие ряда остатков нормальному
закону распределения

Данное соответствие можно проверить с помощью RS -критерия:

, (45)

где e_max, e_min – соответственно максимальный и минимальный уровни ряда остатков; S _e - среднеквадратическое отклонение ряда остатков.

Если расчетное значение RS попадает между табулированными границами с заданным уровнем вероятности, то гипотеза о нормальном распределении ряда остатков принимается. В этом случае допустимо строить доверительный интервал прогноза.

Среднеквадратическое отклонение ряда остатков S _e = 3,6912.

RS = = 3,5611

Расчетное значение попадает в интервал [2,67-3,69], следовательно, выполняется свойство нормального распределения. Модель по этому параметру адекватна.

Если все пункты проверки дают положительный результат, то выбранная трендовая модель является адекватной реальному ряду экономической динамики, и, следовательно, ее можно использовать для построения прогнозных оценок. В противном случае - модель надо улучшать.

3. Точечный и интервальный прогнозы на два шага вперед.

Точечный прогноз – это прогноз, которым называется единственное значение прогнозируемого показателя. Это значение определяется подстановкой в полученное (рассчитанное) уравнение выбранной кривой роста величины времени t, соответствующей периоду упреждения:
t = n + 1; t = n + 2 и т.д.

Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами.

1. Выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.

2. Прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой. Поэтому и кривая, по которой осуществляется экстраполяция, также будет содержать случайную компоненту.

3. Тенденция характеризует движение среднего уровня ряда динамики, поэтому отдельные наблюдения могут от него отклоняться. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.

Интервальные прогнозы строятся на основе точечных прогнозов. Доверительным интервалом называется такой интервал, относительно которого можно с заранее выбранной вероятностью утверждать, что он содержит значение прогнозируемого показателя. Ширина интервала зависит от качества модели, т.е. степени ее близости к фактическим данным, числа наблюдений, горизонта прогнозирования и выбранного пользователем уровня вероятности.

При построении доверительного интервала прогноза рассчитывается величина U (k), которая для линейной модели имеет следующий вид

, (46)

где р – число факторных переменных; k – период прогнозирования; t _a - табличное значение t -статистики Стьюдента при заданном уровне значимости и числе наблюдений (значение t _a можно получить с помощью встроенной функции Excel СТЬЮДРАСПОБР); - стандартная ошибка (среднеквадратическое отклонение от модели).

Для других моделей величина U (k) рассчитывается аналогичным образом, но имеет более громоздкий вид. Как видно из формулы, величина U зависит прямо пропорционально от точности модели, коэффициента доверительной вероятности t _a, степени углубления в будущее на k шагов вперед, т.е. на момент t = n + k, и обратно пропорциональна объему наблюдений. Доверительный интервал прогноза будет иметь следующий вид:

U_y = ± U (k) (47)

Если построенная модель адекватна, то с выбранной пользователем вероятностью можно утверждать, что при сохранении сложившихся закономерностей развития прогнозируемая величина попадает в интервал, образованный верхней и нижней границей.

После получения прогнозных оценок необходимо убедиться в их разумности и непротиворечивости оценкам, полученным иным способом.

Построим прогнозы на два шага вперед (k = 1 и k = 2):

точечный

у ₁₁ = 14,887 + 0,322×11» 18,39

у ₁₂ = 14,887 + 0,322×12» 18,71

интервальный

Рассчитаем стандартную ошибку = 3,915

Тогда значение U (k) для расчета доверительного интервала будет равно:

U (1) = 3,915 × 1,108 = 5,254;

U (2) = 3,915 × 1,108 = 7,319.

Данные расчета верхних и нижних границ доверительного интервала приведены в табл. 8.

Таблица 16

n + k	U (k)	Прогноз	Верхняя граница	Нижняя граница
10 + 1	5,254	18,39	23,644	13,136
10 + 2	7,319	18,71	26,029	11,391

4. График фактических данных, результатов расчета и прогнозирования. Для построения графика прогнозирования воспользуемся инструментом Excel Мастер диаграмм.

Для этого необходимо:

1. Выделить диапазоны ячеек значений t, урожайности и оценки урожайности.

2. Запустить Мастер диаграмм, в диалоговом окне мастера выбрать тип диаграммы Точечный, на котором значения соединены отрезками. Далее в мастере установить необходимые настройки и параметры. Желательно для исходных значений у задать параметр, который обозначает фактические значения урожайности.

3. В диалоговом окне Исходные данные на вкладке Ряд добавить ряды для значений точечного и интервального прогноза. Для этого выбрать кнопку Добавить, в поле И мя указать название ряда, в поле Значение Х диапазон прогноза (11 и 12), в поле Значение Y диапазон либо точного, либо интервального прогнозов. Пример окна (рис. 7).

В результате график прогноза выглядит следующим образом (рис. 8).