Е) Модели Бокса-Дженкинса для нестационарных рядов

Модели Бокса-Дженкинса могут применяться и для описания нестационарных рядов, которые путем взятия разностей приводятся к стационарным. Например, стационарным может оказаться процесс

Для таких процессов модель Бокса-Дженкинса представляется в виде

(4. 8.17)

где ;

− стационарный процесс, образованный d -й разностью процесса ;

– среднее значение процесса ;

− некоррелированная случайная величина с нулевым математическим ожиданием;

− параметры модели (авторегрессии и скользящего среднего).

Прогнозирование показателей на основе моделей Бокса-Дженкинса включает следующие этапы:

– идентификацию типа модели (определение порядка взятия разности d, числа членов авторегрессии p и скользящего среднего q);

– предварительную оценку параметров модели;

– уточненную оценку параметров модели;

– диагностическую проверку ее адекватности;

– использование модели для прогнозирования, расчет дисперсии ошибок прогноза.

На первом этапе последовательно производится взятие очередной

(d -й) разности исходного временного ряда

wt= Dd = (1-B)d , (4. 8.18)

где B − оператор сдвига назад (B = );

D − оператор взятия разности (D = - ).

Выбор порядка разности d осуществляется последовательным перебором d=0,1,... до получения минимума дисперсии разностного временного ряда.

Для полученного разностного ряда вычисляются оценки:

– среднего значения

, (4.8.19)

где n = N – d;

N − число точек исходного временного ряда;

– автоковариационной функции

(k = 0,…, n/3); (4. 8.20)

– автокорреляционной функции

(k = 0,…, n/3); (4.8.21)

– частной автокорреляционной функции

при l=1

=

(l=2,…, n/3), (4.8.22)

где (j = 1,…, l-1).

Дальнейшая идентификация типа модели (определение параметров p и q) осуществляется на основании анализа поведения автокорреляционной и частной автокорреляционной функций. У процесса авторегрессии порядка p - АР(p) частная автокорреляционная функция равна нулю при k > p, а у процесса скользящего среднего порядка q - СС(q) автокорреляционная функция равна нулю при k > q.

Формула для оценки дисперсии выборочного коэффициента автокорреляции при задержках k, больших q, за которыми автокорреляционная функция процесса СС(q) равна нулю, получена Bartlett M. S. и имеет вид

. (4. 8.23)

Этот результат может использоваться для определения числа членов скользящего среднего q путем статистической проверки гипотезы

Н0: rk=0 (k > q).

Гипотеза не отвергается, если

(k > q). (4. 8.24)

Отметим, что в формуле (4. 8.24) вместо истинных значений ri стоят их оценки .

Если q невелико (q £ 2), то процесс можно описать в виде модели скользящего среднего СС(q).

Определяется число членов авторегрессии - p из условия, что при k > p случайная величина имеет нормальное распределение с нулевым математическим ожиданием и дисперсией D ()» 1 / n. Этот факт можно использовать для статистической проверки гипотезы о равенстве нулю истинных значений Фk,k для k > p.

Гипотеза не отвергается, если

(k > p). (4. 8.25)

Если p невелико (p £ 2), то процесс можно описать в виде модели авторегрессии АР(p).

Из величин p и q выбирается наименьшее, и процесс полагается либо СС(q), либо АР(p). Если p=q или p и q достаточно велики, то процесс следует идентифицировать как смешанный процесс АРСС(1,1).

Для решения вопроса идентификации моделей можно использовать ряд критериев:

– информационный критерий Акаике

ИКА (p;q) = n ln S2(p;q) + 2 (p+q);

– байесовский информационный критерий

БИК (p;q) = ln S2(p;q) + (p+q) ln n / n;

– критерий Хеннана-Куина

XK (p;q) = ln S2(p;q) + (p+q) c ln(ln n / n).

Здесь S2(p;q) − оценка дисперсии s2 остаточного ряда, а с − некоторая константа (c > 2).

Процедура подгонки состоит в вычислении критериальной функции для различных значений p и q и выборе тех p и q, при которых величина критериальной функции минимальна.

На втором этапе осуществляется предварительная оценка параметров авторегрессии и скользящего среднего.

Рассмотрим сначала процесс авторегрессии АР(р).

(4.8.26)

Умножим (4.8.26) на :

Берем математическое ожидание и получаем разностное уравнение для автоковариации μ ()

Отметим, что когда k >0, так как может включать реализации ε, имевшие место до момента t-k, а они некоррелированы с . Разделив все члены на дисперсию процесса, получим разностное уравнение для автокорреляционной функции

(4.8.27)

Имея коэффициенты автокорреляции, можно с их помощью оценить параметры авторегрессии. Для этого подставим в (4.8.27) k = 1,2,..,p и получимсистему линейных уравнений для

………………………………………………

(4.8.28)

Система уравнений (4.8.28) называется системой уравнений Юла – Уокера. Заменив теоретические автокорреляции на их оценки , можно получить оценки параметров модели авторегрессии.

Для модели скользящего среднего первоначальная оценка параметров может осуществляться на основе следующих соотношений

(4.8.29)

Задавая k = 1,2,..,q, получим систему уравнений, которая является нелинейной относительно оцениваемых параметров и решается с помощью итеративных процедур.

Таким образом, оценка параметров авторегрессии Ф (если р >0) находится из системы p линейных уравнений Юла-Уокера, а оценка параметров скользящего среднего Q осуществляется с помощью сложной итеративной процедуры.

На третьем этапе осуществляется уточнение оценок и , полученных на предыдущем этапе, с помощью алгоритма Марквардта, цель которого заключается в минимизации суммы квадратов et по параметрам и .

Диагностическая проверка адекватности моделей сводится к проверке статистической гипотезы о некоррелированности случайных величин et. Для этого могут использоваться критерий Дарбина-Уотсона и совокупный критерий согласия Бокса-Пирса. Этот вопрос будет рассмотрен несколько позже.

На последнем этапе производится вычисление прогнозных значений показателя. Для этого модель

Ф(B) (1 - B)d = Q(B) et (4.8.30)

приводится к виду

,

(4.8.31)

где величины получаются как коэффициенты при Bl в произведении

(1 - B)d на Ф(B).

Формула (4.8.31) позволяет прогнозировать yt рекуррентно для t=t+1, t+2,...., t+L, где t − текущий момент времени. При этом на i -м шаге в качестве величин yt+1, yt+2,... yt+i-1 используются их прогнозы, полученные на предыдущих шагах − t+1, t+2,... t+i-1, а et+1, et+2,... et+i-1 полагаются равными нулю. Величины εt, et-1, et-2,... et-q определяются на этапе уточненной оценки параметров модели.

Дисперсия ошибок прогноза вычисляется по формуле

, (4.8.32)

где - дисперсия ,

а величины yl определяются по формулам

y0= 1

y1= j1- q1

y2= j1y1+ j1- q2

..................................

yl= j1yl-1+.... + jp+dyl-p-d- ql.

При этом ql = 0 для l > q и yl = 0 при l < 0.

4.9. МОДЕЛЬ С ЦИКЛИЧНОСТЬЮ РАЗВИТИЯ

Наиболее распространенный подход к построению математических моделей прогнозирования циклических процессов заключается в первоначальном выделении тренда и анализе остаточного ряда в целях выявления и описания периодической компоненты. Для выделения тренда можно использовать процедуру сглаживания временных рядов с помощью метода скользящего среднего.

При анализе сезонных колебаний задача упрощается за счет того, что мы знаем их период – 1 год (это относится и к другим циклическим процессам с постоянным и известным периодом).

Скользящая средняя, применяемая для этой цели, должна иметь строго определенный период скольжения – 12 месяцев или 4 квартала. При этом индекс сезонности можно определить как отношение фактического уровня ряда к уровню, рассчитанному по скользящей средней. Очевидно, что значения индекса сезонности для данного месяца (квартала) будут различаться из года в год. Поэтому в качестве индекса сезонности следует использовать среднее значение индексов, полученных за ряд лет по одноименным месяцам или кварталам.

Однако полученные при этом данные относятся к интервалам с серединами между кварталами, а не к серединам интервалов (15 февраля, 15 мая, 15 августа, 15 ноября). Поэтому необходимо «центрировать» среднее. Наиболее просто это можно сделать, взяв средние последовательных пар средних, вычисленных по 4-м элементам. Такой процесс эквивалентен вычислению средних пяти элементов с весами [ ].

Если средний индекс сезонности за 12 месяцев или 4 квартала не равен единице, производится выравнивание индексов сезонности – деление всех индексов на их средний индекс.

Отметим, что разумно считать, что влияние сезонности носит мультипликативный характер. В этом случае

, (t=1,…,n; q=1,…,4) (4.9.1)

где sq – индекс сезонности;

gt – трендовая составляющая временного ряда.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: