Й учебный вопрос. Применение фиктивных переменных для моделирования сезонных колебаний.
Рассмотрим еще один метод моделирования временного ряда, содержащего сезонные колебания, — построение модели регрессии с включением фактора времени и фиктивных переменных. Количество фиктивных переменных в такой модели должно быть на единицу меньше числа моментов (периодов) времени внутри одного цикла колебаний. Например, при моделировании поквартальных данных модель должна включать четыре независимые переменные — фактор времени и три фиктивные переменные. Каждая фиктивная переменная отражает сезонную (циклическую) компоненту временного ряда для какого-либо одного периода. Она равна единице для данного периода и нулю для всех остальных периодов.
Пусть имеется временной ряд, содержащий циклические колебания периодичностью k. Модель регрессии с фиктивными переменными для этого ряда будет иметь вид:
(5.12)
Где
Например, при моделировании сезонных колебаний на основе поквартальных данных за несколько лет число кварталов внутри одного года к = 4, а общий вид модели следующий:
(5.13)
Где
Где
Где
Уравнение тренда для каждого квартала будет иметь следующий вид:
для I квартала: (5.14)
для II квартала: (5.15)
для III квартала: (5.16)
для IV квартала: (5.17)
Таким образом, фиктивные переменные позволяют дифференцировать величину свободного члена уравнения регрессии для каждого квартала. Она составит:
для I квартала (а+ с1);
для II квартала (а + с2);
для III квартала (а + с3);
д ля IV квартала а.
Параметр b в этой модели характеризует среднее абсолютное изменение уровней ряда под воздействием тенденции. В сущности, модель (5.13) есть аналог аддитивной модели временного ряда, поскольку фактический уровень временного ряда есть сумма трендовой, сезонной и случайной компонент.
От сезонных и циклических колебаний следует отличать единовременные изменения характера тенденции временного рада, вызванные структурными изменениями в экономике или иными факторами. В этом случае, начиная с некоторого момента времени происходит изменение характера динамики изучаемого показателя что приводит к изменению параметров тренда, описывающего эту динамику. Схематично такая ситуация изображена на рис. 5.8.
Момент (период) времени t * сопровождается значительными изменениями ряда факторов, оказывающих сильное воздействие на изучаемый показатель yt. Чаще всего эти изменения вызваны изменениями в общеэкономической ситуации или факторам (событиями) глобального характера, приведшими к изменению структуры экономики (например, начало крупных экономических реформ, изменение экономического курса, нефтяные кризисы и прочие факторы). Если исследуемый временной ряд включает в себя соответствующий момент (период) времени, то одной из задач его изучения становится выяснение вопроса о том, значимо ли повлияли общие структурные изменения на характер этой тенденции. 3
Если это влияние значимо, то для моделирования тенденции данного временного ряда следует использовать кусочно-линейные модели регрессии, т. е. разделить исходную совокупность на две подсовокупности (до момента времени t * и после момента t *) и построить отдельно по каждой подсовокупности уравнения линейной регрессии (на рис. 5.8 этим уравнениям соответствуют прямые (1) и (2)). Если структурные изменения незначительно повлияли на характер тенденции ряда уt, то ее можно описать с помощью единого для всей совокупности данных уравнения тренда (на рис. 5.8 этому уравнению соответствует прямая (3)).
Каждый из описанных выше подходов имеет свои положительные и отрицательные стороны. При построении кусочно-линейной модели происходит снижение остаточной суммы квадратов по сравнению с единым для всей совокупности уравнением тренда. Однако разделение исходной совокупности на две части ведет к потере числа наблюдений и, следовательно, к снижению числа степеней свободы в каждом уравнении кусочно-линейной модели. Построение единого для всей совокупности уравнения тренда, напротив, позволяет сохранить число наблюдений исходной совокупности, однако остаточная сумма квадратов по этому уравнению будет выше по сравнению с кусочно-линейной моделью. Очевидно, что выбор одной из двух моделей (кусочно-линейной или единого уравнения тренда) будет зависеть от соотношения между снижением остаточной дисперсии и потерей числа степеней свободы при переходе от единого уравнения регрессии к кусочно-линейной модели.
Формальный статистический тест для оценки этого соотношения был предложен Грегори Чоу. Применение этого теста предполагает расчет параметров уравнений трендов, графики которых изображены на рис. 5.8 прямыми (1), (2) и (3). Введем систему обозначений, приведенную в табл. 5.17.
Выдвинем гипотезу о структурной стабильности тенденции изучаемого временного ряда. *
Остаточную сумму квадратов по кусочно-линейной модели () можно найти как сумму и: (5.18)
Соответствующее ей число степеней свободы составит:
(5.19)
Тогда сокращение остаточной дисперсии при переходе от - единого уравнения тренда к кусочно-линейной модели можно определить следующим образом (B методике расчетов предполагается, что всегда больше, чем).
(5.20)
Число степеней свободы, соответствующее АС^, с учетом соотношения (5.19) будет равно:
(5.21)
Далее в соответствии с предложенной Г. Чоу методикой определяется фактическое значение F-критерия по следующим дисперсиям на одну степень свободы вариации:
(5.22)
Найденное значение сравнивают с табличным, полученным по таблицам распределения Фишера для уровня значимости и числа степеней свободы () и.
Если >, то гипотеза о структурной стабильности тенденции отклоняется, а влияние структурных изменений на динамику изучаемого показателя признают значимым. В этом случае моделирование тенденции временного ряда следует осуществлять с помощью кусочно-линейной модели. Если <, то нет оснований отклонять ноль-гипотезу о структурной стабильности тенденции. Ее моделирование следует осуществлять с помощью единого для всей совокупности уравнения тренда.
Отметим следующие особенности применения теста Чоу:
1. Если число параметров во всех уравнениях (1), (2), (3) (см. рис. 5.8 и табл. 5.17) одинаково и равно k, то формула (5.22) упрощается:
(5.23)
2. Тест Чоу позволяет сделать вывод о наличии или отсутствии структурной стабильности в изучаемом временном ряде. Если < то это означает, что уравнения (1) и (2) описывают одну и ту же тенденцию, а различия численных оценок их параметров соответственно статистически незначимы. Если же >, то гипотеза о структурной стабильности отклоняется, что означает статистическую значимость различий оценок параметров уравнений (1) и (2).
3. Применение теста Чоу предполагает соблюдение предпосылок о нормальном распределении остатков в уравнениях (1) и (2) и независимость их распределений.
Если гипотеза о структурной стабильности тенденции ряда уt, отклоняется, дальнейший анализ может заключаться в исследовании вопроса о причинах этих структурных различий и более детальном изучении характера изменения тенденции. В принятых нами обозначениях эти причины обуславливают различия оценок параметров уравнений (1) и (2). Возможны следующие сочетания изменения численных оценок параметров этих уравнений (рис. 5.9):
изменение численной оценки свободного члена уравнения тренда а2 по сравнению с я, при условии, что различия между статистически незначимы. Геометрически это означает, что прямые (1) и (2) параллельны (рис. 5.9 а). В данной ситуации можно говорить о скачкообразном изменении уровней ряда уt, в момент времени t* при неизменном среднем абсолютном приросте за период;
изменение численной оценки параметра по сравнению с при условии, что различия между статистически незначимы. Геометрически это означает, что прямые (1) и (2) пересекают ось ординат в одной точке (рис. 5.9 б). В этом случае изменение тенденции связано с изменением среднего абсолютного прироста временного ряда, начиная с момента времени t *, при неизменном начальном уровне ряда в момент времени t = 0;
изменение численных оценок параметров ах и а2, а также и Геометрически эта ситуация изображена на рис. 5.9в. Она означает, что изменение характера тенденции сопровождается изменением как начального уровня ряда, так и среднего за период абсолютного прироста.
Один из статистических методов тестирования при применении перечисленных выше ситуаций для характеристики тенденции изучаемого временного ряда был предложен американским экономистом Дамодаром Гуйарати. Этот метод основан на включении в модель регрессии фиктивной переменой которая принимает значения 1 для всех t<t* принадлежащие промежутку времени до изменения характера тенденции, далее — промежутку (1), и 0 значения для всех t<t*, принадлежащие промежутку времени после изменения характера тенденции, далее — промежутку (2). Д. Гуйарати предлагает определять параметры следующего уравнения регрессии:
(5.24)
Таким образом, для каждого промежутка времени получим следующие уравнения:
Промежуток (1) Z = 1;
Промежуток (2) Z = 0;
Сопоставив полученные уравнения с уравнениями (1) и (2), нетрудно заметить, что
(5.25)
.
Параметр есть разница между свободными членами уравнений (1) и (2), а параметр d - разница между параметрами и уравнений (1) и (2). Оценка статистической значимости различий и а также и эквивалентна оценке статистической значимости параметров b и d уравнения (5.24). Эту оценку можно провести при помощи t -критерия Стьюдента.
Таким образом, если в уравнении (5.24) b является статистически значимым, a d - нет, то изменение тенденции вызвано только различиями параметров и (рис. 5.9 а). Если в этом уравнении параметр d статистически значим, а — незначим, то изменение характера тенденции вызвано различиями параметров и (рис. 5.9 б). Наконец, если оба коэффициента и dявляются статистически значимыми, то на изменение характера тенденции повлияли как различия между а1 и а2 так и различия между и (рис. 5.9 в).
Этот метод можно использовать не только в дополнение к тесту Чоу, но и самостоятельно для проверки гипотезы о структурной стабильности тенденции изучаемого временного ряда. Основное его преимущество перед тестом Чоу состоит в том, что нужно построить только одно, а не три уравнения тренда.
Мы рассмотрели простейший случай применения теста Чоу для моделирования линейной тенденции. Однако этот тест (а также модель (5.24) с фиктивной переменной) может использоваться (и действительно используется во многих прикладных исследованиях) при проверке гипотез о структурной стабильности и в более сложных моделях взаимосвязи двух и более временных рядов.