Постановка задачи статистического анализа временного ряда и подбор исходной информации

На первом этапе формулируется цель исследования, выполняется содержательный (логический и экономический) анализ исследуемого процесса; решается вопрос о выборе показателя, характеризующего его наиболее полно; подбирается исходная статистика; выбирается наиболее разумный период упреждения прогноза (на сколько шагов делается прогноз). Оптимальный горизонт, как правило, не должен превышать 1/3 объема данных.

3.3. Предварительный анализ данных временного ряда и расчет основных показателей его динамики

Все методы прогнозирования используют аппарат математической статистики, который требует от исходных данных, чтобы они были сопоставимы, достаточно представительны для проявления закономерности, однородны и устойчивы. Невыполнение одного из этих требований делает бессмысленным применение математического аппарата.

Сопоставимость достигается в результате одинакового подхода к наблюдениям на разных этапах формирования ряда динамики. Уровни во временных рядах должны выражаться в одних и тех же единицах измерения, иметь одинаковый шаг наблюдений, рассчитываться для одного и того же интервала времени, по одной и той же методике.

Требование однородности данных предполагает отсутствие сильных изломов тенденций, а также нетипичных, аномальных наблюдений.

Устойчивость характеризует преобладание закономерности над случайностью в изменении уровней ряда. На графиках устойчивых временных рядов даже визуально прослеживается закономерность, на графиках неустойчивых рядов изменения последовательных уровней представляются хаотичными, и поэтому поиск закономерностей в формировании значений уровней таких рядов лишен смысла.

Требование полноты данных обусловливается тем, что закономерность может обнаруживаться лишь при наличии минимально допустимого объекта наблюдений. Если целью исследования является построение модели динамики, то число уровней ряда наблюдений должно быть не меньше 7-10.

Соответствие исходной информации всем указанным требованиям предшествует построению графика динамики ряда. Построением графика исследуемого показателя начинается решений любой задачи по анализу и прогнозированию временных рядов. Лишь после этого переходят к расчету и анализу основных показателей динамики развития, построению модели прогнозирования, получению прогнозных оценок.

Напомним, что для количественной оценки динамики ряда применяются следующие статистические показатели: абсолютные приросты, темпы роста, темпы прироста, причем они могут разделяться на цепные, базисные и средние.

В основе расчета этих показателей динамики лежит сравнение уровней временного ряда. Если сравнение осуществляется с одним и тем же уровнем, принятым за базу сравнения, то эти показатели называются базисными. Если сравнение осуществляется при переменной базе, и каждый последующий уровень сравнивается с предыдущим, то вычисленные таким образом показатели называются цепными.

Абсолютный прирост Dy равен разности двух сравниваемых уровней.

Темп роста Т характеризует отношение двух сравниваемые уровней ряда, выраженное в процентах.

Темп прироста К характеризует абсолютный прирост в относительных величинах. Определенный в % темп прироста показывает, на сколько процентов изменился сравниваемый уровень по отношению к уровню, принятому за базу сравнения. В таблице 2 приведены выражения для вычисления базисных и цепных абсолютных приростов, темпов роста, темпов прироста. При этому использованы следующие обозначения:

y1, y2, …, yt, …, yn – уровни временного ряда t=1,2, …, n;

n – длина временного ряда;

yb – уровень временного ряда, принятый за базу сравнения.

Для получения обобщающих показателей динамики развития определяются средние величины: средний абсолютный прирост, средний темп роста и прироста.

Таблица 6

Основные показатели динамики

  Абсолютный прирост Темп роста Темп прироста
Цепной
Базисный
Средний

3.4. Выбор модели прогнозирования (спецификация модели) и численное оценивание ее параметров (параметризация модели)

Следующим этапом анализа экономических процессов является выявлений тенденций в развитии исследуемого показателя. Выдели здесь несколько подходов.

1. Тенденция проявляется, в первую очередь, в увеличении или уменьшении численного среднего текущего значения временного ряда. Тенденцию среднего значения можно определить визуально из графика динамики исходного ряда данных. Рассмотрим, например, графическое изображение динамического ряда урожайности картофеля рис. 8. Фактические уровни (точки, соединенные ломанной линией) ложатся равномерно по сторонам прямолинейной тенденции.

Наличие тенденции среднего уровня на графике становится более ясным, когда в нем отражены сглаженные значения исходных данных. Суть различных приемов сглаживания сводится к замене фактических уровней временного ряда расчетными, обладающими меньшей колеблемостью. Это способствует более четкому проявлению тенденции развития.

Наиболее распространенными методами сглаживания является использование скользящей средней и сравнение средних уровней за отдельные укрупненные подпериоды. Для иллюстрации методов сглаживания рассмотрим тот же ряд динамики урожайности картофеля (см. табл.5), но за более продолжительное время: с 1987 по 2007 г. (табл. 7).

Метод скользящей средней величины состоит в вычислении средних уровней динамического ряда последовательно, со сдвигом на один уровень. В табл. 7 приведена пятилетняя скользящая средняя: первая за 1987-1991 г.г., вторая за 1988-1992 г.г. и т.д. Каждая пятилетняя средняя относится к третьему (среднему) году пятилетия, поэтому для двух первых и двух последних лет скользящая средняя отсутствует. В общем виде при осреднении за m лет число скользящих средних составит n-m+1.

Таблица 7

Расчетная таблица

Годы Уровни ц/га yi Суммы за 5 лет, скользящие Средние за 5 лет, ц/га
1987   - -  
1988   - -  
      119,4
      120,2 +0,8
      132,6 +12,4
      136,4 +3,8
      137,6 +1,2
      144,4 +6,8
      146,8 +2,4
      145,0 -1,8
      152,8 +7,8
      153,8 +1,0
      157,0 +3,2
      162,4 +5,4
      171,4 +9,0
      175,0 +3,6
2003     181,0 +6,0
      187,8 +6,8
      186,6 -1,2
    - -  
    - -  

Скользящая средняя достаточно ярко выявляет наличие тенденции роста уровней: из 16 ее цепных абсолютных изменений 14 положительны и только 2 отрицательны, а в первичном ряду уровней из 19 абсолютных цепных изменений было 9 отрицательных.

Второй метод состоит в сравнении среди уровней за отдельные укрупненные подпериоды:

Таблица 9

Расчет средних уровней за укрупненные подпериоды

Период                
Среднегодовой уровень, ц/га 119,4 144,4 157,0 186,6

Сравнивая эти средние уровни, видим, что систематического роста или уменьшения их абсолютных изменений не наблюдается, что говорит в пользу гипотезы о линейном тренде.

Методы скользящей средней и отдельных среднегодовых уровней не позволяют дать числовую характеристику тенденции, так как не отделяют полностью колебания от тенденции, а лишь сглаживают их. Тем не менее, графическое изображение осредненных показателей динамики позволяет более явно определить тип тренда.

2. Более точно тип тренда по фактическому динамическому ряду устанавливается в рамках формализованных статистических процедур на основе статистической проверки гипотезы о постоянстве того или иного показателя динамики.

Так, если подтверждается гипотеза о несущественности различий ценных абсолютных приростов уровней ряда динамики, то делается вывод о линейной форме уравнения тренда.

В том случае, чтобы получить прогноз на один шаг вперед, достаточно к последнему наблюдению добавить значение среднего абсолютного прироста.

где – фактическое значение в последней n-ой точке ряда;

- прогнозная оценка значения уровня в точке n+1;

- значение среднего прироста, рассчитанное для временного ряда y1, y2, …, yn.

Если же гипотеза о линейности отклоняется, по скользящим средним и их цепным приростам вычисляют ускорения приростов и аналогичным методом проверяют существенность различия ускорения в подпериодах. Если несущественное различие ускорений, принимается гипотеза о том, что тренд – парабола II порядка. Если и гипотеза о постоянстве ускорений отклоняется, то по скользящей средней вычисляют цепные темпы роста и проверяют гипотезу об их постоянстве по подпериодам. Подтверждение (неотклонение) этой гипотезы означает принятие гипотезы о том, что тренд экспоненциальный.

Проверка гипотез о более сложных типах тенденций динамики, здесь излагаться не будет.

3. Распространенным средством выявления тенденции развития является выравнивание динамического ряда с помощью тех или иных функций времени (кривых роста). Кривая роста позволяет получить выравненные или теоретические значения уровней динамического ряда. Этот те уровни, которые наблюдались бы, если бы динамика явления полностью совпадала с кривой.

В настоящее время в литературе описано несколько десятков кривых роста, многие из которых широко применяются для выравнивания экономических временных рядов. Ниже приведена общая классификация математических функций (кривых роста), предназначенных для аналитического выравнивания временных рядов.

В практической работе используются следующие кривые роста, позволяющие описывать процессы трех основных типов: без предела роста; с пределом роста без точки перегиба; с пределом роста и с точкой перегиба.

Для описания процессов без предела роста служат функции:

Y(t)=A0+A1 . t - прямая;

Y(t)=A0+A1 . t+А2. t2 - парабола II порядка;

Y(t)=exp(A0). tA1 - степенная;

Y(t)=exp(A0+A1 . t) - экспонента;

Y(t)=exp(A0+A1 . t). tА2 - кинетическая кривая;

Y(t)=A0+A1 . Lnt. (1+A2 . Lnt) - линейно-логарифмическая

функция II порядка;

Y(t)=A0+A1 . Ln(t) - линейно-логарифмическая

функция I порядка;

Процессы развития такого типа характерны в основном для абсолютных объемных показателей, но часто им соответствует и развитие некоторых качественных относительных показателей.

Для описания процессов с пределом роста служат функции:

Y(t)=exp(A0+A1/ t) - кривая Джонсона;

Y(t)=A0+t/(t+A1) - вторая функция Торнквиста;

Y(t)=A0 - A1 . exp(-t) - модифицированная экспонента.

Процессы с пределом роста характерны для многих относительных показателей (душевное потребление продуктов питания, внесение удобрений на единицу площади, затраты на один рубль произведенной продукции и т.п.).

Для описания процессов третьего типа – с пределом роста и точкой перегиба используются кинетическая кривая (кривая Перла - Рида) и кривая Гомперца:

Y(t)=exp(A0 - A1 . exp (t)).

Такой тип развития характерен для спроса на некоторые новые товары.

Параметры моделей могут быть содержательно интерпретированы. Так, параметр А0 во всех моделях без предела роста задает начальные условия развития, а в моделях с пределом роста – асимптоту функций, параметр А 1 определяет скорость или интенсивность развития, параметр А2 – изменение скорости или интенсивности развития.

Вопрос о выборе кривой является основным при выравнивании ряда и предполагает знакомство с основными свойствами используемых кривых, выражающих те или иные качественные свойства развития.

Иногда вопрос о выборе кривой роста может быть решен исходя из визуального анализа графика исходных данных, в том числе сглаженных. Подбирают такую кривую роста, форма которой соответствует фактическому развитию процесса.

В статистической литературе описан метод последовательных разностей уровней ряда, помогающий при выборе кривых параболического типа.

Существует ряд других практических подходов, облегчающих процесс выбора формы кривой роста.

Чаще всего на практике к выбору формы кривой подходят исходя из значения критерия, в качестве которого принимают сумму квадратов отклонений фактический значений уровня от расчетных, получаемых выравниванием. Из рассматриваемых кривых предпочтение будет отдано той, которой соответствует минимальное значение критерия, т.к. чем меньше значение критерия, тем ближе к кривой ложатся данные наблюдений.

Этот подход реализован в современных пакетах статистической обработки данных и анализа временных рядов, осуществляющих выбор кривой роста среди весьма широкого их спектра (более 20-ти).

После того, как проведена спецификация модели тренда (т.е. выбрана форма кривой роста, отражающая тенденцию исследуемого показателя), необходимо рассчитать оценки ее параметров.

Оценка параметров в модели определяются методом наименьших квадратов. Как известно, суть его состоит в "отыскании" таких параметров, при которых сумма квадратов отклонений расчетных значений уровней от фактических значений была бы минимальной. Таким образом, эти оценки находятся в результате минимизации выражения:

(3)

где yt – фактическое значение временного ряда;

- расчетное значение;

n – длина временного ряда.

Не будем останавливаться на математическом аппарате метода наименьших квадратов, подробно описанного в литературе по математической статистике.

В соответствии с методом наименьших квадратов параметры кривых роста подбираются таким образом, чтобы график функции кривой роста располагался на минимальном удалении от точек исходных данных. Согласно методу наименьших квадратов при оценке параметров модели всем наблюдениям присваиваются равные веса, т.е. их информационная ценность признается равной, а тенденция развития на всем участке наблюдений – неизменной.

4. Наиболее перспективным для целей прогнозирования в настоящее время является использование так называемых адаптивных моделей.

При обработке временных рядов, как правило, наиболее ценной является информация последнего периода, т.к. необходимо знать, как будет развиваться тенденция, существующая в данный момент, а не тенденция, сложившаяся в среднем на всем рассматриваемом периоде.

При оценке параметров адаптивных моделей, в отличие от моделей кривых роста, наблюдениям (уровням ряда) присваиваются различные веса в зависимости от того, насколько сильным признается их влияние на текущий уровень. Это позволяет учитывать изменения в тенденции. Все адаптивные модели базируются на двух схемах: скользящего среднего (СС-модели) и авторегрессии (AP - модели).

Согласно схеме скользящего среднего, оценкой текущего уровня является взвешенное среднее всех предшествующих уровней, причем веса при наблюдениях убывают по мере удаления от последнего уровня, т.е. информационная ценность наблюдений признается тем большей, чем ближе находятся они к концу интервала наблюдений.

В авторегрессионной схеме оценкой текущего уровня является взвешенная сумма не всех, а нескольких предшествующих уровней; при этом весовые коэффициенты при наблюдениях не ранжированы. Информационная ценность наблюдений определяется не их близостью к моделируемому уровню, а теснотой связи между ними.

В практике статистического прогнозирования наиболее часто используются две базовые модели СС-модели – Брауна и Хольта, первая из которых является частным случаем второй. Эти модели представляют процесс развития как линейную тенденцию с постоянно изменяющимися параметрами.

Начальные значения параметров оцениваются по МНК на основе нескольких (например пяти) первых уровней ряда.

Параметры пересчитываются последовательно, от уровня к уровню с использованием рекуррентных уравнений и значения параметров последнего уровня определяют окончательный вид модели.

На рис. 9 приведена общая схема построения адаптивных моделей прогнозирования.

Важнейшим достоинством адаптивных методов является построение самокорректирующихся моделей, способных учитывать результат прогноза, сделанного на предыдущем шаге. Пусть модель находится в некотором состоянии, для которого определены текущие значения ее коэффициентов. На основе этой модели делается прогноз. При поступлении фактического значения оценивается ошибка прогноза (разница между этим значением и полученным по модели). Ошибка прогнозирования через обратную связь поступает в модель и учитывается в ней в соответствии с принятой процедурой перехода от одного состояния в другое. В результате вырабатываются "компенсирующие" изменения, состоящие в корректировании параметров для большего согласования поведения модели с динамикой ряда. Затем рассчитывается прогнозная оценка на следующий момент времени, и весь процесса повторяется вновь.

Таким образом, адаптация осуществляется итеративно с получением каждой новой фактической точки ряда. Модель постоянно "впитывает" новую информацию, приспосабливается к ней и поэтому отражает тенденцию развития, существующую в данный момент.

Скорость (быстроту) реакции модели ни изменения в динамике процесса характеризует так называемый параметр адаптации, значение которого может быть определено на основе эмпирических данных, выведено аналитическим способом или получено на основе метода проб.

На основе рассмотренных особенностей дадим определение адаптивным моделям. Адаптивными называются самокорректирующиеся (самонастраивающиеся) модели прогнозирования, которые способны оперативно реагировать на изменение условий путем учета результата прогноза, сделанного на предыдущем шаге, и учета различной информационной ценности уровней ряда.

 
 


Рис.9. Схема построения адаптивных моделей прогнозирования

Обозначения:

y(t) – фактические уровни временного ряда;

- прогноз, сделанный в момент t на r единиц времени (шагов) вперед;

e(t+1) – ошибка прогноза, полученная как разница между фактическим и прогнозным значением показателя в точке (t+1).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: