Лабораторная работа №2

ПРЕОБРАЗОВАНИЯ ВРЕМЕННЫХ РЯДОВ

ЦЕЛЬ И ЗАДАЧИ ИССЛЕДОВАНИЯ

Изучение и приобретение навыков преобразования временных рядов (в т.ч. применения методов сглаживания), реализованных в системе «Statistica».

ОСНОВЫ TЕОРИИ

Стартовая панель модуля Анализ временных рядов и прогнозирование имеет следую­щую структуру:

В верхней части панели, в информационном поле, записыва­ются имена анализируемых и преобразованных переменных (ВР).

Рядом с информационным полем расположены несколько кнопок - стандартных для всех модулей системы: они обеспечивают работу с данными, закрытие панели, а также от­крывают специальный диалог преобразования временных ря­дов: кнопка OK (transformations, autocorrelations, plots) - Да (преобразования, автокорреляции, графики).

Нижняя часть панели — функциональная, здесь располо­жены:

• кнопки, открывающие специальные диалоговые окна анализа,

• опции обработки пропущенных значений, помещенные в правом нижнем углу и объединенные заголовком: Replace missing data with - Заменить пропущенные данные.

Стандартные кнопки, открывающие файл данных, окно вы­бора переменных для анализа, окно выбора случаев, а также кнопки, удаляющие и сохраняющие переменные, закрывающие панель:

• Open data - Открыть данные;

• Variables - Переменные;

• Select cases - Выбрать случаи;

• Save variables - Сохранить переменные;

• Delete highlighted variable - Удалить высвеченные переменные;

• Cancel - Отменить (закрывает стартовую панель модуля).

Слева от имени анализируемых переменных вы видите зна­чок L в графе Lock, означающий, что переменные закрыты на ключ и не могут быть удалены без прерывания анализа. В процессе работы ряды многократно преобразовываются, однако, не все преобразования необходимы; чтобы не хранить лишнюю информацию, их следует удалить из диалога. Для это­го служит кнопка Delete highlighted variable - Удалить вы­свеченные переменные. Напротив, некоторые переменные нужно сохранить для дальнейшего анализа - Save variables - Сохранить переменные сохра­няет высвеченные переменные в файле данных STATISTICA. Сохраненную таким образом переменную можно проанализировать впоследствии в любом модуле STATISTICA

Рассмотрим верхнюю часть стартовой панели. Здесь расположена опция Number of backups per variables (series) - Число резервов для переменных (рядов), позво­ляющая автоматически иметь нужное число преобразований ряда в текущем диалоге.

Часто, например при разведочном анализе, возникает не­обходимость анализировать не все случаи (наблюдения в ряде), а рассмотреть лишь часть их (определенный отре­зок временного ряда, кусок траектории), тогда следует использовать кнопку Select cases — Выбрать случаи. Нажатие кнопки открывает следующее окно: Case Selection Conditions - Условия выбора случаев.

Перейдем к нижней части стартовой панели. Опции, расположенные в правом нижнем углу панели, зада­ют способы обработки пропущенных значений ряда. Система предлагает следующие возможности для заполне­ния пропущенных значений:

• Overall mean - Общее среднее;

• Interpolation from adjacent points - Интерполяция по соседним точкам;

• Mean of N adjacent points — Среднее по соседним точ­кам;

• Median of N adjacent points - Медиана соседних значений;

• Predicted values from linear trend regression - Предска­занные значения исходя из линейной регрессии.

Нижняя часть стартовой панели модуля содержит функциональные клавиши, откры­вающие различные методы анализа. В модулереализованы следующие мето­ды анализа ВР:

• ARIMA – АРПСС или АРИСС: Авторегрессии и (про)интегрирован­ного скользящего среднего;

• Interrupted time series analysis - Анализ прерванного временного ряда (модели интервенции для АРПСС);

• Exponential smoothing & forecasting - Экспоненциаль­ное сглаживание и прогнозирование;

• Seasonal decomposition (Census 1) - Сезонная декомпозиция;

• XI1 (Census 2) -monthly-quarterly - XI1 метод - месячно - квартально;

• Distributed lags analysis - Анализ распределенных лагов;

• Spectral (Fourier) analysis - Спектральный (Фурье) анализ.

В каждом диалоге реализован конкретный метод обработки и имеются всесторонние возможности по анализу результатов, настройке вычислительных процедур и т.д. Подробному анализу каждого из этих методов и посвящены данные лабораторные работы.

 

Различные способы преобразования ряда доступны с помо­щью кнопки Other transformations&plots - Другие преобразо­вания и графики. Окно доступно по нажатию кнопки ОК. (transformations, autocorrelations, plots) - Да (преобразова­ния, автокорреляции, графики) на стартовой панели модуля.

В этом окне можно выбрать различные способы преобразования временного ряда - высвеченной в начальном окне переменной. Выберите какую-нибудь опцию. Затем нажмите кнопку OK (Transform) - Да (Преобразовать) в правом верхнем углу. С помощью кнопки Plot - График посмотрите график преобразованного ряда на экране. Отметим, что на каждом шаге можно выполнить только од­но преобразование значений высвеченной переменной. Все пре­образования переменных программа запишет в информацион­ной части диалогового окна. Для того чтобы выполнить несколько преобразований, следует по­вторить эти действия несколько раз. По умолчанию в системе каждый раз будет высвечиваться переменная, преобразованная на последнем шаге. Имя преобразованной переменной помеще­но ниже имени переменной до преобразования.

В окне Time Series Transformations - Преобразования временного ряда имеется несколько групп преобра­зования, объединенных по функциональному признаку. Эти преобразования можно применять последовательно, одно за другим, Конечная цель преобразований - привести ряд к нуж­ному для анализа виду, например, сделать ряд стационарным.

 В левом верхнем углу окна даны преобразования вида:

новый ряд = f(старый временной ряд). 

Возможны следующие преобразования f:

Add a constant Прибавить константу к значениям ряда;
Power Возвести в степень;
Inverse power Возвести в обратную степень;
Natural log Взять натуральный логарифм;
Exponent Выполнить экспоненциальное преобразование.

 

В правой части окна имеется группа опций: Two-series transformations - Преобразования двух временных рядов. Эти опции доступны, когда анализируется по крайней мере два временных ряда (выбраны по меньшей мере 2 переменные из файла данных). Выбрав, например, опцию Difference - Разность, вы вычислите новое значение ряда Х по формуле: X(t)=X(t)-Y(t-lag), где значения сдвига lag (запаздывания), задаются в поле lag – сдвиг. С помощью опции Residualizing - Остаточный вычис­ляются новые значения ряда по формуле: X(t) = X(t) - (а + b*Y(t - lag)), где параметры а и b либо задаются, либо оцениваются ме­тодом наименьших квадратов. (В последнем случае следует выбрать опцию: Estimate a and b from data - Оценить параметры а и b из данных.)

В группе опций, расположенных ниже. Shift relative starting point of series - Сдвинуть относительную на­чальную точку ряда предлагаются возможности сдви­нуть ряд вперед и назад.

Опция Filtering and other techniques - Фильтрация и другие методы осуществляют следующие преобразова­ния ряда:

4253Н Filter 4253Н Фильтр, по шагам выполня­ются следующие преобразования ряда: 1) скользящее медианное сглаживание ряда по 4 точкам, слева и справа от текущей точки берутся по 2 точки ряда;2) 5 точечное медианное сглаживание; 3) 3-точечное медианное сглаживание; 4) 3-точечное сглаживание скользящим средним с весами 0.25, 0.5, 0.25 (так называемые Hanning weights); 5) вычисляются остатки; 6) к остаткам применяются шаги 1 - 4; 6) преоб­разованные остатки добавляются к преобразованно­му ряду.
Differencing  Вычисление разностей, новые зна­чения ряда x(t) вычисляются из старых по формуле X(t) = x(t)-x(t-lag).
Integrate Суммировать, новые значения ряда x(t) вычисляются из старых по формуле x(t) = x(t) + +x(t-lag).

 

В окне Преобразования временного ряда имеются также следующие опции: выделение среднего значения, стандартиза­ция (нормировка), выделение тренда, сглаживание: скользящее среднее, медианное сглаживание, простое экспоненциальное сглаживание. Опишем эти опции подробней.

Mean subtract - Вычитание среднего. Из значений ряда вычитается среднее значение, подсчитанное по всем наблюдениям, либо численное значение, указанное в поле М.
Standardize - Стандартизовать. Из значений ряда вычитается величина М и результат делится на S. Типичный случай М - среднее ряда, S= SD - стандартное отклоне­ние. Если выбрана опцияEstimate mean & std. dev. from data - Оценить среднее и стандартное отклонение по данным, то эти значения оцениваются по траектории ряда, т.е. являются выборочными значениями.
Trend subtract - Вычитание тренда. Из ряда вычитает­ся линейный тренд, параметры которого либо оценива­ются, либо задаются в поле а. b.
Autocorr. (х = x-(a+b*x(lag))) - Автокорреляции. Это линейное преобразование, позволяю­щее занулить автокорреляции на определенном лаге, задаваемом в поле lag.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: