ПРЕОБРАЗОВАНИЯ ВРЕМЕННЫХ РЯДОВ
ЦЕЛЬ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Изучение и приобретение навыков преобразования временных рядов (в т.ч. применения методов сглаживания), реализованных в системе «Statistica».
ОСНОВЫ TЕОРИИ
Стартовая панель модуля Анализ временных рядов и прогнозирование имеет следующую структуру:
В верхней части панели, в информационном поле, записываются имена анализируемых и преобразованных переменных (ВР).
Рядом с информационным полем расположены несколько кнопок - стандартных для всех модулей системы: они обеспечивают работу с данными, закрытие панели, а также открывают специальный диалог преобразования временных рядов: кнопка OK (transformations, autocorrelations, plots) - Да (преобразования, автокорреляции, графики).
Нижняя часть панели — функциональная, здесь расположены:
• кнопки, открывающие специальные диалоговые окна анализа,
• опции обработки пропущенных значений, помещенные в правом нижнем углу и объединенные заголовком: Replace missing data with - Заменить пропущенные данные.
|
|
Стандартные кнопки, открывающие файл данных, окно выбора переменных для анализа, окно выбора случаев, а также кнопки, удаляющие и сохраняющие переменные, закрывающие панель:
• Open data - Открыть данные;
• Variables - Переменные;
• Select cases - Выбрать случаи;
• Save variables - Сохранить переменные;
• Delete highlighted variable - Удалить высвеченные переменные;
• Cancel - Отменить (закрывает стартовую панель модуля).
Слева от имени анализируемых переменных вы видите значок L в графе Lock, означающий, что переменные закрыты на ключ и не могут быть удалены без прерывания анализа. В процессе работы ряды многократно преобразовываются, однако, не все преобразования необходимы; чтобы не хранить лишнюю информацию, их следует удалить из диалога. Для этого служит кнопка Delete highlighted variable - Удалить высвеченные переменные. Напротив, некоторые переменные нужно сохранить для дальнейшего анализа - Save variables - Сохранить переменные сохраняет высвеченные переменные в файле данных STATISTICA. Сохраненную таким образом переменную можно проанализировать впоследствии в любом модуле STATISTICA
Рассмотрим верхнюю часть стартовой панели. Здесь расположена опция Number of backups per variables (series) - Число резервов для переменных (рядов), позволяющая автоматически иметь нужное число преобразований ряда в текущем диалоге.
Часто, например при разведочном анализе, возникает необходимость анализировать не все случаи (наблюдения в ряде), а рассмотреть лишь часть их (определенный отрезок временного ряда, кусок траектории), тогда следует использовать кнопку Select cases — Выбрать случаи. Нажатие кнопки открывает следующее окно: Case Selection Conditions - Условия выбора случаев.
|
|
Перейдем к нижней части стартовой панели. Опции, расположенные в правом нижнем углу панели, задают способы обработки пропущенных значений ряда. Система предлагает следующие возможности для заполнения пропущенных значений:
• Overall mean - Общее среднее;
• Interpolation from adjacent points - Интерполяция по соседним точкам;
• Mean of N adjacent points — Среднее по соседним точкам;
• Median of N adjacent points - Медиана соседних значений;
• Predicted values from linear trend regression - Предсказанные значения исходя из линейной регрессии.
Нижняя часть стартовой панели модуля содержит функциональные клавиши, открывающие различные методы анализа. В модулереализованы следующие методы анализа ВР:
• ARIMA – АРПСС или АРИСС: Авторегрессии и (про)интегрированного скользящего среднего;
• Interrupted time series analysis - Анализ прерванного временного ряда (модели интервенции для АРПСС);
• Exponential smoothing & forecasting - Экспоненциальное сглаживание и прогнозирование;
• Seasonal decomposition (Census 1) - Сезонная декомпозиция;
• XI1 (Census 2) -monthly-quarterly - XI1 метод - месячно - квартально;
• Distributed lags analysis - Анализ распределенных лагов;
• Spectral (Fourier) analysis - Спектральный (Фурье) анализ.
В каждом диалоге реализован конкретный метод обработки и имеются всесторонние возможности по анализу результатов, настройке вычислительных процедур и т.д. Подробному анализу каждого из этих методов и посвящены данные лабораторные работы.
Различные способы преобразования ряда доступны с помощью кнопки Other transformations&plots - Другие преобразования и графики. Окно доступно по нажатию кнопки ОК. (transformations, autocorrelations, plots) - Да (преобразования, автокорреляции, графики) на стартовой панели модуля.
В этом окне можно выбрать различные способы преобразования временного ряда - высвеченной в начальном окне переменной. Выберите какую-нибудь опцию. Затем нажмите кнопку OK (Transform) - Да (Преобразовать) в правом верхнем углу. С помощью кнопки Plot - График посмотрите график преобразованного ряда на экране. Отметим, что на каждом шаге можно выполнить только одно преобразование значений высвеченной переменной. Все преобразования переменных программа запишет в информационной части диалогового окна. Для того чтобы выполнить несколько преобразований, следует повторить эти действия несколько раз. По умолчанию в системе каждый раз будет высвечиваться переменная, преобразованная на последнем шаге. Имя преобразованной переменной помещено ниже имени переменной до преобразования.
В окне Time Series Transformations - Преобразования временного ряда имеется несколько групп преобразования, объединенных по функциональному признаку. Эти преобразования можно применять последовательно, одно за другим, Конечная цель преобразований - привести ряд к нужному для анализа виду, например, сделать ряд стационарным.
В левом верхнем углу окна даны преобразования вида:
новый ряд = f(старый временной ряд).
Возможны следующие преобразования f:
Add a constant | Прибавить константу к значениям ряда; |
Power | Возвести в степень; |
Inverse power | Возвести в обратную степень; |
Natural log | Взять натуральный логарифм; |
Exponent | Выполнить экспоненциальное преобразование. |
В правой части окна имеется группа опций: Two-series transformations - Преобразования двух временных рядов. Эти опции доступны, когда анализируется по крайней мере два временных ряда (выбраны по меньшей мере 2 переменные из файла данных). Выбрав, например, опцию Difference - Разность, вы вычислите новое значение ряда Х по формуле: X(t)=X(t)-Y(t-lag), где значения сдвига lag (запаздывания), задаются в поле lag – сдвиг. С помощью опции Residualizing - Остаточный вычисляются новые значения ряда по формуле: X(t) = X(t) - (а + b*Y(t - lag)), где параметры а и b либо задаются, либо оцениваются методом наименьших квадратов. (В последнем случае следует выбрать опцию: Estimate a and b from data - Оценить параметры а и b из данных.)
|
|
В группе опций, расположенных ниже. Shift relative starting point of series - Сдвинуть относительную начальную точку ряда предлагаются возможности сдвинуть ряд вперед и назад.
Опция Filtering and other techniques - Фильтрация и другие методы осуществляют следующие преобразования ряда:
4253Н Filter | 4253Н Фильтр, по шагам выполняются следующие преобразования ряда: 1) скользящее медианное сглаживание ряда по 4 точкам, слева и справа от текущей точки берутся по 2 точки ряда;2) 5 точечное медианное сглаживание; 3) 3-точечное медианное сглаживание; 4) 3-точечное сглаживание скользящим средним с весами 0.25, 0.5, 0.25 (так называемые Hanning weights); 5) вычисляются остатки; 6) к остаткам применяются шаги 1 - 4; 6) преобразованные остатки добавляются к преобразованному ряду. |
Differencing | Вычисление разностей, новые значения ряда x(t) вычисляются из старых по формуле X(t) = x(t)-x(t-lag). |
Integrate | Суммировать, новые значения ряда x(t) вычисляются из старых по формуле x(t) = x(t) + +x(t-lag). |
В окне Преобразования временного ряда имеются также следующие опции: выделение среднего значения, стандартизация (нормировка), выделение тренда, сглаживание: скользящее среднее, медианное сглаживание, простое экспоненциальное сглаживание. Опишем эти опции подробней.
Mean subtract - Вычитание среднего. | Из значений ряда вычитается среднее значение, подсчитанное по всем наблюдениям, либо численное значение, указанное в поле М. |
Standardize - Стандартизовать. | Из значений ряда вычитается величина М и результат делится на S. Типичный случай М - среднее ряда, S= SD - стандартное отклонение. Если выбрана опцияEstimate mean & std. dev. from data - Оценить среднее и стандартное отклонение по данным, то эти значения оцениваются по траектории ряда, т.е. являются выборочными значениями. |
Trend subtract - Вычитание тренда. | Из ряда вычитается линейный тренд, параметры которого либо оцениваются, либо задаются в поле а. b. |
Autocorr. (х = x-(a+b*x(lag))) - Автокорреляции. | Это линейное преобразование, позволяющее занулить автокорреляции на определенном лаге, задаваемом в поле lag. |
|
|