N-pts mov. aver. | N-точечное скользящее среднее. |
N-pts mov. median | N-точечная скользящая медиана. |
Simple exponential | Простое экспоненциальное сглаживание. |
Смысл методов сглаживания скользящим средним и скользящей медианой состоит в следующем: задается некоторое окно, которое сдвигается по временной шкале слева направо. Наблюдения, попавшие в окно, усредняются (случай скользящего среднего с равными весами) или берется медиана попавших в окно наблюдений (случай медианного сглаживания), полученное значение становится значением сглаженного ряда в центре окна. Возможно усреднение с неравными весами, задаваемыми в окне Weighted. Если выбрана опция Prior, то вычисления проводятся по предыдущим значениям ряда. В ряде случаев, например, при наличии выбросов в данных, предпочтительнее иметь дело с медианой выборки.
ПРОГРАММА РАБОТЫ
3.1. Запустить Statistica, модуль «Временные ряды и прогнозирование».
3.2. Открыть файл данных, созданный в ЛР №1.
3.3. К изучаемой переменной применить методы преобразования временного ряда по описанной в теоретической части схеме.
|
|
3.4. Применить к изучаемой переменной методы фильтрации временных рядов, провести их сравнительный анализ. Оценить влияние ширины окна на уровень сглаживания ряда.
3.5. Сделать выводы.
КОНТРОЛЬНЫЕ ВОПРОСЫ
4.1. В чем заключается основная идея методов фильтрации ВР?
4.2. Что такое 4253Н фильтр?
4.3. Перечислите отличия медианного сглаживания и сглаживания скользящим средним?
4.4. Как ширина окна влияет на уровень сглаживания ряда?
Лабораторная работа №3.
КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
ЦЕЛЬ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Приобретение навыков определения и анализа причинных и корреляционных связей между переменными с использованием корреляционно-регрессионного анализа в системе Statistica.
ОСНОВЫ ТЕОРИИ
Модуль Basic Statistics, процедура Correlation matrices (Корреляционные матрицы). Эта процедура предназначена для проведения корреляционного анализа, установления тесноты линейной связи между переменными. Коэффициент корреляции - это показатель, оценивающий тесноту линейной связи между признаками. Он может принимать значения от -1 до +1. Знак "-" означает, что связь обратная, "+" - прямая. Чем ближе коэффициент к 1 тем теснее линейная связь.
В стартовом окне этой процедуры "Pearson Product-Moment Correlation" (Корреляция Пирсона) для расчета квадратной матрицы используется кнопка One variable list (square matrix). В списке переменных выбирают переменные, между которыми будут рассчитаны парные коэффициенты корреляции Пирсона. После нажатия на кнопку OK или Correlationes на экране появится корреляционная матрица.
|
|
Процедура Correlation matrices сразу же дает возможность проверить достоверность рассчитанных коэффициентов корреляции. Значение коэффициента корреляции может быть высоким, но не достоверным, случайным. Чтобы увидеть вероятность нулевой гипотезы (p), гласящей о том что коэффициент корреляции равен 0, нужно в опции Display окна Pearson Prouct-Moment Correlation установить переключатель на вторую строку Corr. matrix (display p & N). Но даже если этого не делать и оставить переключатель в первом положении Corr. matrix (highlight p), статистически значимые на 5-% уровне коэффициенты корреляции будут выделены в корреляционной матрице на экране монитора цветом, а при распечатке помечены звездочкой. Третье положение переключателя опции Display- Detail table of results позволяет просмотреть результаты корреляционного анализа в деталях. Флажок опции Casewise deletion of MD устанавливается для исключения из обработки всей строки файла данных, в которой есть хотя бы одно пропущенное значение.
Статистические методы, реализованные в модуле «Multiple Regression» - «Множественная регрессия» позволяют построитьрегрессионнуюмодель. Задайте с помощью кнопки Variables - Переменные зависимую переменную (Dependent) и независимые переменные (Independent). После нажатия кнопки ОК появится диалоговое окно результатов, в котором отражаются итоги стандартной процедуры (коэффициент детерминации и скорректированный коэффициент детерминации, стандартная ошибка оценки, свободный член, стандартная ошибка, значимые коэффициенты уравнения регрессии).
В появившемся окне Multiple Regression Results - Результаты множественной регрессии нажмите на кнопку Regression summary - Итоговая таблица регрессии. Появится таблица, отражающая неизвестные параметры уравнения регрессии. В столбце Beta показаны стандартизованные коэффициенты регрессии, а в столбце В – нестандартизованные коэффициенты. Определите значимость всех коэффициентов (р-значения для каждого из них должны быть меньше заданной величины). При невыполнении этих требований необходимо пересмотреть структуру модели, добавить/удалить некоторые регрессоры, свободный член уравнения.
Вернитесь в окно Multiple Regression Results и нажмите кнопку ОК (Анализ остатков). Для проверки неавтокоррелированности остатков в диалоговом окне Residual Analysis - Анализ остатков нажмите кнопку Durbin-Watson stat - Статистика Дарбина-Уотсона. В этом же окне можно определить близость остатков к нормальному распределению.
Нажмите кнопку Predict dependent var. - Предсказать зависимую переменную. Далее в поле Независимой переменной введите значение. Нажмите кнопку ОК. Появится таблица результатов предсказания. В ячейке Predictd - Предсказанная содержится прогнозируемое значение данных исследования.
ПРОГРАММА РАБОТЫ
3.1. Запустить систему Statistica, модуль «Multiple Regression» -«Множественная регрессия».
3.2. Открыть файл данных, созданный в ЛР №1.
3.3. Построить модель парной линейной регрессии (зависимость изучаемой переменной от условного фактора времени).
3.4. Оценить качество построенной модели (значимость, точность, адекватность) и сделать вывод о возможности ее использования.
3.5. Построить прогноз с использованием построенной модели.
3.6. Сделать выводы.
КОНТРОЛЬНЫЕ ВОПРОСЫ
4.1. В чем заключается основная цель регрессионного анализа?
4.2. Каковы основные задачи регрессионного и корреляционного анализа?
4.3. В чём заключатся проверка значимости модели?
4.4. Какие характеристики могут быть использованы для проверки качества построенной модели?