Годы | |||||||||||||||
Урожайность | 14,1 | 9,3 | 19,4 | 19,7 | 5,4 | 24,2 | 13,8 | 24,5 | 14,7 | 16,6 | 5,6 | 16,2 | 25,3 | 11,9 | 18,5 |
Решение
1. Делим исходный временной ряд на две примерно равные по числу уровней части: n1=7, n2 = 8 (n1+ n2=n=15).
2. Для каждой из этих частей вычисляем средние значения:
Y1 = 15,13; Y2 = 16,66
и дисперсии:
S2 Y1 = 42,15; S2 Y2 = 41,22.
3. Проверяем гипотезу о равенстве (однородности) дисперсийобеих частей ряда с помощью F-критерия Фишера. Для вычисления F-критерия большую дисперсию делят на меньшую:
Fрасч = 42,15 / 41,22 = 1,022,
Fкр = (0,05; 6,7) =3,86.
Так как -Fpaсч<Fкр (0,05; 7,6), то нет оснований отвергать нулевую гипотезу. По данным наблюдения дисперсии генеральных совокупностей равны S21=S22, исправленные выборочные дисперсии (S2 Y1 = 42,15; S2 Y2 = 41,22.) отличаются незначительно (расхождение между ними – случайная величина)
4. Тогда можно проверить основную гипотезу о равенстве средних значений с использованием t-критерия Стьюдента:
подставляя числовые значения, получим:
Так как |tрасч| <tкр, то нет оснований отвергать нулевую гипотезу о равенстве средних, расхождение между вычисленными средними незначимо. Отсюда вывод: тренд урожайности ячменя отсутствует.
Решение задачи с помощью Пакета анализа Excel
1. Гипотезу о равенстве дисперсий проверим с помощью F-теста, который можно найти среди инструментов Анализа данных (ДвухвыборочныйF-тест для дисперсии)
Результат выполнения теста представлен в виде таблицы.(df– число степеней свободы). Анализируя результаты делаем вывод, что исправленные выборочные дисперсии различаются незначительно.
Двухвыборочный F-тест для дисперсии | ||
Переменная 1 | Переменная 2 | |
Среднее | 15,12857143 | 16,6625 |
Дисперсия | 42,14571429 | 41,21982143 |
Наблюдения | ||
df | ||
F | 1,022462321 | |
P(F<=f) одностороннее | 0,480968726 | |
F критическое одностороннее | 3,865968853 |
Проверим ряд с помощью Двухвыборочногоt – теста с одинаковыми дисперсиями. Вводим данные и получим результат выполнения t- теста. Можно сделать вывод, что тренда нет.
Двухвыборочный t-тест с одинаковыми дисперсиями | ||
Переменная 1 | Переменная 2 | |
Среднее | 15,12857143 | 16,6625 |
Дисперсия | 42,14571429 | 41,21982143 |
Наблюдения | ||
Объединенная дисперсия | 41,64715659 | |
Гипотетическая разность средних | ||
df | ||
t-статистика | -0,459262349 | |
P(T<=t) одностороннее | 0,326815487 | |
t критическое одностороннее | 1,770933383 | |
P(T<=t) двухстороннее | 0,653630973 | |
t критическое двухстороннее | 2,160368652 |
Пример 2. На основании данных, приведенных в табл. 2 требуется:
1. построить линейную модель Y(t) = a0 + a1t, параметры которой оценить МНК (метод наименьших квадратов);
2. оценить адекватность построенной модели на основе исследования:
• случайности остаточной компоненты по критерию пиков;
• независимости уровней ряда остатков по d-критерию (в качестве критических значений следует использовать уровниd1 = 1,08 и d2 = 1,36) и по первому коэффициенту автокорреляции, критический уровень которого r(1) = 0,36;
• нормальности распределения остаточной компоненты поRS-критерию с критическими уровнями 2,7—3,7;
3) для оценки точности модели используйте среднеквадратическоеотклонение и среднюю по модулю относительную ошибку;
4) построить точечный и интервальный прогнозы на два шага вперед(для вероятности Р= 70% используйте коэффициент равный 1,12);
5) отобразить на графике фактические данные, результаты расчетов и прогнозирования.
Таблица 2 Исходные данные
t | |||||||||
Y |
Решение
1. Ввод исходных данных.
2. Оценка параметров модели.
2.1. Оценка параметров модели (ручной просчет)
а0 и а1 – коэффициенты уравнения регрессии.
2.2. Оценка параметров модели с помощью надстройки EXCEL Анализ данных - Регрессия.
Построим линейную однопараметрическую модель регрессии Уот t. Для проведения регрессионного анализа выполните следующие действия:
Результат регрессионного анализа содержится в таблицах. Нам для анализа необходимы две таблицы. (см. пример)
Таблица 3
Коэффициенты | Стандартная ошибка | t-статистика | |
Y-пересечение | 40,5 | 3,3711741 | 12,01362 |
t | 2,766666667 | 0,599073359 | 4,618244 |
ВЫВОД ОСТАТКА | |||
Наблюдение | Предсказанное Y | Остатки | |
43,26666667 | -2,266666667 | ||
46,03333333 | -0,033333333 | ||
48,8 | 0,2 | ||
51,56666667 | -3,566666667 | ||
54,33333333 | 10,66666667 | ||
57,1 | -2,1 | ||
59,86666667 | 1,133333333 | ||
62,63333333 | -3,633333333 | ||
65,4 | -0,4 |
Во втором столбце таблицы 3 содержатся коэффициенты уравнения регрессии а0, а1, в третьем столбце – стандартные ошибки коэффициентов уравнения регрессии, а в четвертом — t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.
Уравнение регрессии зависимости уt (прибыль коммерческого банка) от tt (время) имеет вид
Y(t)=40,5+2,77t
Получили те же результаты, что и при ручном просчете.
3. Оценка качества построенной модели.
Для этого исследуем адекватность модели. Модель является адекватной, если математическое ожидание значений остаточного ряда близко или равно нулю и если значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения.
При проверке независимости (отсутствие автокорреляции) определяется отсутствие в ряду остатков систематической составляющей, например, с помощью d-критерия Дарбина—Уотсона по формуле:
Так как d' попало в интервал от dl (d1=1.08) до d2 (d2=1.36), то по данному критерию нельзя сделать вывод о выполнении свойства независимости.
Необходимо вычислить коэффициент автокорреляции первого порядка по формуле:
т.е. фактическое значение больше табличного. Это означает, что в ряду динамики имеется автокорреляция, следовательно, модель по этому критерию неадекватна.
Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек (формула (3.6)). Количествоповоротных точек равно 6 (рис.). Неравенство выполняется (6 > 2). Следовательно, свойство случайности выполняется.Модель по этому критерию адекватна.
Соответствие ряда остатков нормальному закону распределения определим при помощи RS-критерия:
RS=[emax-emin]/Se
где emax — максимальный уровень ряда остатков, emax=10,67,
emin — минимальный уровень ряда остатков,emin =-3,63
Se — среднеквадратическое отклонение,
рис. График остатков
Расчетное значение попадает в интервал (2,7—3,7), следовательно выполняется свойство нормальности распределения. Модель по этому критерию адекватна.