Урожайность ячменя в одной из областей Среднего Поволжья, ц/га

Годы
Урожайность	14,1	9,3	19,4	19,7	5,4	24,2	13,8	24,5	14,7	16,6	5,6	16,2	25,3	11,9	18,5

Решение

1. Делим исходный временной ряд на две примерно равные по числу уровней части: n₁=7, n₂ = 8 (n₁+ n₂=n=15).

2. Для каждой из этих частей вычисляем средние значения:

Y1 = 15,13; Y2 = 16,66

и дисперсии:

S²_Y1 = 42,15; S²_Y2 = 41,22.

3. Проверяем гипотезу о равенстве (однородности) дисперсийобеих частей ряда с помощью F-критерия Фишера. Для вычисления F-критерия большую дисперсию делят на меньшую:

F_расч = 42,15 / 41,22 = 1,022,

Fкр = (0,05; 6,7) =3,86.

Так как -F_paсч<F_кр (0,05; 7,6), то нет оснований отвергать нулевую гипотезу. По данным наблюдения дисперсии генеральных совокупностей равны S²₁=S²₂, исправленные выборочные дисперсии (S²_Y1 = 42,15; S²_Y2 = 41,22.) отличаются незначительно (расхождение между ними – случайная величина)

4. Тогда можно проверить основную гипотезу о равенстве средних значений с использованием t-критерия Стьюдента:

подставляя числовые значения, получим:

Так как |tрасч| <tкр, то нет оснований отвергать нулевую гипотезу о равенстве средних, расхождение между вычисленными средними незначимо. Отсюда вывод: тренд урожайности ячменя отсутствует.

Решение задачи с помощью Пакета анализа Excel

1. Гипотезу о равенстве дисперсий проверим с помощью F-теста, который можно найти среди инструментов Анализа данных (ДвухвыборочныйF-тест для дисперсии)

Результат выполнения теста представлен в виде таблицы.(df– число степеней свободы). Анализируя результаты делаем вывод, что исправленные выборочные дисперсии различаются незначительно.

Двухвыборочный F-тест для дисперсии

	Переменная 1	Переменная 2
Среднее	15,12857143	16,6625
Дисперсия	42,14571429	41,21982143
Наблюдения
df
F	1,022462321
P(F<=f) одностороннее	0,480968726
F критическое одностороннее	3,865968853

Проверим ряд с помощью Двухвыборочногоt – теста с одинаковыми дисперсиями. Вводим данные и получим результат выполнения t- теста. Можно сделать вывод, что тренда нет.

Двухвыборочный t-тест с одинаковыми дисперсиями

	Переменная 1	Переменная 2
Среднее	15,12857143	16,6625
Дисперсия	42,14571429	41,21982143
Наблюдения
Объединенная дисперсия	41,64715659
Гипотетическая разность средних
df
t-статистика	-0,459262349
P(T<=t) одностороннее	0,326815487
t критическое одностороннее	1,770933383
P(T<=t) двухстороннее	0,653630973
t критическое двухстороннее	2,160368652

Пример 2. На основании данных, приведенных в табл. 2 требуется:

1. построить линейную модель Y(t) = a₀ + a₁t, параметры которой оценить МНК (метод наименьших квадратов);

2. оценить адекватность построенной модели на основе исследования:

• случайности остаточной компоненты по критерию пиков;

• независимости уровней ряда остатков по d-критерию (в качестве критических значений следует использовать уровниd₁ = 1,08 и d₂ = 1,36) и по первому коэффициенту автокорреляции, критический уровень которого r(1) = 0,36;

• нормальности распределения остаточной компоненты поRS-критерию с критическими уровнями 2,7—3,7;

3) для оценки точности модели используйте среднеквадратическоеотклонение и среднюю по модулю относительную ошибку;

4) построить точечный и интервальный прогнозы на два шага вперед(для вероятности Р= 70% используйте коэффициент равный 1,12);

5) отобразить на графике фактические данные, результаты расчетов и прогнозирования.

Таблица 2 Исходные данные

t
Y

Решение

1. Ввод исходных данных.

2. Оценка параметров модели.

2.1. Оценка параметров модели (ручной просчет)

а0 и а1 – коэффициенты уравнения регрессии.

2.2. Оценка параметров модели с помощью надстройки EXCEL Анализ данных - Регрессия.

Построим линейную однопараметрическую модель регрессии Уот t. Для проведения регрессионного анализа выполните следующие действия:

Результат регрессионного анализа содержится в таблицах. Нам для анализа необходимы две таблицы. (см. пример)

Таблица 3

	Коэффициенты	Стандартная ошибка	t-статистика
Y-пересечение	40,5	3,3711741	12,01362
t	2,766666667	0,599073359	4,618244



ВЫВОД ОСТАТКА

Наблюдение	Предсказанное Y	Остатки
	43,26666667	-2,266666667
	46,03333333	-0,033333333
	48,8	0,2
	51,56666667	-3,566666667
	54,33333333	10,66666667
	57,1	-2,1
	59,86666667	1,133333333
	62,63333333	-3,633333333
	65,4	-0,4

Во втором столбце таблицы 3 содержатся коэффициенты уравнения регрессии а₀, а₁, в третьем столбце – стандартные ошибки коэффициентов уравнения регрессии, а в четвертом — t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.

Уравнение регрессии зависимости у_t (прибыль коммерческого банка) от t_t (время) имеет вид

Y(t)=40,5+2,77t

Получили те же результаты, что и при ручном просчете.

3. Оценка качества построенной модели.

Для этого исследуем адекватность модели. Модель является адекватной, если математическое ожидание значений остаточного ряда близко или равно нулю и если значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения.

При проверке независимости (отсутствие автокорреляции) определяется отсутствие в ряду остатков систематической составляющей, например, с помощью d-критерия Дарбина—Уотсона по формуле:

Так как d' попало в интервал от dl (d1=1.08) до d2 (d2=1.36), то по данному критерию нельзя сделать вывод о выполнении свойства независимости.

Необходимо вычислить коэффициент автокорреляции первого порядка по формуле:

т.е. фактическое значение больше табличного. Это означает, что в ряду динамики имеется автокорреляция, следовательно, модель по этому критерию неадекватна.

Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек (формула (3.6)). Количествоповоротных точек равно 6 (рис.). Неравенство выполняется (6 > 2). Следовательно, свойство случайности выполняется.Модель по этому критерию адекватна.

Соответствие ряда остатков нормальному закону распределения определим при помощи RS-критерия:

RS=[e_max-e_min]/S_e

где e_max — максимальный уровень ряда остатков, e_max=10,67,

e_min — минимальный уровень ряда остатков,e_min =-3,63

S_e — среднеквадратическое отклонение,