Урожайность ячменя в одной из областей Среднего Поволжья, ц/га

 

Годы                              
Урожайность 14,1 9,3 19,4 19,7 5,4 24,2 13,8 24,5 14,7 16,6 5,6 16,2 25,3 11,9 18,5

Решение

1. Делим исходный временной ряд на две примерно равные по числу уровней части: n1=7, n2 = 8 (n1+ n2=n=15).

2. Для каждой из этих частей вычисляем средние значения:

Y1 = 15,13; Y2 = 16,66

и дисперсии:

S2 Y1 = 42,15; S2 Y2 = 41,22.

3. Проверяем гипотезу о равенстве (однородности) дисперсийобеих частей ряда с помощью F-критерия Фишера. Для вычисления F-критерия большую дисперсию делят на меньшую:

Fрасч = 42,15 / 41,22 = 1,022,

Fкр = (0,05; 6,7) =3,86.

Так как -Fpaсч<Fкр (0,05; 7,6), то нет оснований отвергать нулевую гипотезу. По данным наблюдения дисперсии генеральных совокупностей равны S21=S22, исправленные выборочные дисперсии (S2 Y1 = 42,15; S2 Y2 = 41,22.) отличаются незначительно (расхождение между ними – случайная величина)

4. Тогда можно проверить основную гипотезу о равенстве средних значений с использованием t-критерия Стьюдента:

подставляя числовые значения, получим:

Так как |tрасч| <tкр, то нет оснований отвергать нулевую гипотезу о равенстве средних, расхождение между вычисленными средними незначимо. Отсюда вывод: тренд урожайности ячменя отсутствует.

Решение задачи с помощью Пакета анализа Excel

1. Гипотезу о равенстве дисперсий проверим с помощью F-теста, который можно найти среди инструментов Анализа данных (ДвухвыборочныйF-тест для дисперсии)

Результат выполнения теста представлен в виде таблицы.(df– число степеней свободы). Анализируя результаты делаем вывод, что исправленные выборочные дисперсии различаются незначительно.

Двухвыборочный F-тест для дисперсии
     
  Переменная 1 Переменная 2
Среднее 15,12857143 16,6625
Дисперсия 42,14571429 41,21982143
Наблюдения    
df    
F 1,022462321  
P(F<=f) одностороннее 0,480968726  
F критическое одностороннее 3,865968853  

Проверим ряд с помощью Двухвыборочногоt – теста с одинаковыми дисперсиями. Вводим данные и получим результат выполнения t- теста. Можно сделать вывод, что тренда нет.

Двухвыборочный t-тест с одинаковыми дисперсиями
     
  Переменная 1 Переменная 2
Среднее 15,12857143 16,6625
Дисперсия 42,14571429 41,21982143
Наблюдения    
Объединенная дисперсия 41,64715659  
Гипотетическая разность средних    
df    
t-статистика -0,459262349  
P(T<=t) одностороннее 0,326815487  
t критическое одностороннее 1,770933383  
P(T<=t) двухстороннее 0,653630973  
t критическое двухстороннее 2,160368652  

 

Пример 2. На основании данных, приведенных в табл. 2 требуется:

1. построить линейную модель Y(t) = a0 + a1t, параметры которой оценить МНК (метод наименьших квадратов);

2. оценить адекватность построенной модели на основе исследования:

• случайности остаточной компоненты по критерию пиков;

• независимости уровней ряда остатков по d-критерию (в качестве критических значений следует использовать уровниd1 = 1,08 и d2 = 1,36) и по первому коэффициенту автокорреляции, критический уровень которого r(1) = 0,36;

• нормальности распределения остаточной компоненты поRS-критерию с критическими уровнями 2,7—3,7;

3) для оценки точности модели используйте среднеквадратическоеотклонение и среднюю по модулю относительную ошибку;

4) построить точечный и интервальный прогнозы на два шага вперед(для вероятности Р= 70% используйте коэффициент равный 1,12);

5) отобразить на графике фактические данные, результаты расчетов и прогнозирования.

Таблица 2 Исходные данные

t                  
Y                  

Решение

1. Ввод исходных данных.

2. Оценка параметров модели.

2.1. Оценка параметров модели (ручной просчет)

а0 и а1 – коэффициенты уравнения регрессии.

2.2. Оценка параметров модели с помощью надстройки EXCEL Анализ данных - Регрессия.

Построим линейную однопараметрическую модель регрессии Уот t. Для проведения регрессионного анализа выполните следующие действия:

Результат регрессионного анализа содержится в таблицах. Нам для анализа необходимы две таблицы. (см. пример)

Таблица 3

  Коэффициенты Стандартная ошибка t-статистика
Y-пересечение 40,5 3,3711741 12,01362
t 2,766666667 0,599073359 4,618244
       
       
       
ВЫВОД ОСТАТКА      
       
Наблюдение Предсказанное Y Остатки  
  43,26666667 -2,266666667  
  46,03333333 -0,033333333  
  48,8 0,2  
  51,56666667 -3,566666667  
  54,33333333 10,66666667  
  57,1 -2,1  
  59,86666667 1,133333333  
  62,63333333 -3,633333333  
  65,4 -0,4  

 

Во втором столбце таблицы 3 содержатся коэффициенты уравнения регрессии а0, а1, в третьем столбце – стандартные ошибки коэффициентов уравнения регрессии, а в четвертом — t-статистика, используемая для проверки значимости коэффициентов уравнения регрессии.

Уравнение регрессии зависимости уt (прибыль коммерческого банка) от tt (время) имеет вид

Y(t)=40,5+2,77t

 

Получили те же результаты, что и при ручном просчете.

3. Оценка качества построенной модели.

Для этого исследуем адекватность модели. Модель является адекватной, если математическое ожидание значений остаточного ряда близко или равно нулю и если значения остаточного ряда случайны, независимы и подчинены нормальному закону распределения.

При проверке независимости (отсутствие автокорреляции) определяется отсутствие в ряду остатков систематической составляющей, например, с помощью d-критерия Дарбина—Уотсона по формуле:

Так как d' попало в интервал от dl (d1=1.08) до d2 (d2=1.36), то по данному критерию нельзя сделать вывод о выполнении свойства независимости.

Необходимо вычислить коэффициент автокорреляции первого порядка по формуле:

т.е. фактическое значение больше табличного. Это означает, что в ряду динамики имеется автокорреляция, следовательно, модель по этому критерию неадекватна.

Проверку случайности уровней ряда остатков проведем на основе критерия поворотных точек (формула (3.6)). Количествоповоротных точек равно 6 (рис.). Неравенство выполняется (6 > 2). Следовательно, свойство случайности выполняется.Модель по этому критерию адекватна.

Соответствие ряда остатков нормальному закону распределения определим при помощи RS-критерия:

RS=[emax-emin]/Se

 

где emax — максимальный уровень ряда остатков, emax=10,67,

emin — минимальный уровень ряда остатков,emin =-3,63

Se — среднеквадратическое отклонение,

 
 

рис. График остатков

 

Расчетное значение попадает в интервал (2,7—3,7), следовательно выполняется свойство нормальности распределения. Модель по этому критерию адекватна.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: