Моделирование ряда

- аддитивная модель

Порядок построения модели:

1) Выравнивание исходного ряда;

2) Расчет сезонной компоненты S;

3) Устранение сезонной компоненты и получение ряда у – S = Т +Е;

4) Аналитическое выравнивание ряда Т + Е;

5) Оценка достоверности модели: А) расчет модельных значений Т + S

Б) расчет модельных ошибок Е

Задача: Смоделировать ряд потребления электроэнергии и оценить достоверность модели.

Таблица 1.

№ квартала Потребление э\э, у Итого за 4 квартала Скользящая средняя за 4 квартала Централизованная скользящая средняя Оценка сезонной компоненты
           
  6,0 - - - -
  4,4 - - - -
  5,0 24,4 6,10 6,250 -1,250
  9,0 25,6 6,40 6,450 2,550
  7,2 26,0 6,50 6,625 0,575
  4,8 27,0 6,75 6,875 -2,075
  6,0 28,0 7,00 7,100 -1,100
  10,0 28,8 7,20 7,300 2,700
  8,0 29,6 7,40 7,450 0,550
  5,6 30,0 7,50 7,625 -2,025
  6,4 31,0 7,75 7,875 -1,475
  11,0 32,0 8,00 8,125 2,875
  9,0 33,0 8,25 8,325 0,675
  6,6 33,6 8,40 8,375 -1,775
  7,0 33,4 8,35    
  10,8        

Рисунок 1.

Амплитуда колебаний постоянна, поэтому можно применить аддитивную модель.

Значения выравниваются по 4 периодам, потому что сезонность имеет лаг = 4.

Таблица 2.

Цель: Рассчитать среднюю сезонность за квартал (среднюю сезонную компоненту).

Показатели Год № квартала,i
Сезонная компонента за 4 квартала (ежеквартально)   - - -1,25 2,55
    0,575 -2,075 -1,1 2,7
    0,55 -2,025 -1,475 2,875
    0,675 -1,775 - -
Итого за i квартал   1,800 -5,875 -3,825 8,125
Средняя оценка сезонной компоненты для i квартала, Sср.i 0,600 -1,958 -1,275 2,708
Скорректированная сезонная компонента, Si   0,581 -1,977 -1,294 2,690

Сезонная компонента в среднем за весь период должна взаимопогашаться. Проверим данное утверждение:

1) 0,6 – 1,958 – 1,275 + 2,708 = 0,075

2) k = 0,075 / 4 = 0,019

3) Si1 = 0,600 – 0,019 = 0,581

Таблица 3. Расчет выровненных значений Т и ошибок Е в аддитивной модели.

№ квартала, t Потребле- ние э/э, у Si Т+Е=у-Si Т Т+S E=y-(T+S)  
                   
  6,0 0,581 5,419 5,902 6,483 -0,483 0,233 -1,3 1,69
  4,4 -1,977 6,377 6,088 4,111 0,289 0,083 -2,9 8,41
  5,0 -1,294 6,294 6,275 4,981 0,019 0,000 -2,3 5,29
  9,0 2,690 6,310 6,461 9,151 -0,151 0,023 1,7 2,89
  7,2 0,581 6,619 6,648 7,229 -0,029 0,001 -0,1 0,01
  4,8 -1,977 6,777 6,834 4,857 -0,057 0,003 -2,5 6,25
  6,0 -1,294 7,294 7,020 5,726 0,274 0,075 -1,3 1,69
  10,0 2,690 7,310 7,207 9,897 0,103 0,011 2,7 7,29
  8,0 0,581 7,419 7,393 7,974 0,026 0,001 0,7 0,49
  5,6 -1,977 7,577 7,580 5,603 -0,003 0,000 -1,7 2,89
  6,4 -1,294 7,694 7,766 6,472 -0,072 0,005 -0,9 0,81
  11,0 2,690 8,310 7,952 10,642 0,358 0,128 3,7 13,69
  9,0 0,581 8,419 8,139 8,720 0,280 0,078 1,7 2,89
  6,6 -1,977 8,577 8,325 6,348 0,252 0,063 -0,7 0,49
  7,0 -1,294 8,294 8,512 7,218 -0,218 0,047 -0,3 0,09
  10,8 2,690 8,110 8,698 11,388 -0,588 0,346 3,5 12,25
Итого: 116,8   116,800       1,098   67,12

Столбец 4 очищен от сезонных колебаний и содержит только тренд (тенденцию) и случайную компоненту.

С помощью функции ЛИНЕЙН найдем параметры линейного тренда

ЛИНЕЙН
0,18641 5,7155

Уравнение тренда: уt = 5,715 + 0,186 · t

Параметры уравнения получены с помощью функции ЛИНЕЙН.

t – номер квартала (1й столбец).

С целью сравнить величину ошибки с дисперсией данных, найдем:

А) среднее значение ряда:

Б) квадраты отклонений от средних значений.

Рассчитаем точность модели: для этого сумму ошибок разделим на сумму квадратов отклонений:

Ошибки составляют 1,6 в общей сумме квадратов отклонений. Это очень точная модель.


Тема 4. Выравнивание рядов динамики по мультипликативной модели

Таблица 1. Прибыль компании, тыс.долл. США

Год № квартала, i
         
         
         
         
         

Рисунок 1.

По графику видны затухающие колебания, поэтому используем мультипликативную модель.

Порядок выравнивания аналогичен аддитивной модели.

Таблица 2.

№ квартала, t Прибыль компании, у Итого за 4 квартала Скользящая средняя за 4 квартала Централизованная скользящая средняя Оценка сезонной компоненты
           
    - - - -
    - - - -
    326,0 81,5 81,25 1,108
    324,0 81,0 80,00 0,800
    316,0 79,0 77,75 0,900
    306,0 76,5 75,75 1,215
    300,0 75,0 74,00 1,081
    292,0 73,0 71,50 0,811
    280,0 70,0 68,50 0,905
    268,0 67,0 65,75 1,217
    258,0 64,5 63,25 1,075
    248,0 62,0 59,50 0,807
    228,0 57,0 54,75 0,950
    210,0 52,5 50,25 1,194
    192,0 48,0    
           

Оценим сезонную компоненту путем деления фактических значений на центрированную скользящую среднюю.

Таблица 3. Расчет сезонной компоненты в мультипликативной модели.

Показатели Год № квартала,i
Сезонная компонента за 4 квартала (ежеквартально)   - - 1,108 0,800
    0,900 1,215 1,081 0,817
    0,905 1,217 1,075 0,807
    0,950 1,194 - -
Итого за i квартал   2,755 3,626 3,264 2,42
Средняя оценка сезонной компоненты для i квартала, Sср.i 0,918 1,209 1,088 0,808
Скорректированная сезонная компонента, Si   0,913 1,201 1,081 0,803

В мультипликативных моделях сумма всех сезонных компонент должна составлять 4, т.е. сезонная компонента выступает «весом». В нашем случае сумма сезонных компонент = 4,023 (0,918 + 1,209 + 1,088 + 0,808 = 4,023), поэтому нужно найти корректирующий коэффициент: .

ЛИНЕЙН
-2,77514 90,57874

Таблица 4. Расчет выровненных значений Т и ошибок Е в мультипликативной модели.

№ квар-тала, t Потре-бление э/э, Si Т+Е=у/Si Т Т·S E=y/(T·S) E'=y-(T·S)      
у  
                     
    0,913 78,86 87,80 80,17 0,898 -8,165 0,807 4,75 22,56
    1,202 83,19 85,03 102,20 0,978 -2,205 0,957 100,00 10000,00
    1,082 83,18 82,25 89,00 1,011 1,001 1,023 90,00 8100,00
    0,803 79,70 79,48 63,82 1,003 0,178 1,006 64,00 4096,00
    0,913 76,67 76,70 70,03 1,000 -0,031 0,999 70,00 4900,00
    1,202 76,54 73,93 88,86 1,035 3,137 1,072 92,00 8464,00
    1,082 73,94 71,15 76,99 1,039 3,011 1,080 80,00 6400,00
    0,803 72,23 68,38 54,91 1,056 3,092 1,116 58,00 3364,00
    0,913 67,91 65,60 59,90 1,035 2,104 1,071 62,00 3844,00
    1,202 66,56 62,83 75,52 1,059 4,480 1,122 80,00 6400,00
    1,082 62,85 60,05 64,98 1,047 3,022 1,095 68,00 4624,00
    0,803 59,78 57,28 46,00 1,044 2,005 1,089 48,00 2304,00
    0,913 56,96 54,50 49,76 1,045 2,238 1,092 52,00 2704,00
    1,202 49,92 51,73 62,18 0,965 -2,178 0,931 60,00 3600,00
    1,082 46,21 48,95 52,97 0,944 -2,968 0,891 50,00 2500,00
    0,803 37,36 46,18 37,08 0,809 -7,082 0,655 30,00 900,00
Итого:     1071,84       1,639   1008,75  

Тема 5. Парная линейная регрессия

Виды регрессии: - парная y = f(x)

- множественная (зависит от множества факторов)

y = f(x1, x2, x3 … xn)

Большинство эконометрических моделей можно свести к парной регрессии, поэтому она получила широкое распространение.

Парная регрессия

Порядок распространения связи при парной регрессии:

1. Теоретическое обоснование связи.

Регрессия может быть парной, если существует доминирующий фактор, который влияет на результат у = ух + ε

ух – теоретические частоты;

ε – ошибка (возмущение).

Существует три рода ошибок:

1) Ошибки спецификации модели

Неверно подобрана функция или её параметры.

Методы устранения: оценка нескольких функций и выбор наилучшей.

2) Выборочный характер исходных данных

Совокупность исходных данных может быть неоднородна, тогда МНК не имеет смысла, т.к. он основан на расчете дисперсий. Поэтому из данных исключают наиболее выдающиеся в ту или иную сторону.

Методы устранения: расчет доверительных интервалов.

3) Особенности измерения переменных

Например, доход на душу населения не является точным, т.к. отсутствуют данные о сокрытых доходах.

Методы устранения: досчет на основе выборочных обследований; совершение операций сбора данных.

При анализе данных считают, что они однородны и точны, т.е. ошибки 2 и 3 рода устранены. Поэтому, уделяют наибольшее внимание устранению ошибок спецификации, т.е. подбору наиболее подходящего уравнения ух. Цель этого отбора – уменьшить ошибки.

2. Выбор математической функции.

Осуществляется 3 методами:

А) графический

Б) аналитический

В) экспериментальный (по min остаточной дисперсии)

!Если остаточная дисперсия одинакова для нескольких функций, то выбирают наиболее простую.

! Каждый параметр при х должен рассчитываться по 6-7 наблюдениям.

Легче всего поддаются интерпретации линейные модели, тем более они требуют меньшего числа наблюдений, поэтому линейные модели изучают подробно, а нелинейные – подлежат линеализации.

Парная линейная регрессия

1. Вид: у = а + bх + ε

ε – ошибка спецификации.

2. Графическая интерпретация МНК

Рисунок 1.

Т.е. находим min ∑(уi - yix)

Если разделим верхнюю часть на n, то:

- альтернативный метод расчета дисперсии

3. Интерпретация параметров a и b

b – коэффициент регрессии, показывающий на сколько в среднем изменилась функция, если изменить фактор на одну единицу.

а – значения функции при х = 0. Он не имеет экономического смысла, если оно отрицательно или х ни при каких условиях не равно 0.

Если а > 0 – вариация результата меньше, чем вариация фактора.

Если а < 0 - вариация результата больше, чем вариация фактора.

4. Измерение тесноты связи

Существует коэффициент парной линейной регрессии:

Если b > 0, то r > 0.

Если b < 0, то r < 0.

Если r ≈ 0 связи нет,

связь нелинейная.

5. Оценка качества модели

1) Осуществляется с помощью коэффициента детерминации:

Показывает, сколько процентов вариации у вы объяснили в вашей модели.

2) Критерий Фишера:

Показывает на сколько вся модель статистически значима в целом.

3) Стандартные ошибки в уравнении регрессии

- стандартная ошибка ля параметра b.

Она зависит от Х. Они применяется для проверки существенности коэффициента регрессии b и расчета его доверительных интервалов.

Существенность:

Если критерий Стьюдента меньше табличного при заданном значении степеней свободы, то гипотеза о несущественности параметра b принимается.

Для прогнозирования используют интервальные значения параметра b, т.е. доверительные интервалы: b ± t · mb

t – табличное значение критерия Стьюдента.

Стандартная ошибка для параметра а:

ta сравнивается с табличным значением при (n-2) степеней свободы.

- критерий Стьюдента

Т.о. проверка гипотез о значимости коэффициента регрессии и коэффициента корреляции проводится одинаково. Если коэффициент регрессии значимый, то коэффициент корреляции значимый.

6. Интервалы прогноза по уравнению регрессии

Чтобы понять, как определить величину стандартной ошибки, подставим в уравнение регрессии значение параметра а.

ух = а + bх

Заменим значение ух, и b на значение их ошибок и получим:

Из теории выборки известно, что средняя ошибка выборки:

Используем вместо дисперсии σ2 остаточную дисперсию на 1 степень свободы:

Хi - прогнозное значение фактора Х, при котором мы хотим получить значение У.

ух ± t · mух – формула для прогнозного значения У.

t – коэффициент Стьюдента при заданной степени вероятности.

В таблице приведены данные о потреблении и заработной плате по нескольким регионам Уральского Федерального округа.

Х – заработная плата;

У – потребление.

Задание: 1) выровнять модель методом линейной регрессии;

2) оценить надежность модели;

3) измерить тесноту связи и дать интерпретацию коэффициентам;

4) оценить уровень потребления при заданной заработной плате 65,0.

Таблица 1.

№ п/п у х у·х х2 у2 ух у-ух (у-ух)2 А
  68,8 45,1 3102,9 2034,0 4733,4 61,5 7,3 53,1   96,0
  61,2 59,0 3610,8 3481,0 3745,4 56,4 4,8 23,3   3481,0
  59,9 57,2 3426,3 3271,8 3588,0 57,0 2,9 8,2   3271,8
  56,7 61,8 3504,1 3819,2 3214,9 55,3 1,4 1,9   3819,2
  55,0 58,8 3234,0 3457,4 3025,0 56,4 -1,4 2,1   3457,4
  54,3 47,2 2563,0 2227,8 2948,5 60,7 -6,4 41,4   2227,8
  49,3 55,2 2721,4 3047,0 2430,5 57,8 -8,5 71,8   3047,0
Итого 405,2 384,3 22162,3 21338,4 23685,8     201,8    
Ср.знач. 57,9 54,9 3166,0 3048,3 3383,7     28,8    

1) Уравнение линейной регрессии у = а + bх

Вывод: потребление уменьшится на 0,37, если заработная плата увеличится на одну единицу.

Вывод: если а > 0, то вариация результата меньше вариации фактора.

а = 78,21% - уравнение регрессии ненадежно.

2) Оценим надежность модели и тесноту связи

Вывод: связь обратная, средняя. Совпадает связь при r и b.

3) Оценим качество модели

Рассчитаем ошибку аппроксимации и коэффициент детерминации

4) Рассчитаем среднюю ошибку аппроксимации

5) Рассчитаем критерий Фишера

Вывод: чем больше Fфакт, тем надежнее уравнение.

m – количество переменных при х = степени свободы числителя.

n – количество измерений.

m-n-1 – степень свободы знаменателя.

Для σ2у соответствует степень свободы, равная (n-1).

Для σ2объяснен. соответствует степень свободы, равная m.

Для σ2ост. соответствует степень свободы, равная (n-m-1).

Если регрессия линейная, то n-1=1+(n-1-1)

n-1=1+(n-2)

Критерий Фишера представляет из себя таблицу.

Фрагмент таблицы: при ά = 0,05

К1      
К2        
… … 161,45 18,51 10,13 … 6,61 … 199,50 19,0 9,55 … 215,72 19,16 9,28 …

К1 – степень свободы чисоителя;

К2 – степень свободв знаменателя.

Для линейной регрессии К1 = 1.

ά – вероятность ошибки, т.е. можно ошибочно отвергнуть верную гипотезу с такой вероятностью.

К2 = n-m-1 = 5

При 5 критерий Фишера табличный равен 6,61.

Fфакт. < Fтабл => Уравнение статистически не значимо с вероятностью 0,95. Уравнение не значимо, т.е. коэффициенты уравнения регрессии были получены случайным образом.

6)

Уравнение объясняет 15,2% дисперсии.

7) - t-статистика.

После вычисления t-статистики фактической, её нужно сравнить с табличным значением t. t-критерий (критерий Стьюдента) является двухсторонним, т.е. если мы получили ta, tb, tr меньше 0, следовательно нужно взять

Фрагмент таблицы.

Число степеней свободы ά
0,10 0,05 0,01
6,3 2,9 … 2,01 12,7 4,3 … 2,57 63,6 9,9 … 4,03

ά – вероятность ошибки.

Мы гарантируем результат вероятностью равной (1- ά).

Число степеней свободы для линейной регрессии d · f = n – 2

tbтабл. = 2,01 при ά = 0,1 => параметр b статистически не значим с вероятностью 0,9.

8) Вычисление прогноза

ух ± t · mух

mух рассчитывается из данных, а t берется из таблицы при соответствующей степени свободы в зависимости от того, какой уровень значимости мы хотим получить при определенной степени свободы.

Тема 6. Нелинейная регрессия

Различают два класса нелинейной регрессии:

Класс I: Регрессия нелинейная, относительно включенных в анализ объясняющих переменных, но линейная по оцениваемым параметрам.

Сюда входят: А) полиномы всех степеней

Б) равносторонние гиперболы

Класс II: Регрессия нелинейная по оцениваемым параметрам.

Сюда входят: А) степенная функция

Б) показательная функция

В) экспоненциальная функция

Г) другие функции

Модели I класса

Цель при анализе моделей: определить параметры функции, тесноту связи и надежность.

Для этого класса можно использовать МНК.

1) Полином: второй степени

Процесс превращения нелинейных функций в линейный вид называется линеализацией.

k-той степени

Параметры а, b, c,…, k можно определить МНК. Таким образом, полином любого порядка сводится к линейной регрессии.

Интерпретация параметров и использование в практике параболы

Парабола имеет следующий вид: у параболы существует точка перегиба. Это означает, что определенного предела функция ведет себя как возрастающая, а потом начинает убывать (наоборот).

На практике перечень таких явлений ограничен. Поэтому, во-первых, для выравнивания используют не всю параболу, а какой-либо её сегмент. Здесь надо помнить, что существует точка перегиба, после которой прогноз будет невозможен. Во-вторых, заменяют параболу на степенную функцию.

Система нормальных уравнений для определения параметров параболы

2) Равносторонняя гипербола

Система нормальных уравнений для определения параметров равносторонней гиперболы

Интерпретация уравнения:

- если b > 0, х → => у → а - если b < 0, х → => у → а

функция убывает функция возрастает

Все другие модели, которые приводятся к линейному виду путем замены переменных на соответствующие линейные.

Модели второго класса

1) Внутренне-линейные модели

Могут быть приведены к линейному виду путем логарифмирования или других преобразований.

а) Степенная функция

Решаем уравнение, применяя МНК.

После нахождения параметров a' и b проводим потенцирование и возвращаем уравнение к исходному виду.

б) экспоненциальная функция

К этому уравнению применим МНК.

2) Внутренне-нелинейные модели

Не могут быть приведены к линейному виду.

Для оценки их параметров используют метод подбора, т.к. нельзя использовать МНК.

Таким образом, в эконометрике к линейным моделям относят:

1. Модели, линейные по переменным и параметрам (например, у = а + вх)

2. Модели, так или иначе, сводимые к линейным, т.е. нелинейные внешне, но линейные внутренне.

Тема 7. Коэффициент эластичности

Коэффициент показывает, на сколько процентов изменится У при изменении Х на один процент.

Найдем коэффициент эластичности для степенной функции у = а ∙ хb ∙ ε

Для линейной функции:

у = а + вх

Коэффициент эластичности зависит от значения Х, что неудобно.

Поэтому рассчитывают средний коэффициент эластичности, и работают с этим коэффициентом:

Интерпретация коэффициента эластичности: возможны случаи, когда коэффициент эластичности не имеет экономического смысла (например, х – стаж, у – заработная плата. При изменении стажа на 1% зарплата изменяется. Или х – срок кредита, у – ставка), тогда используют более простые способы интерпретации.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: