III. Оценка качества (достоверности) модели

Ошибка аппроксимации (А) ошибка или остаток.

Можно рассчитать А по каждому наблюдению в относительном виде:

А = (Σ |(у-у с крыш) / у| * 100%) / n

Расчет м. оформить в таблице:

y x у с крыш у-у с крыш |(у-у с крыш) / у| * 100%
1 10,57 1 21,48 -10,91 103,22
2 17,50 3 22,29 -4,79 27,37
Итого: - - - - 197,15

Если n = 8, то А = 197,15 / 8 = 24,64 %

Если А<10% - норма.


24. Частные критерии Фишера в оценке результатов множественной регрессии

Есть частные F-критерии, с помощью которых м. оценить дополнительное включение фактора в модель. Необходимость такой оценки связана с тем, что не каждый фактор в модели существенно увеличивает фактическую вариацию – поэтому нужно ли включать этот фактор в модель?

Важно, что из-за различной связи между факторов, значимость одного и того же доп. фактора различна в зависимости от порядка его включения в модель.

Частные F-критерии строятся на сравнении прироста факторов на 1 степень свободы за счет доп. включения в модель фактора к остаточной вариации до модели.

Fx1 = ((R2yx1x2 – r2yx2) / (1-R2 yx1x2)) * (n-m-1) = 0,96

Fx2 = ((R2yx1x2 – r2yx1) / (1-R2 yx1x2)) * (n-m-1) = 1,9

Fтабл = 10.

Вывод: С вероятностью α м. утверждать, что включение фактора х1 после х2 не целесообразно, и включение х2 после х1 нецелесообразно – нельзя построить двухфакторную модель.

Все показатели м. оформить в виде частной таблицы дисперсионного анализа ANOVA.

Источник вариации: df SS MS F
- регрессия 2 SSR MSR F
- в т.ч. с ф. х2 1 SSRх2 MSRх2 F х2
- регрессия, обусл. вкл. в модель ф. x1 после x2 1 SSRх1 MSRх1 F х1
- остаток 3 SSE MSE
- итого 5

df – кол-во степеней свободы; MS = SS/df – дисперсия на 1 степень свободы; SSx2 = SST * r2yx2 - сумма квадратов отклонений (общ., факт., остат.); F = MSR/MSE – критерий Фишера. F = t2.

а. Если F>Fтабл., то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность.

б. Если F<Fтабл., то гипотеза о случ… не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Вывод: с вероятностью α м. утверждать, что коэфф. детерминацииR2 в генеральной совокупности не значим; модель недостоверна.


25. Использование фиктивных переменных в моделях множественной регрессии

Фиктивная (структурная) переменная переменная, принимающая значение 1 или 0.

Используется при решении следующих задач:

1. при моделировании качественных признаков;

2. для учета структурной неоднородности, к которой приводят качественные признаки;

3. для оценки сезонных колебаний.

Фиктивные (структурны) переменные это сконструированные искусственно переменные, например, пронумерованные атрибутивные признаки (пол, образование, регион).

Рассмотрим пример:

Дано: Z=0, если камина в доме нет; Z=1, если камин в доме есть.

- Рассчитаем показатели тесноты (R2) и силы (b, Э) связи.

- Оценим значимость (достоверность) параметров модели (t) и самой модели (F, Fчастн).

- Общий вид уравнения: Y = 50 + 16X + 3Z.

Вывод: Для домов, не имеющих камина: Y = 50 + 16X (поскольку Z =0); для домов, имеющих камин: Y = 5 + 3 + 16X = 53 + 16Х (поскольку Z =1).

Вывод:

1. Увеличение жилой площади на 1000 кв.футов приводит к увеличению предсказанной средней оценочной стоимости на 16 тыс.долл. (это b) при условии, что фиктивная переменная (наличие камина) имеет постоянное значение.

2. Если жилая площадь постоянна, наличие камина увеличивает среднюю оценочную стоимость дома на 3 тыс.долл. (это коэфф. перед Z = c).

!!! Фиктивные переменные м. вводится и в нелинейные модели. При этом они вводятся линейно.

Рассмотрим пример:

ln y = ln a + b1ln x1 + b2z; ln y = 4 +0,3 ln x + 0,05z

yc крыш = e4 x0,3 e0,05z e4 = 65  e0,05z = 1,05

y = a + b1z1 +b2z2

Параметр a - среднее значение результативного признака при z1, z2 = 0.

Параметр b1 и b2 характеризует разность средних уравнений результативного признака для группы 1 и базовой группы 0.

Параметр b2 характеризует разность средних уравнений результативного признака для группы 2 и базовой группы 0.

Вывод:

1. 0,3 – коэфф. Э: при увеличении площади на 1 %, стоимость увеличивается на 0,3 %.

2.  e0,05z - оценка стоимости домов с камином в 1,05 раз дороже (на 5 %), чем без него.


26. Предпосылки метода наименьших квадратов

МНК применяется при оценке уравнения регрессии. Делаются предпосылки относительно случайной составляющей ε (ненаблюдаемой величиной): y = a + b1х1 +b2х2 + … + ε.

Основные предпосылки МНК:

1. случайный характер остатков (если на поле корреляции нет направленности в расположении точек ε);

2. нулевая средняя остатков, не зависящая от фактора x: Σ(у - ух с крыш) = 0 или нелин. модель - Σ(ln у - ln ух с крыш) = 0 и также на поле корреляции …;

3. гомоскедастичность (дисперсия каждого

отклонения одинакова для всех значений x) - рисунок;

4. отсутствие автокорреляции остатков

(распределение остатков независимо друг от друга);

5. остатки должны подчиняться нормальному распределению.

Если все 5 предпосылок выполнены, то оценки, полученные МНК и методом максимального правдоподобия, совпадают. Если не все – нужно скорректировать модель.
27. Гетероскедастичность - понятие, проявление и меры устранения

Проблемы, возникающие при построении регрессионных моделей:

1. Гетероскедастичность.

2. Мультиколлинеарность.

Гетероскедастичность (неоднородность) — означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы) – рисунок1.

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

Симптомы Г.:

1. низкий коэффициент детерминации r2;

2. это м. привести к смещенности оценки.

Меры по устранению гетероскедастичности:

1. Увеличение числа наблюдений.

2. Изменение функциональной формы модели.

3. Разделение исходной совокупности на качественно-однородные группы и проведение анализа в каждой группе.

4. Использование фиктивных переменных, учитывающих неоднородность.

5. Исключение из совокупности единиц, дающих неоднородность.

Зависимость остатков от выровненного значения результата:

а. дисперсия остатков увеличивается с

увеличением выровненного значения

результата (один из случаев Г.).

б. нет зависимости (гомоскедастичность) – рисунок2.

Тесты, используемые для выявления Г.:

1. Гольдфельда-Квандта

2. Парка

3. Глейзера

4. Уайта

5. Ранговой корреляции Спирмена


28. Оценка гетероскедастичности с помощью метода Гольдфельда и Квандта

Гетероскедастичность (неоднородность) — проблема, возникающая при построении регрессионных моделей; означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы).

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

Этот метод используется при малом объеме выборки.Рассмотрели однофакторную модель, для кот. дисперсия остатков возрастает пропорционально квадрату фактора. Чтобы оценить нарушение Г., предложили параметрический тест.

1. Все наблюдения упорядочивают по мере возрастания какого-либо фактора, который, как предполагается, оказывает влияние на возрастание дисперсии остатков.

2. Упорядоченную совокупность делят на три группы, причем первая и последняя должны быть равного объема с числом единиц, больших, чем число параметров модели регрессии. Число отобранных единиц обозначим k

3. По первой и третьей группе находят параметры уравнений регрессии и остатки по ним.

4. Используя данные об остатках моделей первой и третьей группы, рассчитывают фактическое значение F -критерия.

F = SSE(3) / SSE(1)

df 1= df 2= k-m-1

Вывод: отношения R будет удовлетворять отношение F-критериев. Чем больше будет величина R превышать табличное значение F-критерия, тем более будет нарушена предпосылка о равенстве дисперсий остаточных величин.


29. Использование коэффициента корреляции рангов Спирмэна для проверки наличия гетероскедастичности в остатках

Гетероскедастичность (неоднородность) — проблема, возникающая при построении регрессионных моделей; означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы).

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

Суть проверки заключается в том, что в случае гетероскедастичности абсолютные остатки коррелированны со значениями фактора.

1. Эту корреляцию можно измерить с помощью коэффициента ранговой корреляции Спирмена:

p = rСпирмана = 1 - (6Σd2 / (n * (n2-1)))

где, d – абсолютная разность между рангами значений фактора и остатка.

2. Статистическую значимость можно оценить с помощью t-критерия:

t = rСпирмана * корень из (n-2) / корень из (1- r2Спирмана)

3. Сравним эту величину с табличной при кол-ве степеней свободы

df = n – 2.

Вывод: Если это значение больше табличного, то корреляция между остатком и фактором статистически значима, то есть имеет место гетероскедастичность остатков. В противном случае принимается гипотеза об ее отсутствии.


30. Использование тестов Уайта, Парка, Глейзера при анализе гетероскедастичности в остатках

Гетероскедастичность (неоднородность) — проблема, возникающая при построении регрессионных моделей; означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы).

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

1. тест Парка:

Этот тест относится к тестам гетероскедастичности (для квадрата остатков). Предполагается, что дисперсия остатков связана со значениями факторов функции ln e2 = a + b ln x + u. Данная регрессия строится для каждого фактора в условиях многофакторной модели. Проверяется значимость коэффициента регрессии по критерию Стьюдента. Если коэффициент регрессии для уравнения ln ε2 окажется статистически значимым, то существует зависимость ln ε2 от ln x, то есть имеет место гетероскедастичность остатков.

2. тест Глейзера:

Тест Глейзера относится к тестам гетероскедастичности и основывается на регрессии абсолютных значений остатков, то есть рассматривается функция | ei| = a + b*xc + u. c – какое-либо число, например, c = – 1; – 0,5; 0,5; 1. Регрессия абсолютного значения остатка от фактора х строится при разных значениях параметра с; далее отбирается та функция, для которой коэффициент регрессии b оказывается наиболее значимым, то есть имеет место наибольшее значение критерия Стьюдента или критерия Фишера и детерминации.

3. тест Уайта:

Тест предполагает, что дисперсия ошибок регрессии представляет собой квадратичную функцию от значений факторов, то есть:

e2 = a + bx + cx2 + u

e2 = a + b1x1 + b1x12 + b2x2 + b2x22 + u.

Так что модель включает не только значения факторов, но и их квадраты, а также попарные произведения. Поскольку каждый параметр модели e2 = f (x)должен быть рассчитан на основе достаточного числа степеней свободы, то чем меньше объем совокупности, тем в меньшей мере квадратичная функция сможет содержать попарные произведения факторов.

 


31. Применение обобщенного метода наименьших квадратов (ОМНК) для случая гетероскедастичности остатков

Невозможность или нецелесообразность использования традиционного МНК по причине проявляющейся в той или иной степени гетероскедастичности привели к разработке обобщенного метода наименьших квадратов (ОМНК). Фактически при этом корректируется модель, изменяются ее спецификации, преобразуются исходные данные для обеспечения несмещенности, эффективности и состоятельности оценок коэффициентов регрессии.

При нарушении гомоскедастичности и наличии автокорреляции (это статистическая корреляция между случайно распределенными в пространстве переменными одного и того же типа, атрибута, имени и т.д., когда корреляция зависит от расстояния и/или направления между местоположениями) рекомендуют заменять МНК на ОМНК.

Отличие: применяется к преобразованным данным и не только получает несмещенные оценки, но и оценки эти имеют меньшие выборочные дисперсии.

Предполагаем:

-среднее остатков равно нулю,

-гипотеза: их дисперсия уже не является постоянной, она пропорциональна x2

-сама величина дисперсии, входящая общим множителем при этих коэффициентах пропорциональности, неизвестна.

-исходная модель после введения этих коэффициентов в уравнение множественной регрессии продолжает оставаться гетероскедастичной:

y = a + bx + e *корень из(x)

-пусть эти остаточные величины (остатки) не являются автокоррелированными.

1. Введем новые переменные, получающиеся делением исходных переменных модели, зафиксированных в результате i-наблюдения, на корень квадратный из коэффициентов пропорциональности Кi:

y / к.из(x) = (a / к.из(x)) + (bx / к.из(x)) + e

y / к.из(x) = Y

1 / к.из(x) = Z

2. Получим новое уравнение в преобразованных переменных, в котором уже остатки будут гомоскедастичны. Сами новые переменные — это взвешенные исходные переменные:

Y = aZ + b* к. из(x) + e

3. Необходимо минимизировать величину отклонений У; получим систему нормальных уравнений:

Σ (YZ) = a*Σ Z2 + b*Σ (z * к.из(x))

Σ Y к.из(x) = a*Σ (Z *к.из(x)) + b*Σ x

4. Определяем коэфф. регрессии b в ОМНК, как взвешенную величину по отношению к обычному МНК с весами 1 / к.из(x). Преобразовываем систему:

Σ (y/x) = a*Σ (1/x) + n*b

Σ y = n*a + b*Σ x

или

y / к.из(x) = a’ / к.из(x) + b’*x / к.из(x) + e

y = a’ + b’*x.

Вывод:   Если в модели обнаружена гетероскедастичность, то ее можно устранить с помощью ОМНК. Все зависит от того, насколько точно мы можем оценить дисперсию ошибок наблюдений. Если мы нашли переменные, которые хорошо их описывают, то ОМНК будет работать.

Недостатки (две технические проблемы)

1. в преобразованной регрессии не будет константы, поэтому коэффициент детерминации перестает быть хорошим измерителем качества регрессии.

2. мы делим все переменные в уравнении регрессии на одну и ту же переменную, это может привести к возникновению ложных связей и мультиколлинеарности (тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат).

КРАТКО:

1. Преобразование исходных переменных:

t’ = yt – rb * yt-1

xt’ = xt – rb * xt-1

2. Применение обычного МНК к уравнению и определение a* и b:

yt’ = a’ + b*xt’ + Vt

3. Расчет параметра a:

a = a’ / (1 - rb )

4. Переход к исходному уравнению:

yt = a + b*xt + et


32. Мультиколлинеарность факторов – понятие, проявление и меры устранения

Проблемы, возникающие при построении регрессионных моделей:

1. Гетероскедастичность.

2. Мультиколлинеарность.

Мультиколлинеарность — тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат.

Симптомы М.:

1. завышенное значение коэффициента детерминации r2;

2. высокие стандартные ошибки для коэффициентов регрессии b;

3. широкие доверительные интервалы (для b);

4. низкое значение t-критерия;

5. появление при коэффициентах регрессии b знаков, противоположных ожидаемым.

Методы по устранению М.:

1. Удаление из модели переменных с высоким коэффициентом парной корреляции r между факторами, если это не противоречит теории, положенной в основу построения модели.

2. Увеличение числа наблюдений n.

3. Изменение функциональной формы модели.

4. Использование априорной информации.

5. Построение моделей по отклонениям от средней величины.

6. Использование специальных методов обработки временных рядов.


33. Специфика временного ряда как источника данных в эконометрическом моделировании

Временной (динамический) ряд – это ряд последовательно расположенных во времени числовых значений соответствующего показателя

Элементы временного ряда:

1. уровни ряда (yt)- числовые значения того или иного показателя;

2. время (t).

Виды временных рядов:

1. моментные, если время задано моментами;

2. интервальные, если время задано интервалами.

Модели на основе рядов динамики:

1. Модели изолированного динамического ряда.

2. Модели системы взаимосвязанных рядов динамики.

3. Модели авторегрессии.

4. Модели с распределенным лагом.

Компоненты временного ряда:

1. Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

2. Периодические колебания (P)

3. Случайные колебания (E)

yt = f (T, P, E)

Графики:

1. Ряд без тенденции и периодических колебаний: yt = y + E;

2. Ряд с тенденцией: yt = f (T) + E;

3. Ряд с периодическими и случайными колебаниями yt = f (P, E);

4. Ряд с тенденцией, периодическими и случайными колебаниями yt = f (T, P, E).

1                                             2                                  

3                                             4
34. Автокорреляция уровней временного ряда и ее последствия

Автокорреляция уровней временного ряда -  корреляционная зависимость между последовательными значениями уровней временного.

rytyt-1 = (ytyt-1cp – yt cp * yt-1cp) / δytδyt-1

rytyt-1 = (Σ(yt – yt cp)* (yt-1 - yt-1cp)) / к.из(Σ(yt – yt cp)2*(yt-1 - yt-1cp) 2)

Последствия:

1. Оценки параметров, оставаясь линейными не смещенными, перестают быть эффективными, они перестают обладать свойствам наилучших линейных несмещенных оценок

2. Дисперсии оценок являются смещенными.

3. Зачастую дисперсии являются заниженными, что привод к увеличению t-статистик. Это может привести к признанию статистически значимыми объясняющие переменные, которые могут ими и не являться.

4. Коэф. регрессии и детерминации м.б. не верными, следовательно ухудшаются прогнозные качества модели.

 


35. Моделирование тенденции временных рядов

Метод аналитического выравнивания сводится к замене фактических данных сглаженными, определенными по выбранной математической функции. При этом, уровни временного ряда рассматриваются как функция от времени: yt = f(t)

Этапы построения модели тенденции (уравнения тренда):

1. Выбор математической функции, описывающей тенденцию;

2. Оценка параметров модели;

3. Проверка адекватности выбранной функции и оценка точности модели;

4. Расчет точечного и интервального прогнозов;

Виды математических функций, описывающих тенденцию:

1. Функции с монотонным характером возрастания (убывания) и отсутствием пределов роста (сниж-я);

2. Кривые с насыщением, т. е. устанавливается нижняя или верхняя граница изменения уровней ряда;

3. S -образные кривые, т. е. кривые с насыщением, имеющие точку перегиба.


36. Оценивание параметров в уравнениях тренда

Уравнения трендов:

1. Линейная y = a + bt

2. Гипербола y = a + b/t                                                                                                                                                      

3. Парабола второго порядка y = a + bt + ct2

4. Степенная функция y = atb                                                                                                                                                                                                                                                                                            

5. Показательная функция y = abt                                                                                                                                                                                                                                                                                 

6. Экспонента y = ea + bt                                                                                                                                                                                                                                                                                                             

7. Обратная модель y = 1/(a + bx)    

8. Логарифмическая y = a + b*lnx

Эконометрическое оценивание моделей включает два основных этапа:

1. Теоретический. Считается, что определена генеральная совокупность. Зная ее статистические свойства, м. теоретически определить параметры модели.

2. Эмпирический. Используются выборочные данные. Можно оценить, но нельзя точно определить значения параметров модели, т.к. они являются случайными величинами.

Параметры - характеристики генеральной совокупности. Оценки - характеристики выборочной совокупности.

Оценка генеральных параметров может быть получена двумя методами:

а) МНК – используется чаще;

б) методом максимального правдоподобия.

Требования к оценкам (свойства):

1. Несмещенность. В среднем оценка соответствует параметру при любом объеме выборки.

2. Эффективность. Несмещенная оценка эффективна, если онаимеет мин. дисперсию по сравнению с другими выборочными оценками. Та из оценок, которая имеет меньшую дисперсию, является более эффективной.

3. Состоятельность. Оценка состоятельна, если при увеличении объема выборки она стремится к оцениваемому параметру. Т.е. хср не отличается от µ, когда n → ∞.

Рассмотрим линейный тренд:

t y = a + bt ∆y = yt – yt-1
1 a + b -
2 a + 2b b
3 a + 3b b
4 a + 4b b

Можно вывести формулы для нахождения параметров системы:

b = ((yt*t)ср - yt ср * tср) / (t2ср – tср2); а = yt cp - b*tср.

а - свободный член уравнения регрессии; экономически не интерпретируется.

b - абсолютный показатель силы связи (в лин. ур-ии).Наклон линии регрессии или коэффициент регрессии. Мера зависимости у от х.

Σt = 0; a = Σy / n; b = Σyt / Σt2

Система норм. ур-ий: Σy = na + bΣt

                       Σyt = aΣt + bΣt2

   

37. Модели сезонности: аддитивная и мультипликативная

Метод аналитического выравнивания сводится к замене фактических данных сглаженными, определенными по выбранной математической функции. При этом, уровни временного ряда рассматриваются как функция от времени: yt = f(t).

Учет сезонности при построении модели регрессии y = a +bxt + c1z1 + c2z2 + c3z3:

z1 = 1 – для первого квартала, z1 = 0 – для остальных;

z2 = 1 – для второго квартала, z2 = 0 – для остальных;

z3 = 1 – для третьего квартала, z3 = 0 – для остальных.

Тимы моделей:

1. Аддитивная модель -модель, в которую факторы входят в виде алгебраической суммы; приблизительно равная сезонная вариация указывает на существование аддитивной модели: yt = T+S+E

2. Мультипликативная модель -модель, в которую факторы входят в виде произведения; усиление сезонной вариации с возрастанием тренда указывает на существование мультипликативной модели: yt = T*S*E 

Построение аддитивной модели:

1. Нахождение сглаж. уравнений динамич. ряда методом скользящих средних

2. Оценка сезонной компоненты и ее корректировка

3. Элиминирование сезонной компоненты из исходных данных временного ряда

4. Построение уравнения линейного тренда по уровням ряда с элиминированием сезонности

5. расчет выровненных значений трендовой составляющей

6. расчет теоретических уровней ряда с учетом сезонности

7. расчет случайной компоненты, позволяющей оценить качество

построенной модели.

Аддит.                                  Мультипл.

 


Аддитивная.    Мультипликативная


38. Исключение тенденции на основе метода отклонений от тренда

Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. eyt = yt – yt с крыш ; ext = xt – xt с крыш

eyt = a – b*ext

2. (yt – yt с крыш) = a + b*(xt - xt с крыш)

yt = yt с крыш + a + b*(xt - xt с крыш)

yp = yt=p с крыш + a + b*(xp – xt=p с крыш)

 

yp - прогнозное значение у;

yt=p с крыш - прогноз у по тренду при t=p;

xp - прогнозное значение х;

xt=p с крыш - прогноз х исходя из уравнения тренда при t=p.

 


39. Исключение тенденции на основе метода последовательных разностей

Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. ∆yt = yt – yt-1 ; ∆xt = xt – xt-1

yt = a + b * ∆xt

2. (yt – yt-1) = a + b*(xt - xt-1)

yt = yt-1 + a + b*(xt - xt-1)

yp = yn + a + b*(xp – xn)

yp - прогнозное значение уровня ряда yt;

yn – конечный уровень динамического ряда yt;

xp - прогнозное значение уровня ряда хt;

xn - конечный уровень динамического ряда хt.

 


40. Исключение тенденции на основе включения в модель регрессии по временным рядам фактора времени

Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. yt = a + b*xt + c*t

yt = a + b1x1 + b2x2 + b3x3 + c*t

2. P = aKb1Lb2Ect

lnP = lna + b1 lnK + b2 lnL +ct

yt = a + bx1 + ct + dt2


41. Автокорреляция в остатках. Критерий Дарбина-Уотсона в оценке качества уравнений, построенных по временным рядам

Автокорреляция в остатках - корреляционная зависимость. Это проблема. Последовательность остатков м. рассматриваться как временной ряд – возникает возможность построения зависимости последовательности остатков от времени. Остатки должны быть случайными (из МНК).

Причины А. остатков:

1. Связана с исходными данными и вызвана ошибками измерения в значениях результативного признака. Т,к. часто остатки содержат циклические колебания – каждое следующее значение остатков зависит от предшествующих.

2. Из-за недостатков формулировки модели.

а. м. отсутствовать фактор, оказывающий существенное воздействие на результат, влияние которого отражается в остатках. Помимо фактора времени – лаговые значения переменных (переменная появляется в модели с запозданием на неск. периодов; учитывающая запаздывание), включенных в модель.

б. м.б., чт о модель не учитывает несколько второстепенных по отдельности факторов, совместное влияние которых на результат уже оказывается существенным. Эта значимость проистекает в силу совпадения тенденций их изменения или фаз циклических колебаний.

r ab = ((etet-1)cp – et cp * et-1 cp) / δetδet-1

d = Σ (et - et-1)2 / Σet2

d = 2 * (1-r ab) -(приблизительно); d = [0; 4]

Алгоритм выявления автокорреляции остатков на основе критерия Дарбина — Уотсона:

1. выдвигается гипотеза об отсутствии автокорреляции остатков;

2. альтернативные гипотезы состоят в наличии положительной или отрицательной автокорреляции в остатках;

3. затем по специальным таблицам определяются критические значения критерия Дарбина — Уотсона для заданного числа наблюдений, числа независимых переменных модели и уровня значимости;

4. по этим значениям числовой промежуток разбивают на пять отрезков. (2 из этих отрезков образуют зону неопределенности; 3 - нет оснований отклонять гипотезу об отсутствии автокорреляции, есть положительная автокорреляция, есть отрицательная автокорреляция. При попадании в зону неопределенности практически считают, что имеется автокорреляция остатков, и поэтому отклоняют гипотезу о ее отсутствии).


42. Обобщенный метода наименьших квадратов (ОМНК) при построении модели регрессии по временным рядам

Невозможность или нецелесообразность использования традиционного МНК по причине проявляющейся в той или иной степени гетероскедастичности привели к разработке обобщенного метода наименьших квадратов (ОМНК). Фактически при этом корректируется модель, изменяются ее спецификации, преобразуются исходные данные для обеспечения несмещенности, эффективности и состоятельности оценок коэффициентов регрессии.

При нарушении гомоскедастичности и наличии автокорреляции (это статистическая корреляция между случайно распределенными в пространстве переменными одного и того же типа, атрибута, имени и т.д., когда корреляция зависит от расстояния и/или направления между местоположениями) рекомендуют заменять МНК на ОМНК.

Отличие: применяется к преобразованным данным и не только получает несмещенные оценки, но и оценки эти имеют меньшие выборочные дисперсии.

Порядок действий:

1. Преобразование исходных переменных:

yt’ = yt – rb * yt-1

xt’ = xt – rb * xt-1

2. Применение обычного МНК к уравнению и определение a* и b:

yt’ = a’ + b*xt’ + Vt

3. Расчет параметра a:

a = a’ / (1 - rb )

4. Переход к исходному уравнению:

yt = a + b*xt + et

Вывод:   Если в модели обнаружена гетероскедастичность, то ее можно устранить с помощью ОМНК. Все зависит от того, насколько точно мы можем оценить дисперсию ошибок наблюдений. Если мы нашли переменные, которые хорошо их описывают, то ОМНК будет работать.

Недостатки (две технические проблемы)

1. в преобразованной регрессии не будет константы, поэтому коэффициент детерминации перестает быть хорошим измерителем качества регрессии.

2. мы делим все переменные в уравнении регрессии на одну и ту же переменную, это может привести к возникновению ложных связей и мультиколлинеарности (тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат).

Последовательность формул:

1. yt = a + b*xt + et

yt-1 = a + b*xt-1 + et-1

et = c + d *et-1 + Vt

d = ((etet-1)cp – et cp * et-1 cp) / (e2t-1cp – (et-1 cp)2)

2. et = r*et-1 + Vt

 yt = a + b*xt + r*et-1 + Vt

yt-1 = a + b*xt-1 + r*et-1 + Vt

rb*yt-1 = rb*a + rb*b*xt-1 + rb *et-1

3. yt - rb*yt-1 = a - rb*a + rb*b*xt-1 + et - rb *et-1

yt - rb*yt-1 = a(1 - rb) + b(xt - rb*xt-1) + (et - rb *et-1)

yt’ = a’ + b*xt’ + Vt

 

 


43. Прогнозирование на основе рядов динамики

Временной (динамический) ряд – это ряд последовательно расположенных во времени числовых значений соответствующего показателя

Элементы временного ряда:

1. уровни ряда (yt)- числовые значения того или иного показателя;

2. время (t).

Виды временных рядов:

1. моментные, если время задано моментами;

2. интервальные, если время задано интервалами.

Компоненты временного ряда:

1. Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.

2. Периодические колебания (P)

3. Случайные колебания (E)

yt = f (T, P, E)

Статистический прогноз – вероятностная оценка возможностей развития объекта (процесса) и величины его признаков в будущем, полученная на основе статистической закономерности, выявленной по данным прошлого периода.

Назначение: а. планирование управления объекта; б. выработка стратегии поведения субъекта (если объект не управляем).

!!! Статистический прогноз предполагает не только верное качественное предсказание, но и достаточно точное количественное измерение вероятных возможностей ожидаемых значений признаков. Необходимо, чтобы прогностическая модель имела достаточную точность или допустимо малую ошибку прогноза.

Область применения – большое значения изучения трендов и колеблемости: а. в социально-экономических науках;

б. в процессе практического планирования и управления производством. Прогноз выражается в виде:

1. Точечный. Оценка прогнозируемого показателя в точке (в конкретном году, месяце, дне, середине периода прогноза) по уравнению, описывающему тенденцию показателя. Рассчитывается путем подстановки номера года, на который рассчитывается прогноз, в уравнение тренда. Она является средней оценкой для прогнозного интервала времени. Точечный прогноз указывает ту величину урожайности, на которую в среднем выйдет объект на прогнозируемый год, если тенденция динамики урожайности сохранится. Эту величину можно использовать в планирование.

2. Интервальный. По типу прогнозируемого показателя распадается на 3 вида:

- прогноз вероятных границ тренда;

- прогноз вероятных границ уровней отдельных лет с учетом их возможной -колеблемости относительно тренда;

- прогноз вероятных границ среднегодовых уровней динамического ряда.

Ур-ие тренда: y = a + bt; t – количество периодов до планового включительно.


44. Общая характеристика моделей с распределенным лагом и моделей авторегрессии

I. Лаговая переменная - переменная появляется в модели с запозданием на неск. периодов; учитывающая запаздывание.

Виды моделей:

1. модели с распределенными лагами(с лаговыми объясняющими переменными):

yt = a + b0xt + b1xt-1 + … + et

2. модели авторегрессии (с лаговыми зависимыми переменными):

yt = a + bxt + c1xt-1 + c2xt-2 + … + et

3. авторегрессионные модели с распределенными лагами (модели с лаговыми зависимыми и независимыми переменными):

yt = a + b1yt-1 + … + bkуt-k + c0xt  + c1xt-1 + c2xt-2 + … + et

Модели с распределенными лагами:

1. с конечным числом лагов: yt = a + b0хt + b1xt-1 + … + bкxt + + et

2. с бесконечным числом лагов: yt = a + b0хt + b1xt-1+ b2xt-2 + + et

 

Пример: yt с крыш = a + b0xt + b1xt-1 + b2xt-2 + b3xt-3 + b4xt-4

Вывод: данная модель означает, что изменение во времени t объясняющей переменный x будет влиять на значения результативного признака y в течение 4-х следующих моментов времени.

 

II. Авторегрессия - применяемая в эконометрике модель для отыскания зависимости дисперсии текущей ошибки от квадратов ошибок модели для предшествующих наблюдений.

yt = a + b0xt + n1yt-1 + et

- параметр b0 характеризует краткосрочное изменение yt под воздействием изменения xt на 1 единицу.

- долгосрочный мультипликатор изменения y: b = b0 / (1 – c1)


45. Интерпретация параметров моделей с распределенным лагом и моделей авторегрессии

I. Лаговая переменная - переменная появляется в модели с запозданием на неск. периодов; учитывающая запаздывание.

Модели с распределенными лагами:

1. с конечным числом лагов: yt = a + b0хt + b1xt-1 + … + bкxt + + et

2. с бесконечным числом лагов: yt = a + b0хt + b1xt-1+ b2xt-2 + + et

 

Пример: yt с крыш = a + b0xt + b1xt-1 + b2xt-2 + b3xt-3 + b4xt-4

Вывод: данная модель означает, что изменение во времени t объясняющей переменный x будет влиять на значения результативного признака y в течение 4-х следующих моментов времени.

Параметры:

1. Краткосрочный мультипликатор. Коэффициент b0. Он характеризует среднее изменение результата y при изменении на 1 единицу своего измерения в фиксированный момент времени t.

2.  Промежуточные мультипл-ры. В момент времени t+1воздействие объясняющей переменной x на результат y составит (b0+b1) единиц, а в момент времени t+2 общее изменение y составит (b0+b1+b2) единиц.

- b0+b1 - изменение y в момент времени t+1;

- b0+b1+b2 - изменение y в момент времени t+2.

3. Долгосрочный мультипл-р. При k =4 долгосрочный мультипликатор составит b0+b1+b2+b3+b4. Он характеризует общее среднее изменение y через 4 временных интервала при увеличении x в момент времени t на 1 единицу

- Σbi

4. Относительные коэффициенты модели. Характеризует долю общего изменения y в момент времени t+i.

ßi = bi / Σbi; Σbi = 1; bi = [0; 1]

5. Средняя величина лага. Показывает средний интервал времени, в течение которого будет происходить изменение зависимой переменной y под воздействием изменения объясняющей переменной x в момент времени t.

Чем меньше величина среднего лага, тем быстрее реагирует результат y на изменение x. И наоборот, высокое значение среднего лага показывает, что воздействие объясняющей переменной на результат будет сказываться с течением длительного промежутка времени.

i ср = Σ(i * ßi)

6. Медианный лаг. Тот период времени, в течение которого с момента времени t будет реализована половина общего эффекта воздействия объясняющей переменной x на результат y.

Σßi = 0,5

II. Авторегрессия - применяемая в эконометрике модель для отыскания зависимости дисперсии текущей ошибки от квадратов ошибок модели для предшествующих наблюдений.

yt = a + b0xt + n1yt-1 + et

- параметр b0 характеризует краткосрочное изменение yt под воздействием изменения xt на 1 единицу.

- долгосрочный мультипликатор изменения y: b = b0 / (1 – c1)


46. Применение фиктивных переменных для моделирования сезонных колебаний

Фиктивная (структурная) переменная переменная, принимающая значение 1 или 0. Их количество д.б на 1 меньше, чем количество моментов времени за 1 цикл колебания.

Используется при решении следующих задач:

1. при моделировании качественных признаков;

2. для учета структурной неоднородности, к которой приводят качественные признаки;

3. для оценки сезонных колебаний.

Каждая фиктивная переменная отражает сезонную компоненту временного ряда для 1 периода. Она = 1 для 1 периода и = 0 для всех остальных.

Рассмотрим временной ряд, содержащий циклический колебания периодичностью К:

yt = a + bt + c1x1 + … + cjxj + … +  ck-1xk-1 + et

где х j = 1 для j внутри цикла и х = 0 для остальных.

Для моделирования сезонных колебаний на основе поквартальных данных за несколько лет, число кварталов = К = 4, общий вид модели:

yt = a + bt + c1x1 + c2x2 +  c3x3 + et

где х1 = 1 для 1 квартала и х = 0 для остальных; х2 = 1 для 2 квартала и 0 для остальных; ….

Уравнение тренда для каждого квартала будет:

1. yt = a + bt + c1 + et

2. yt = a + bt + c2 + et

3. yt = a + bt + c3 + et

4. yt = a + bt + et

Т.о. фиктивный переменные позволяют дифференцировать величину свободного члена уравнения регрессии для каждого квартала:

1. a + c1

2. a + c2

3. a + c3

4. a

Параметр b характеризует среднее абсолютное изменение уровней ряда под воздействием тенденции. Это аналог аддитивной модели, т.к. фактический уровень врем. ряда – сумма трендовой, сезонной и случ. компонент.

Тенденция (T) характеризует воздействие всех факторов на динамику изучаемого показателя.


47. Общее понятие о системах уравнений, используемых в эконометрике

Объект стат. изучения – сложные системы. Отдельное ур-ие не может характеризовать влияние признака на вариацию полностью. Поэтому используем систему уравнений, чтобы лучше описать структуру связей между переменными.

1. Система независимых уравнений (зависимая переменная у рассматривается как функция одного и того же набора факторов х):

y1 = a01 + a11x1 + a12x2 + a13x3 + e1

y2 = a02 + a21x1 + a22x2 + a23x3 + e2

y3 = a03 + a31x1 + a32x2 + a33x3 + e3

2. Система рекурсивных уравнений (если зависимая переменная у одного ур-ия выступает в виде фактора х в другом уравнении):

y1 = a01 + a11x1 + a12x2 + a13x3 + e1

y2 = a02 + b21y1 + a22x2 + e2

y3 = a03 + b31y1 + b32y2 + a34x4 + a35x5 + e3

3. Система взаимозависимых уравнений (одни и те же зависимые переменные входят в левую часть, в других уравнениях – в правую):

y1 = a01 + b12y2 + a11x1 + a12x2 + e1

y2 = a02 + b21y1 + b23y3 + a23x3 + e2

y3 = a03 + b32y2 + a33x3 + e3

а. Статистическая модель Кейнса для описания народного хозяйства страны в наиболее простом варианте (С – личное потребление, у – национальный доход, I – инвестиции (все в постоянных ценах)):

С = α + ßy + e

Y = C + I

б. Модель цены и зарплаты:

w = a1 + b11UN + b12P + e1

p = a2 + b21w + b22R + b23M + e2

w – зарплата; UN – уровень безработицы; P – темп уровня цен; R – темп изменения постоянного капитала; M – темп изменения цен на импортируемое сырье.

 


48. Виды переменных в системах взаимозависимых уравнений

Система взаимозависимых (одновременных) уравнений:

y1 = a01 + b12y2 + a11x1 + a12x2 + e1

y2 = a02 + b21y1 + b23y3 + a23x3 + e2

y3 = a03 + b32y2 + a33x3 + e3

Зависимая переменная одного уравнения может появляться одновременно в виде переменной (но уже в качестве независимой) в одном или нескольких других уравнениях. Поэтому теряет смысл традиционное различение зависимых и независимых переменных. Устанавливается различие между двумя видами переменных:

1. совместно зависимые переменные (эндогенные), влияние которых друг на друга должно быть исследовано;

2. предопределенные переменные - оказывают влияние на первые, однако не испытывают их воздействия:

а. то переменные с запаздыванием (лаговые);

б. определенные вне данной системы уравнений экзогенные переменные.
Примеры:

Экзогенные - показатели климатических условий, если они включаются в модель.

Экономические переменные в зависимости от задач и структуры модели могут относиться и к эндогенным, и к экзогенным.

!!! В зависимости от характера переменных, эконометрические модели классифицируются на линейные модели с одной, двумя и большим числом переменных, а также на пробит-модели, логит-модели, тобит-модели.

 


49. Структурная и приведенная формы модели.

Структурная:

y1 = a01 + b12y2 + a11x1 + a12x2 + e1

y2 = a02 + b21y1 + b23y3 + a23x3 + e2

y3 = a03 + b32y2 + a33x3 + e3

Приведенная:

y1 = А1 + В11x1 + В12x2 + В13x3 + V1

y2 = A2 + B21x1 + B22x2 + B23x3 + V2

y3 = A3 + B31x1 + B32x2 + B33x3 + V3

а. для модели Кейнса (равновесие спроса и предложения):

С = А1 + В1I + V1

Y = A2 + B2I + V2

б. для модели цены и зарплаты:

w = A1 + B11UN + B12R + B13M + V1

p = A2 + B21UN + B22R + B23M + V2

w – зарплата; UN – уровень безработицы; P – темп уровня цен; R – темп изменения постоянного капитала; M – темп изменения цен на импортируемое сырье.

Особенности приведенной формы:

1. в правой части модели используется только предопределенные переменные, следовательно расчет параметров может быть произведен с помощью обычного МНК;

2. существует определенное соотношение между коэффициентами структурной формы и приведенной формы (приведенные коэффициенты – нелинейные соотношения коэффициентов структурной моделей).

Связь между структурными приведенными коэффициентами (в модели Кейнса):

Модель Кейнса: С = α + ßy + e

                    Y = C + I

- С = α + ß(С +I) + e

C – ßС = α + ßI + e

C = α /(1-ß) + ßI/(1-ß) + e /(1-ß)

- A = α /(1-ß); B11= ßI/(1-ß); V1 = e /(1-ß)

- C = A1 +B11I + V1

- y = y /(1-ß) + I/(1-ß) + e /(1-ß)

y = A2 +B21I + V2


50. Проблема идентификации Необходимое условие идентификации (порядковое или счетное правило)

Структурная:

y1 = a01 + b12y2 + a11x1 + a12x2 + e1

y2 = a02 + b21y1 + b23y3 + a23x3 + e2

y3 = a03 + b32y2 + a33x3 + e3

Приведенная:

y1 = А1 + В11x1 + В12x2 + В13x3 + V1

y2 = A2 + B21x1 + B22x2 + B23x3 + V2

y3 = A3 + B31x1 + B32x2 + B33x3 + V3

Идентификация модели – соответствие между приведенной и структурной формами модели, позволяющее однозначно оценить структурные коэффициенты по приведенным коэффициентам модели.

Случаи идентификации:

1. Модель идентифицируема, если число коэффициентов структурной модели равно числу коэффициентов приведенной модели и структурные коэффициенты однозначно определяются по приведенным коэффициентам.

2. Модель неидентифицируема, если число структурных коэффициентов больше числа приведенных коэффициентов. Модели, в которых в каждом уравнении системы участвуют все эндогенные и экзогенные переменные, имеющиеся в системе, всегда неидентифицируемы.

3. Модель сверхидентифицируема, если число приведенных коэффициентов превышает число структурных коэффициентов. В результате на основе коэффициентов приведенной модели можно получить несколько значений одного структурн


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow