III. Оценка качества (достоверности) модели

Ошибка аппроксимации (А) – ошибка или остаток.

Можно рассчитать А по каждому наблюдению в относительном виде:

А = (Σ |(у-у _{с крыш}) / у| * 100%) / n

Расчет м. оформить в таблице:

№	y	x	у _{с крыш}	у-у _{с крыш}	\|(у-у _{с крыш}) / у\| * 100%
1	10,57	1	21,48	-10,91	103,22
2	17,50	3	22,29	-4,79	27,37
…	…	…	…	…	…
Итого:	-	-	-	-	197,15

Если n = 8, то А = 197,15 / 8 = 24,64 %

Если А<10% - норма.

24. Частные критерии Фишера в оценке результатов множественной регрессии

Есть частные F-критерии, с помощью которых м. оценить дополнительное включение фактора в модель. Необходимость такой оценки связана с тем, что не каждый фактор в модели существенно увеличивает фактическую вариацию – поэтому нужно ли включать этот фактор в модель?

Важно, что из-за различной связи между факторов, значимость одного и того же доп. фактора различна в зависимости от порядка его включения в модель.

Частные F-критерии строятся на сравнении прироста факторов на 1 степень свободы за счет доп. включения в модель фактора к остаточной вариации до модели.

F_x1 = ((R²_yx1x2 – r²_yx2) / (1-R² _yx1x2)) * (n-m-1) = 0,96

F_x2 = ((R²_yx1x2 – r²_yx1) / (1-R² _yx1x2)) * (n-m-1) = 1,9

F_табл = 10.

Вывод: С вероятностью α м. утверждать, что включение фактора х₁ после х₂ не целесообразно, и включение х₂ после х₁ нецелесообразно – нельзя построить двухфакторную модель.

Все показатели м. оформить в виде частной таблицы дисперсионного анализа ANOVA.

Источник вариации:	df	SS	MS	F
- регрессия	2	SS_R	MS_R	F
- в т.ч. с ф. х₂	1	SS_R_х2	MS_R_х2	F_х2
- регрессия, обусл. вкл. в модель ф. x₁после x₂	1	SS_R_х1	MS_R_х1	F_х1
- остаток	3	SS_E	MS_E	–
- итого	5	–	–	–

df – кол-во степеней свободы; MS = SS/df – дисперсия на 1 степень свободы; SS_x₂ = SS_T * r₂_yx₂ - сумма квадратов отклонений (общ., факт., остат.); F = MS_R/MS_E – критерий Фишера. F = t².

а. Если F>Fтабл., то гипотеза о случайной природе оцениваемых характеристик отклоняется и признается статистическая значимость и надежность.

б. Если F<Fтабл., то гипотеза о случ… не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Вывод: с вероятностью α м. утверждать, что коэфф. детерминацииR² в генеральной совокупности не значим; модель недостоверна.

25. Использование фиктивных переменных в моделях множественной регрессии

Фиктивная (структурная) переменная – переменная, принимающая значение 1 или 0.

Используется при решении следующих задач:

1. при моделировании качественных признаков;

2. для учета структурной неоднородности, к которой приводят качественные признаки;

3. для оценки сезонных колебаний.

Фиктивные (структурны) переменные – это сконструированные искусственно переменные, например, пронумерованные атрибутивные признаки (пол, образование, регион).

Рассмотрим пример:

Дано: Z=0, если камина в доме нет; Z=1, если камин в доме есть.

- Рассчитаем показатели тесноты (R²) и силы (b, Э) связи.

- Оценим значимость (достоверность) параметров модели (t) и самой модели (F, F_частн).

- Общий вид уравнения: Y = 50 + 16X + 3Z.

Вывод: Для домов, не имеющих камина: Y = 50 + 16X (поскольку Z =0); для домов, имеющих камин: Y = 5 + 3 + 16X = 53 + 16Х (поскольку Z =1).

Вывод:

1. Увеличение жилой площади на 1000 кв.футов приводит к увеличению предсказанной средней оценочной стоимости на 16 тыс.долл. (это b) при условии, что фиктивная переменная (наличие камина) имеет постоянное значение.

2. Если жилая площадь постоянна, наличие камина увеличивает среднюю оценочную стоимость дома на 3 тыс.долл. (это коэфф. перед Z = c).

!!! Фиктивные переменные м. вводится и в нелинейные модели. При этом они вводятся линейно.

Рассмотрим пример:

ln y = ln a + b₁ln x₁+ b₂z; ln y = 4 +0,3 ln x + 0,05z

y_c_крыш= e⁴x^0,3e^0,05^z e⁴ = 65 e^0,05^z = 1,05

y = a + b₁z₁ +b₂z₂

Параметр a - среднее значение результативного признака при z₁, z₂ = 0.

Параметр b1 и b2 характеризует разность средних уравнений результативного признака для группы 1 и базовой группы 0.

Параметр b2 характеризует разность средних уравнений результативного признака для группы 2 и базовой группы 0.

Вывод:

1. 0,3 – коэфф. Э: при увеличении площади на 1 %, стоимость увеличивается на 0,3 %.

2. e^0,05^z - оценка стоимости домов с камином в 1,05 раз дороже (на 5 %), чем без него.

26. Предпосылки метода наименьших квадратов

МНК применяется при оценке уравнения регрессии. Делаются предпосылки относительно случайной составляющей ε (ненаблюдаемой величиной): y = a + b₁х₁ +b₂х₂+ … + ε.

Основные предпосылки МНК:

1. случайный характер остатков (если на поле корреляции нет направленности в расположении точек ε);

2. нулевая средняя остатков, не зависящая от фактора x: Σ(у - у_{х с крыш}) = 0 или нелин. модель - Σ(ln у - ln у_{х с крыш}) = 0 и также на поле корреляции …;

3. гомоскедастичность (дисперсия каждого

отклонения одинакова для всех значений x) - рисунок;

4. отсутствие автокорреляции остатков

(распределение остатков независимо друг от друга);

5. остатки должны подчиняться нормальному распределению.

Если все 5 предпосылок выполнены, то оценки, полученные МНК и методом максимального правдоподобия, совпадают. Если не все – нужно скорректировать модель.
27. Гетероскедастичность - понятие, проявление и меры устранения

Проблемы, возникающие при построении регрессионных моделей:

1. Гетероскедастичность.

2. Мультиколлинеарность.

Гетероскедастичность (неоднородность) — означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы) – рисунок1.

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

Симптомы Г.:

1. низкий коэффициент детерминации r²;

2. это м. привести к смещенности оценки.

Меры по устранению гетероскедастичности:

1. Увеличение числа наблюдений.

2. Изменение функциональной формы модели.

3. Разделение исходной совокупности на качественно-однородные группы и проведение анализа в каждой группе.

4. Использование фиктивных переменных, учитывающих неоднородность.

5. Исключение из совокупности единиц, дающих неоднородность.

Зависимость остатков от выровненного значения результата:

а. дисперсия остатков увеличивается с

увеличением выровненного значения

результата (один из случаев Г.).

б. нет зависимости (гомоскедастичность) – рисунок2.

Тесты, используемые для выявления Г.:

1. Гольдфельда-Квандта

2. Парка

3. Глейзера

4. Уайта

5. Ранговой корреляции Спирмена

28. Оценка гетероскедастичности с помощью метода Гольдфельда и Квандта

Гетероскедастичность (неоднородность) — проблема, возникающая при построении регрессионных моделей; означает ситуацию, когда дисперсия ошибки в уравнении регрессии изменяется от наблюдения к наблюдению. В этом случае приходится подвергать определенной модификации МНК (иначе возможны ошибочные выводы).

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

Этот метод используется при малом объеме выборки.Рассмотрели однофакторную модель, для кот. дисперсия остатков возрастает пропорционально квадрату фактора. Чтобы оценить нарушение Г., предложили параметрический тест.

1. Все наблюдения упорядочивают по мере возрастания какого-либо фактора, который, как предполагается, оказывает влияние на возрастание дисперсии остатков.

2. Упорядоченную совокупность делят на три группы, причем первая и последняя должны быть равного объема с числом единиц, больших, чем число параметров модели регрессии. Число отобранных единиц обозначим k

3. По первой и третьей группе находят параметры уравнений регрессии и остатки по ним.

4. Используя данные об остатках моделей первой и третьей группы, рассчитывают фактическое значение F -критерия.

F = SS_E(3) / SS_E(1)

df 1= df 2= k-m-1

Вывод: отношения R будет удовлетворять отношение F-критериев. Чем больше будет величина R превышать табличное значение F-критерия, тем более будет нарушена предпосылка о равенстве дисперсий остаточных величин.

29. Использование коэффициента корреляции рангов Спирмэна для проверки наличия гетероскедастичности в остатках

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

Суть проверки заключается в том, что в случае гетероскедастичности абсолютные остатки коррелированны со значениями фактора.

1. Эту корреляцию можно измерить с помощью коэффициента ранговой корреляции Спирмена:

p = r_{Спирмана} = 1 - (6Σd² / (n * (n²-1)))

где, d – абсолютная разность между рангами значений фактора и остатка.

2. Статистическую значимость можно оценить с помощью t-критерия:

t = r_{Спирмана} * корень из (n-2) / корень из (1- r²_{Спирмана})

3. Сравним эту величину с табличной при кол-ве степеней свободы

df = n – 2.

Вывод: Если это значение больше табличного, то корреляция между остатком и фактором статистически значима, то есть имеет место гетероскедастичность остатков. В противном случае принимается гипотеза об ее отсутствии.

30. Использование тестов Уайта, Парка, Глейзера при анализе гетероскедастичности в остатках

Г. проявляется, если совокупность неоднородна (изучаются разносторонние области).

1. тест Парка:

Этот тест относится к тестам гетероскедастичности (для квадрата остатков). Предполагается, что дисперсия остатков связана со значениями факторов функции ln e² = a + b ln x + u. Данная регрессия строится для каждого фактора в условиях многофакторной модели. Проверяется значимость коэффициента регрессии по критерию Стьюдента. Если коэффициент регрессии для уравнения ln ε²окажется статистически значимым, то существует зависимость ln ε² от ln x, то есть имеет место гетероскедастичность остатков.

2. тест Глейзера:

Тест Глейзера относится к тестам гетероскедастичности и основывается на регрессии абсолютных значений остатков, то есть рассматривается функция | e_i| = a + b*x^c + u. c – какое-либо число, например, c = – 1; – 0,5; 0,5; 1. Регрессия абсолютного значения остатка от фактора х строится при разных значениях параметра с; далее отбирается та функция, для которой коэффициент регрессии b оказывается наиболее значимым, то есть имеет место наибольшее значение критерия Стьюдента или критерия Фишера и детерминации.

3. тест Уайта:

Тест предполагает, что дисперсия ошибок регрессии представляет собой квадратичную функцию от значений факторов, то есть:

e² = a + bx + cx² + u

e² = a + b₁x₁ + b₁x₁² + b₂x₂ + b₂x₂² + u.

Так что модель включает не только значения факторов, но и их квадраты, а также попарные произведения. Поскольку каждый параметр модели e² = f (x)должен быть рассчитан на основе достаточного числа степеней свободы, то чем меньше объем совокупности, тем в меньшей мере квадратичная функция сможет содержать попарные произведения факторов.

31. Применение обобщенного метода наименьших квадратов (ОМНК) для случая гетероскедастичности остатков

Невозможность или нецелесообразность использования традиционного МНК по причине проявляющейся в той или иной степени гетероскедастичности привели к разработке обобщенного метода наименьших квадратов (ОМНК). Фактически при этом корректируется модель, изменяются ее спецификации, преобразуются исходные данные для обеспечения несмещенности, эффективности и состоятельности оценок коэффициентов регрессии.

При нарушении гомоскедастичности и наличии автокорреляции (это статистическая корреляция между случайно распределенными в пространстве переменными одного и того же типа, атрибута, имени и т.д., когда корреляция зависит от расстояния и/или направления между местоположениями) рекомендуют заменять МНК на ОМНК.

Отличие: применяется к преобразованным данным и не только получает несмещенные оценки, но и оценки эти имеют меньшие выборочные дисперсии.

Предполагаем:

-среднее остатков равно нулю,

-гипотеза: их дисперсия уже не является постоянной, она пропорциональна x²

-сама величина дисперсии, входящая общим множителем при этих коэффициентах пропорциональности, неизвестна.

-исходная модель после введения этих коэффициентов в уравнение множественной регрессии продолжает оставаться гетероскедастичной:

y = a + bx + e *корень из(x)

-пусть эти остаточные величины (остатки) не являются автокоррелированными.

1. Введем новые переменные, получающиеся делением исходных переменных модели, зафиксированных в результате i-наблюдения, на корень квадратный из коэффициентов пропорциональности Кi:

y / к.из(x) = (a / к.из(x)) + (bx / к.из(x)) + e

y / к.из(x) = Y

1 / к.из(x) = Z

2. Получим новое уравнение в преобразованных переменных, в котором уже остатки будут гомоскедастичны. Сами новые переменные — это взвешенные исходные переменные:

Y = aZ + b* к. из(x) + e

3. Необходимо минимизировать величину отклонений У; получим систему нормальных уравнений:

Σ (YZ) = a*Σ Z² + b*Σ (z * к.из(x))

Σ Y к.из(x) = a*Σ (Z *к.из(x)) + b*Σ x

4. Определяем коэфф. регрессии b в ОМНК, как взвешенную величину по отношению к обычному МНК с весами 1 / к.из(x). Преобразовываем систему:

Σ (y/x) = a*Σ (1/x) + n*b

Σ y = n*a + b*Σ x

или

y / к.из(x) = a’ / к.из(x) + b’*x / к.из(x) + e

y = a’ + b’*x.

Вывод: Если в модели обнаружена гетероскедастичность, то ее можно устранить с помощью ОМНК. Все зависит от того, насколько точно мы можем оценить дисперсию ошибок наблюдений. Если мы нашли переменные, которые хорошо их описывают, то ОМНК будет работать.

Недостатки (две технические проблемы)

1. в преобразованной регрессии не будет константы, поэтому коэффициент детерминации перестает быть хорошим измерителем качества регрессии.

2. мы делим все переменные в уравнении регрессии на одну и ту же переменную, это может привести к возникновению ложных связей и мультиколлинеарности (тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат).

КРАТКО:

1. Преобразование исходных переменных:

_t’ = y_t – r_b * y_t_-1

x_t’ = x_t – r_b * x_t_-1

2. Применение обычного МНК к уравнению и определение a* и b:

y_t’ = a’ + b*x_t’ + V_t

3. Расчет параметра a:

a = a’ / (1 - r_b )

4. Переход к исходному уравнению:

y_t = a + b*x_t + e_t

32. Мультиколлинеарность факторов – понятие, проявление и меры устранения

Проблемы, возникающие при построении регрессионных моделей:

1. Гетероскедастичность.

2. Мультиколлинеарность.

Мультиколлинеарность — тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат.

Симптомы М.:

1. завышенное значение коэффициента детерминации r²;

2. высокие стандартные ошибки для коэффициентов регрессии b;

3. широкие доверительные интервалы (для b);

4. низкое значение t-критерия;

5. появление при коэффициентах регрессии b знаков, противоположных ожидаемым.

Методы по устранению М.:

1. Удаление из модели переменных с высоким коэффициентом парной корреляции r между факторами, если это не противоречит теории, положенной в основу построения модели.

2. Увеличение числа наблюдений n.

3. Изменение функциональной формы модели.

4. Использование априорной информации.

5. Построение моделей по отклонениям от средней величины.

6. Использование специальных методов обработки временных рядов.

33. Специфика временного ряда как источника данных в эконометрическом моделировании

Временной (динамический) ряд – это ряд последовательно расположенных во времени числовых значений соответствующего показателя

Элементы временного ряда:

1. уровни ряда (y_t)- числовые значения того или иного показателя;

2. время (t).

Виды временных рядов:

1. моментные, если время задано моментами;

2. интервальные, если время задано интервалами.

Модели на основе рядов динамики:

1. Модели изолированного динамического ряда.

2. Модели системы взаимосвязанных рядов динамики.

3. Модели авторегрессии.

4. Модели с распределенным лагом.

Компоненты временного ряда:

1. Тенденция (T) – характеризует воздействие всех факторов на динамику изучаемого показателя.

2. Периодические колебания (P)

3. Случайные колебания (E)

y_t = f (T, P, E)

Графики:

1. Ряд без тенденции и периодических колебаний: y_t = y + E;

2. Ряд с тенденцией: y_t = f (T) + E;

3. Ряд с периодическими и случайными колебаниями y_t = f (P, E);

4. Ряд с тенденцией, периодическими и случайными колебаниями y_t = f (T, P, E).

1 2

3 4
34. Автокорреляция уровней временного ряда и ее последствия

Автокорреляция уровней временного ряда - корреляционная зависимость между последовательными значениями уровней временного.

r_ytyt_-1= (y_ty_t_-1_cp – y_t _cp * y_t_-1_cp) / δ_ytδ_yt_-1

r_ytyt_-1= (Σ(y_t – y_t _cp)* (y_t_-1 - y_t_-1_cp)) / к.из(Σ(y_t – y_t _cp)²*(y_t_-1 - y_t_-1_cp)²)

Последствия:

1. Оценки параметров, оставаясь линейными не смещенными, перестают быть эффективными, они перестают обладать свойствам наилучших линейных несмещенных оценок

2. Дисперсии оценок являются смещенными.

3. Зачастую дисперсии являются заниженными, что привод к увеличению t-статистик. Это может привести к признанию статистически значимыми объясняющие переменные, которые могут ими и не являться.

4. Коэф. регрессии и детерминации м.б. не верными, следовательно ухудшаются прогнозные качества модели.

35. Моделирование тенденции временных рядов

Метод аналитического выравнивания сводится к замене фактических данных сглаженными, определенными по выбранной математической функции. При этом, уровни временного ряда рассматриваются как функция от времени: y_t = f(t)

Этапы построения модели тенденции (уравнения тренда):

1. Выбор математической функции, описывающей тенденцию;

2. Оценка параметров модели;

3. Проверка адекватности выбранной функции и оценка точности модели;

4. Расчет точечного и интервального прогнозов;

Виды математических функций, описывающих тенденцию:

1. Функции с монотонным характером возрастания (убывания) и отсутствием пределов роста (сниж-я);

2. Кривые с насыщением, т. е. устанавливается нижняя или верхняя граница изменения уровней ряда;

3. S -образные кривые, т. е. кривые с насыщением, имеющие точку перегиба.

36. Оценивание параметров в уравнениях тренда

Уравнения трендов:

1. Линейная y = a + bt

2. Гипербола y = a + b/t

3. Парабола второго порядка y = a + bt + ct²

4. Степенная функция y = at^b

5. Показательная функция y = ab^t

6. Экспонента y = e^a⁺^bt

7. Обратная модель y = 1/(a + bx)

8. Логарифмическая y = a + b*lnx

Эконометрическое оценивание моделей включает два основных этапа:

1. Теоретический. Считается, что определена генеральная совокупность. Зная ее статистические свойства, м. теоретически определить параметры модели.

2. Эмпирический. Используются выборочные данные. Можно оценить, но нельзя точно определить значения параметров модели, т.к. они являются случайными величинами.

Параметры - характеристики генеральной совокупности. Оценки - характеристики выборочной совокупности.

Оценка генеральных параметров может быть получена двумя методами:

а) МНК – используется чаще;

б) методом максимального правдоподобия.

Требования к оценкам (свойства):

1. Несмещенность. В среднем оценка соответствует параметру при любом объеме выборки.

2. Эффективность. Несмещенная оценка эффективна, если онаимеет мин. дисперсию по сравнению с другими выборочными оценками. Та из оценок, которая имеет меньшую дисперсию, является более эффективной.

3. Состоятельность. Оценка состоятельна, если при увеличении объема выборки она стремится к оцениваемому параметру. Т.е. х_ср не отличается от µ, когда n → ∞.

Рассмотрим линейный тренд:

t	y = a + bt	∆y = y_t – y_t_-1
1	a + b	-
2	a + 2b	b
3	a + 3b	b
4	a + 4b	b

Можно вывести формулы для нахождения параметров системы:

b = ((y_t*t)_ср- y_t_ср * t_ср) / (t²_ср – t_ср²); а = y_t _cp - b*t_ср.

а - свободный член уравнения регрессии; экономически не интерпретируется.

b - абсолютный показатель силы связи (в лин. ур-ии).Наклон линии регрессии или коэффициент регрессии. Мера зависимости у от х.

Σt = 0; a = Σy / n; b = Σyt / Σt²

Система норм. ур-ий: Σy = na + bΣt

Σyt = aΣt + bΣt²

37. Модели сезонности: аддитивная и мультипликативная

Учет сезонности при построении модели регрессии y = a +bx_t + c₁z₁ + c₂z₂ + c₃z₃:

z1 = 1 – для первого квартала, z1 = 0 – для остальных;

z2 = 1 – для второго квартала, z2 = 0 – для остальных;

z3 = 1 – для третьего квартала, z3 = 0 – для остальных.

Тимы моделей:

1. Аддитивная модель -модель, в которую факторы входят в виде алгебраической суммы; приблизительно равная сезонная вариация указывает на существование аддитивной модели: y_t = T+S+E

2. Мультипликативная модель -модель, в которую факторы входят в виде произведения; усиление сезонной вариации с возрастанием тренда указывает на существование мультипликативной модели: y_t = T*S*E

Построение аддитивной модели:

1. Нахождение сглаж. уравнений динамич. ряда методом скользящих средних

2. Оценка сезонной компоненты и ее корректировка

3. Элиминирование сезонной компоненты из исходных данных временного ряда

4. Построение уравнения линейного тренда по уровням ряда с элиминированием сезонности

5. расчет выровненных значений трендовой составляющей

6. расчет теоретических уровней ряда с учетом сезонности

7. расчет случайной компоненты, позволяющей оценить качество

построенной модели.

Аддит. Мультипл.

Аддитивная. Мультипликативная

38. Исключение тенденции на основе метода отклонений от тренда

Тенденция (T) – характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. e_yt = y_t – y_t_{с крыш}; e_xt = x_t – x_t_{с крыш}

e_yt = a – b*e_xt

2. (y_t – y_t _с _крыш) = a + b*(x_t - x_t _с _крыш)

y_t = y_t_{с крыш} + a + b*(x_t - x_t_{с крыш})

y_p = y_t₌_p_{с крыш} + a + b*(x_p – x_t₌_p_{с крыш})

y_p - прогнозное значение у;

y_t₌_p_{с крыш} - прогноз у по тренду при t=p;

x_p - прогнозное значение х;

x_t₌_p_{с крыш} - прогноз х исходя из уравнения тренда при t=p.

39. Исключение тенденции на основе метода последовательных разностей

Тенденция (T) – характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. ∆_yt = y_t – y_t_-1; ∆_xt = x_t – x_t_-1

∆_yt = a + b * ∆_xt

2. (y_t – y_t-1) = a + b*(x_t - x_t-1)

y_t = y_t-1+ a + b*(x_t - x_t-1)

y_p = y_n + a + b*(x_p – x_n)

y_p - прогнозное значение уровня ряда y_t;

y_n – конечный уровень динамического ряда y_t;

x_p - прогнозное значение уровня ряда х_t;

x_n - конечный уровень динамического ряда х_t.

40. Исключение тенденции на основе включения в модель регрессии по временным рядам фактора времени

Тенденция (T) – характеризует воздействие всех факторов на динамику изучаемого показателя.

Существует 3 метода исключения тенденции:

- Метод отклонений от тренда;

- Метод последовательных разностей;

- Включение в модель регрессии по временным рядам фактора времени.

1. y_t = a + b*x_t + c*t

y_t = a + b₁x₁ + b₂x₂ + b₃x₃ + c*t

2. P = aK^b1L^b2E^ct

lnP = lna + b₁ lnK + b₂ lnL +ct

y_t = a + bx₁ + ct + dt²

41. Автокорреляция в остатках. Критерий Дарбина-Уотсона в оценке качества уравнений, построенных по временным рядам

Автокорреляция в остатках - корреляционная зависимость. Это проблема. Последовательность остатков м. рассматриваться как временной ряд – возникает возможность построения зависимости последовательности остатков от времени. Остатки должны быть случайными (из МНК).

Причины А. остатков:

1. Связана с исходными данными и вызвана ошибками измерения в значениях результативного признака. Т,к. часто остатки содержат циклические колебания – каждое следующее значение остатков зависит от предшествующих.

2. Из-за недостатков формулировки модели.

а. м. отсутствовать фактор, оказывающий существенное воздействие на результат, влияние которого отражается в остатках. Помимо фактора времени – лаговые значения переменных (переменная появляется в модели с запозданием на неск. периодов; учитывающая запаздывание), включенных в модель.

б. м.б., чт о модель не учитывает несколько второстепенных по отдельности факторов, совместное влияние которых на результат уже оказывается существенным. Эта значимость проистекает в силу совпадения тенденций их изменения или фаз циклических колебаний.

r _ab = ((e_te_t_-1)_cp – e_t _cp * e_t_-1_cp) / δ_etδ_et_-1

d = Σ (e_t - e_t_-1)² / Σe_t²

d = 2 * (1-r _ab) -(приблизительно); d = [0; 4]

Алгоритм выявления автокорреляции остатков на основе критерия Дарбина — Уотсона:

1. выдвигается гипотеза об отсутствии автокорреляции остатков;

2. альтернативные гипотезы состоят в наличии положительной или отрицательной автокорреляции в остатках;

3. затем по специальным таблицам определяются критические значения критерия Дарбина — Уотсона для заданного числа наблюдений, числа независимых переменных модели и уровня значимости;

4. по этим значениям числовой промежуток разбивают на пять отрезков. (2 из этих отрезков образуют зону неопределенности; 3 - нет оснований отклонять гипотезу об отсутствии автокорреляции, есть положительная автокорреляция, есть отрицательная автокорреляция. При попадании в зону неопределенности практически считают, что имеется автокорреляция остатков, и поэтому отклоняют гипотезу о ее отсутствии).

42. Обобщенный метода наименьших квадратов (ОМНК) при построении модели регрессии по временным рядам

Порядок действий:

1. Преобразование исходных переменных:

y_t’ = y_t – r_b * y_t-1

x_t’ = x_t – r_b * x_t-1

2. Применение обычного МНК к уравнению и определение a* и b:

y_t’ = a’ + b*x_t’ + V_t

3. Расчет параметра a:

a = a’ / (1 - r_b )

4. Переход к исходному уравнению:

y_t = a + b*x_t + e_t

Недостатки (две технические проблемы)

Последовательность формул:

1. y_t = a + b*x_t + e_t

y_t-1 = a + b*x_t-1+ e_t-1

e_t = c + d *e_t-1 + V_t

d = ((e_te_t-1)_cp – e_{t cp} * e_{t-1 cp}) / (e²_t-1cp – (e_{t-1 cp})²)

2. e_t = r*e_t-1 + V_t

y_t = a + b*x_t + r*e_t-1 + V_t

y_t-1 = a + b*x_t-1+ r*e_t-1 + V_t

r_b*y_t-1 = r_b*a + r_b*b*x_t-1+ r_b *e_t-1

3. y_t - r_b*y_t-1 = a - r_b*a + r_b*b*x_t-1+ e_t- r_b *e_t-1

y_t - r_b*y_t-1 = a(1 - r_b) + b(x_t - r_b*x_t-1) + (e_t- r_b *e_t-1)

y_t’ = a’ + b*x_t’ + V_t

43. Прогнозирование на основе рядов динамики

Элементы временного ряда:

1. уровни ряда (y_t)- числовые значения того или иного показателя;

2. время (t).

Виды временных рядов:

1. моментные, если время задано моментами;

2. интервальные, если время задано интервалами.

Компоненты временного ряда:

1. Тенденция (T) – характеризует воздействие всех факторов на динамику изучаемого показателя.

2. Периодические колебания (P)

3. Случайные колебания (E)

y_t = f (T, P, E)

Статистический прогноз – вероятностная оценка возможностей развития объекта (процесса) и величины его признаков в будущем, полученная на основе статистической закономерности, выявленной по данным прошлого периода.

Назначение: а. планирование управления объекта; б. выработка стратегии поведения субъекта (если объект не управляем).

!!! Статистический прогноз предполагает не только верное качественное предсказание, но и достаточно точное количественное измерение вероятных возможностей ожидаемых значений признаков. Необходимо, чтобы прогностическая модель имела достаточную точность или допустимо малую ошибку прогноза.

Область применения – большое значения изучения трендов и колеблемости: а. в социально-экономических науках;

б. в процессе практического планирования и управления производством. Прогноз выражается в виде:

1. Точечный. Оценка прогнозируемого показателя в точке (в конкретном году, месяце, дне, середине периода прогноза) по уравнению, описывающему тенденцию показателя. Рассчитывается путем подстановки номера года, на который рассчитывается прогноз, в уравнение тренда. Она является средней оценкой для прогнозного интервала времени. Точечный прогноз указывает ту величину урожайности, на которую в среднем выйдет объект на прогнозируемый год, если тенденция динамики урожайности сохранится. Эту величину можно использовать в планирование.

2. Интервальный. По типу прогнозируемого показателя распадается на 3 вида:

- прогноз вероятных границ тренда;

- прогноз вероятных границ уровней отдельных лет с учетом их возможной -колеблемости относительно тренда;

- прогноз вероятных границ среднегодовых уровней динамического ряда.

Ур-ие тренда: y = a + bt; t – количество периодов до планового включительно.

44. Общая характеристика моделей с распределенным лагом и моделей авторегрессии

I. Лаговая переменная - переменная появляется в модели с запозданием на неск. периодов; учитывающая запаздывание.

Виды моделей:

1. модели с распределенными лагами(с лаговыми объясняющими переменными):

y_t = a + b₀x_t + b₁x_t_-1+ … + e_t

2. модели авторегрессии (с лаговыми зависимыми переменными):

y_t = a + bx_t + c₁x_t-1+ c₂x_t-2+ … + e_t

3. авторегрессионные модели с распределенными лагами (модели с лаговыми зависимыми и независимыми переменными):

y_t = a + b₁y_t-1 + … + b_kу_t-k+ c₀x_t + c₁x_t-1+ c₂x_t-2+ … + e_t

Модели с распределенными лагами:

1. с конечным числом лагов: y_t = a + b₀х_t + b₁x_t_-1+ … + b_кx_t_-к + + e_t

2. с бесконечным числом лагов: y_t = a + b₀х_t + b₁x_t_-1+ b₂x_t_-2+ … + e_t

Пример: y_t_{с крыш}= a + b₀x_t + b₁x_t_-1+ b₂x_t_-2+ b₃x_t_-3+ b₄x_t_-4

Вывод: данная модель означает, что изменение во времени t объясняющей переменный x будет влиять на значения результативного признака y в течение 4-х следующих моментов времени.

II. Авторегрессия - применяемая в эконометрике модель для отыскания зависимости дисперсии текущей ошибки от квадратов ошибок модели для предшествующих наблюдений.

y_t = a + b₀x_t + n₁y_t_-1+ e_t

- параметр b₀ характеризует краткосрочное изменение y_t под воздействием изменения x_t на 1 единицу.

- долгосрочный мультипликатор изменения y: b = b₀ / (1 – c₁)

45. Интерпретация параметров моделей с распределенным лагом и моделей авторегрессии

Модели с распределенными лагами:

1. с конечным числом лагов: y_t = a + b₀х_t + b₁x_t_-1+ … + b_кx_t_-к + + e_t

2. с бесконечным числом лагов: y_t = a + b₀х_t + b₁x_t_-1+ b₂x_t_-2+ … + e_t

Пример: y_t_{с крыш}= a + b₀x_t + b₁x_t_-1+ b₂x_t_-2+ b₃x_t_-3+ b₄x_t_-4

Параметры:

1. Краткосрочный мультипликатор. Коэффициент b₀. Он характеризует среднее изменение результата y при изменении на 1 единицу своего измерения в фиксированный момент времени t.

2. Промежуточные мультипл-ры. В момент времени t+1воздействие объясняющей переменной x на результат y составит (b₀+b₁) единиц, а в момент времени t+2 общее изменение y составит (b₀+b₁+b₂) единиц.

- b₀+b₁ - изменение y в момент времени t+1;

- b₀+b₁+b₂ - изменение y в момент времени t+2.

3. Долгосрочный мультипл-р. При k =4 долгосрочный мультипликатор составит b₀+b₁+b₂+b₃+b₄. Он характеризует общее среднее изменение y через 4 временных интервала при увеличении x в момент времени t на 1 единицу

- Σb_i

4. Относительные коэффициенты модели. Характеризует долю общего изменения y в момент времени t+i.

ß_i = b_i/ Σb_i; Σb_i= 1; b_i = [0; 1]

5. Средняя величина лага. Показывает средний интервал времени, в течение которого будет происходить изменение зависимой переменной y под воздействием изменения объясняющей переменной x в момент времени t.

Чем меньше величина среднего лага, тем быстрее реагирует результат y на изменение x. И наоборот, высокое значение среднего лага показывает, что воздействие объясняющей переменной на результат будет сказываться с течением длительного промежутка времени.

i _ср = Σ(i * ß_i)

6. Медианный лаг. Тот период времени, в течение которого с момента времени t будет реализована половина общего эффекта воздействия объясняющей переменной x на результат y.

Σß_i = 0,5

y_t = a + b₀x_t + n₁y_t_-1+ e_t

- параметр b₀ характеризует краткосрочное изменение y_t под воздействием изменения x_t на 1 единицу.

- долгосрочный мультипликатор изменения y: b = b₀ / (1 – c₁)

46. Применение фиктивных переменных для моделирования сезонных колебаний

Фиктивная (структурная) переменная – переменная, принимающая значение 1 или 0. Их количество д.б на 1 меньше, чем количество моментов времени за 1 цикл колебания.

Используется при решении следующих задач:

1. при моделировании качественных признаков;

2. для учета структурной неоднородности, к которой приводят качественные признаки;

3. для оценки сезонных колебаний.

Каждая фиктивная переменная отражает сезонную компоненту временного ряда для 1 периода. Она = 1 для 1 периода и = 0 для всех остальных.

Рассмотрим временной ряд, содержащий циклический колебания периодичностью К:

y_t = a + bt + c₁x₁+ … + c_jx_j + … + c_k_-1x_k_-1 + e_t

где х _j = 1 для j внутри цикла и х = 0 для остальных.

Для моделирования сезонных колебаний на основе поквартальных данных за несколько лет, число кварталов = К = 4, общий вид модели:

y_t = a + bt + c₁x₁+ c₂x₂ + c₃x₃+ e_t

где х₁ = 1 для 1 квартала и х = 0 для остальных; х₂ = 1 для 2 квартала и 0 для остальных; ….

Уравнение тренда для каждого квартала будет:

1. y_t = a + bt + c₁ + e_t

2. y_t = a + bt + c₂ + e_t

3. y_t = a + bt + c₃ + e_t

4. y_t = a + bt + e_t

Т.о. фиктивный переменные позволяют дифференцировать величину свободного члена уравнения регрессии для каждого квартала:

1. a + c₁

2. a + c₂

3. a + c₃

4. a

Параметр b характеризует среднее абсолютное изменение уровней ряда под воздействием тенденции. Это аналог аддитивной модели, т.к. фактический уровень врем. ряда – сумма трендовой, сезонной и случ. компонент.

Тенденция (T) – характеризует воздействие всех факторов на динамику изучаемого показателя.

47. Общее понятие о системах уравнений, используемых в эконометрике

Объект стат. изучения – сложные системы. Отдельное ур-ие не может характеризовать влияние признака на вариацию полностью. Поэтому используем систему уравнений, чтобы лучше описать структуру связей между переменными.

1. Система независимых уравнений (зависимая переменная у рассматривается как функция одного и того же набора факторов х):

y₁ = a₀₁+ a₁₁x₁ + a₁₂x₂ + a₁₃x₃ + e₁

y₂ = a₀₂+ a₂₁x₁ + a₂₂x₂ + a₂₃x₃ + e₂

y₃ = a₀₃+ a₃₁x₁ + a₃₂x₂ + a₃₃x₃ + e₃

2. Система рекурсивных уравнений (если зависимая переменная у одного ур-ия выступает в виде фактора х в другом уравнении):

y₁ = a₀₁+ a₁₁x₁ + a₁₂x₂ + a₁₃x₃ + e₁

y₂ = a₀₂+ b₂₁y₁ + a₂₂x₂ + e₂

y₃ = a₀₃+ b₃₁y₁ + b₃₂y₂ + a₃₄x₄ + a₃₅x₅ + e₃

3. Система взаимозависимых уравнений (одни и те же зависимые переменные входят в левую часть, в других уравнениях – в правую):

y₁ = a₀₁+ b₁₂y₂ + a₁₁x₁ + a₁₂x₂ + e₁

y₂ = a₀₂+ b₂₁y₁ + b₂₃y₃ + a₂₃x₃ + e₂

y₃ = a₀₃+ b₃₂y₂ + a₃₃x₃ + e₃

а. Статистическая модель Кейнса для описания народного хозяйства страны в наиболее простом варианте (С – личное потребление, у – национальный доход, I – инвестиции (все в постоянных ценах)):

С = α + ßy + e

Y = C + I

б. Модель цены и зарплаты:

w = a₁ + b₁₁UN + b₁₂P + e₁

p = a₂+ b₂₁w + b₂₂R + b₂₃M + e₂

w – зарплата; UN – уровень безработицы; P – темп уровня цен; R – темп изменения постоянного капитала; M – темп изменения цен на импортируемое сырье.

48. Виды переменных в системах взаимозависимых уравнений

Система взаимозависимых (одновременных) уравнений:

y₁ = a₀₁+ b₁₂y₂ + a₁₁x₁ + a₁₂x₂ + e₁

y₂ = a₀₂+ b₂₁y₁ + b₂₃y₃ + a₂₃x₃ + e₂

y₃ = a₀₃+ b₃₂y₂ + a₃₃x₃ + e₃

Зависимая переменная одного уравнения может появляться одновременно в виде переменной (но уже в качестве независимой) в одном или нескольких других уравнениях. Поэтому теряет смысл традиционное различение зависимых и независимых переменных. Устанавливается различие между двумя видами переменных:

1. совместно зависимые переменные (эндогенные), влияние которых друг на друга должно быть исследовано;

2. предопределенные переменные - оказывают влияние на первые, однако не испытывают их воздействия:

а. то переменные с запаздыванием (лаговые);

б. определенные вне данной системы уравнений экзогенные переменные.
Примеры:

Экзогенные - показатели климатических условий, если они включаются в модель.

Экономические переменные в зависимости от задач и структуры модели могут относиться и к эндогенным, и к экзогенным.

!!! В зависимости от характера переменных, эконометрические модели классифицируются на линейные модели с одной, двумя и большим числом переменных, а также на пробит-модели, логит-модели, тобит-модели.

49. Структурная и приведенная формы модели.

Структурная:

y₁ = a₀₁+ b₁₂y₂ + a₁₁x₁ + a₁₂x₂ + e₁

y₂ = a₀₂+ b₂₁y₁ + b₂₃y₃ + a₂₃x₃ + e₂

y₃ = a₀₃+ b₃₂y₂ + a₃₃x₃ + e₃

Приведенная:

y₁ = А₁+ В₁₁x₁ + В₁₂x₂ + В₁₃x₃ + V₁

y₂ = A₂+ B₂₁x₁ + B₂₂x₂ + B₂₃x₃ + V₂

y₃ = A₃+ B₃₁x₁ + B₃₂x₂ + B₃₃x₃ + V₃

а. для модели Кейнса (равновесие спроса и предложения):

С = А₁ + В₁I + V₁

Y = A₂+ B₂I + V₂

б. для модели цены и зарплаты:

w = A₁ + B₁₁UN + B₁₂R + B₁₃M + V₁

p = A₂ + B₂₁UN + B₂₂R + B₂₃M + V₂

Особенности приведенной формы:

1. в правой части модели используется только предопределенные переменные, следовательно расчет параметров может быть произведен с помощью обычного МНК;

2. существует определенное соотношение между коэффициентами структурной формы и приведенной формы (приведенные коэффициенты – нелинейные соотношения коэффициентов структурной моделей).

Связь между структурными приведенными коэффициентами (в модели Кейнса):

Модель Кейнса: С = α + ßy + e

Y = C + I

- С = α + ß(С +I) + e

C – ßС = α + ßI + e

C = α /(1-ß) + ßI/(1-ß) + e /(1-ß)

- A = α /(1-ß); B₁₁= ßI/(1-ß); V₁ = e /(1-ß)

- C = A₁ +B₁₁I + V₁

- y = y /(1-ß) + I/(1-ß) + e /(1-ß)

y = A₂ +B₂₁I + V₂

50. Проблема идентификации Необходимое условие идентификации (порядковое или счетное правило)

Структурная:

y₁ = a₀₁+ b₁₂y₂ + a₁₁x₁ + a₁₂x₂ + e₁

y₂ = a₀₂+ b₂₁y₁ + b₂₃y₃ + a₂₃x₃ + e₂

y₃ = a₀₃+ b₃₂y₂ + a₃₃x₃ + e₃

Приведенная:

y₁ = А₁+ В₁₁x₁ + В₁₂x₂ + В₁₃x₃ + V₁

y₂ = A₂+ B₂₁x₁ + B₂₂x₂ + B₂₃x₃ + V₂

y₃ = A₃+ B₃₁x₁ + B₃₂x₂ + B₃₃x₃ + V₃

Идентификация модели – соответствие между приведенной и структурной формами модели, позволяющее однозначно оценить структурные коэффициенты по приведенным коэффициентам модели.

Случаи идентификации:

1. Модель идентифицируема, если число коэффициентов структурной модели равно числу коэффициентов приведенной модели и структурные коэффициенты однозначно определяются по приведенным коэффициентам.

2. Модель неидентифицируема, если число структурных коэффициентов больше числа приведенных коэффициентов. Модели, в которых в каждом уравнении системы участвуют все эндогенные и экзогенные переменные, имеющиеся в системе, всегда неидентифицируемы.

3. Модель сверхидентифицируема, если число приведенных коэффициентов превышает число структурных коэффициентов. В результате на основе коэффициентов приведенной модели можно получить несколько значений одного структурн

Подборка статей по вашей теме: