Спецификация регрессионной модели. Ошибки спецификации модели – включение незначимых и невключение значимых переменных. Замещающие переменные

 

Возможные ошибки спецификации регрессионной модели:

- Невключение значимых переменных

- Включение незначимых переменных

Невключение значимых переменных

• (–) Смещенность оценок коэффициентов регрессии

• (–) Смещенность оценки дисперсии ошибок регрессии

• (+) Меньшая вариация оценок коэффициентов регрессии

Включение незначимых переменных

• (+) Несмещенность оценок коэффициентов регрессии

• (+) Несмещенность оценки дисперсии ошибок регрессии

• (–) Большая вариация оценок коэффициентов регрессии

Замещающие переменные, причины:

1. Необходимость показателя не была учтена при составлении выборки

2. Переменная трудноизмерима (например, уровень образования)

3. Сбор данных о переменной x1 требует значительных затрат

При оценивании модели без переменной x1 полученные оценки будут смешенными.

Последствия использования замещающих переменных:

1. Оценки коэффициентов при переменных x2,…, xk становятся несмещенными

2. Стандартные ошибки и t-статистики коэффициентов te ze

3. R2 имеет такое же значение, как и при оценивании с переменной x1

4. Коэффициент β1 нельзя оценить (оценивается только β1δ1), но его стандартная ошибка и t-статистика позволяет оценить значимость x1

5. Получить оценку свободного члена модели невозможно (но она часто и не особенно важна) последствия справедливы приблизительно

 

Мультиколлениарность в регрессионной модели: понятие, причины, последствия

 

Мультиколлинеарность — это понятие, которое используется для описания проблемы, когда нестрогая линейная зависимость между объясняющими переменными приводит к получению ненадежных оценок регрессии. Оценка любой регрессии будет страдать от нее в определенной степени, если только все независимые переменные не окажутся абсолютно некоррелированными.

Различные методы, которые могут быть использованы для смягчения мультиколлинеарности, делятся на две категории: к первой категории относятся попытки повысить степень выполнения четырех условий, обеспечивающих надежность оценок регрессии; ко второй категории относится использование внешней информации, но можно привнести или усилить автокорреляцию, но она может быть нейтрализована. Кроме того, можно привнести (или усилить) смещение, вызванное ошибками измерения, если поквартальные данные измерены с меньшей точностью, чем соответствующие ежегодные данные.

 

Включение качественных признаков с регрессионную модель: фиктивные переменные, множественные фиктивные переменные, перекрестные фиктивные переменные

 

Качественные факторы включаются в эконометрические модели с помощью фиктивных переменных. Под фиктивной переменной понимают переменную, которая равна 1 для конкретной части выборочной совокупности, и 0 - для оставшейся части.

Переменные, полученные путем перемножения с фиктивными, обычно называют перекрестными фиктивными переменными.

Множественные фиктивные переменные – фиктивные переменные, которые принима.т не 2, а более значений.

Достаточно часто качественные объясняющие переменные принимают не два, а несколько (m) значений.

 

Прогнозирование с помощью регрессионной модели. Точечный и интервальный прогнозы

 

Прогноз получают путем подстановки в регрессионное уравнение Y = a0 + a1x.

Здесь a0, a1 — параметры, которые оцениваются из статистических данных. Они называются коэффициентами регрессии.

В случае же совместного влияния на Y нескольких факторов (x1, x2,..., xn) уравнение принимает вид

 

Y = a0 + a1x1 +... + anxn.

 

В первом случае имеем парную Р., во втором — множественную) переменных. Результат представляет собой оценку среднего значения зависимой переменной при данных уровнях фактор-аргументов. Для уравнения регрессии обычно определяют доверительные интервалы, которые также можно использовать в прогнозировании.

точечный прогноз — прогноз, которым указывается единственное значение прогнозируемого показателя. Конкретное значение.

интервальный прогноз — прогноз, которым указывается не единственное значение прогнозируемого показателя (или вектор значений), а некоторый интервал. Пример И. п.: “Население города N. составит в 2000 г. от 30 до 35 тыс. человек”.

 

Нарушение условия гомоскедастичности: гетероскедастичность, автокорреляция

 

Гетероскедастичность и автокорреляция это нарушения условия гомоскедастичности (второго и третьего условия Гаусса-Маркова). Обычно рассматривают два варианта нарушения условия гомоскедастичности:

1. Ошибки имеют различную дисперсию для различных наблюдений - Гетероскедастичность. Гетероскедастичность – «неодинаковый разброс» теоретическое распределение случайного члена является разным для различных наблюдений в выборке

Например, если рассматривать зависимость расходов на отдых от заработной платы, то логично предполагать, что разброс будет выше для более обеспеченных людей.

2. Ошибки имеют постоянную дисперсию, но неявляются независимыми Данное явление носит название автокорреляции

Общий случай простое преобразования для того, чтобы добиться гомоскедастичности В общем случае:

1. Рассчитывают МНК-оценки коэффициентов регрессии

2. Находят остатки ei и их квадраты ei2

3. Находят логарифмы квадратов остатков ln(ei2)

4. Рассчитывают регрессию ln(ei2)

5. Получают прогноз ln(ei2)прог

6. Находят веса наблюдений wi= exp(ln(ei2)прог)

7. Полученные веса wi используют во взвешенном методе наименьших квадратов

Последствия гетероскедастичности и автокорреляции приводит к неэффективности получаемых коэфициентов регресии (но они остаются несмещенны) и к неправильному расчету наблюдаемых t и F-статистик.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: