Регрессионные модели с переменной структурой (фиктивные переменные)

До сих пор в качестве факторов рассматривались экономические переменные принимающие количественные значения в некотором интервале.

Вместе с тем, может оказаться необходимым включить в модель фактор, имеющий 2 или более качественных уровня.

Это могут быть разного рода атрибутивные признаки, такие, например, как професссия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качествен?????????????????

Рассмотрим применение фиктивных переменных для функций спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены.

В общем виде для совокупности обследуемых уравнение регрессии имеет вид:

Y = a+bx+ϵ, где y – количество потребляемого кофе, x – цена.

Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: y1 = a1+b1x11

И женского пола: y2 = a2+b2x22.

Различия в потреблении кофе проявятся в различии средних y1 с чертой и y2 с чертой. Вместе с тем, сила влияния x на y может быть одинаковой, т.е. b = b1 = b2. В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной.

Объединяя уравнения y1 и y2 и, вводя фиктивные переменные, можно прийти к следующему выражению:

Y = a1z1 +a2z2+ bx+ ϵ, где z1 и z2 – фиктивные переменные, принимающие значения:

Z1 = 1 – мужской пол; 0 – женский пол;

Z2 = 0 – мужской пол; 1 – женский пол.??????????????

Для лиц мужского пола, когда z1 = 1 и z2 = 0, объединенное уравнение регрессии составит: y = a1 + bx1,

Для лиц женского пола, когда z1 = 0 и z2 = 1: y = a2+bx.

Различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии a1 ≠ a2.

Параметр b является общим для всей совокупности лиц, как для мужчин, так и для женщин.

При введении 2 фиктивных переменных z1 и z2 в модель y = a1z1 + a2z2 + bx + ϵ применение МНК для оценивания параметров a1 и a2 приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок.

Объясняется это тем, что при использовании VYR в данном уравнении появляется свободный член, т.е. уравнение примет вид: y = A + a1z1 + a2z2 + bx + ϵ.

Поэтому переходим к уравнениям:

Y = A+A1z1 + bx+ϵ

Или

Y = A+A2z2 + bx+ϵ,

Т.е., каждое уравнение включает только 1 фиктивную переменную z1 или z2.

Предположим, что определено уравнение:

Y = A+A1z1 + bx+ϵ

Где z1 принимает значения 1 для мужчин и 0 для женщин.

Пример:

Проанализируем зависимость цены двухкомнатной квартиры от её полезной площади. При этом, в модель, могут быть введены фиктивные переменные, отражающие тип дома: «хрущевка», панельный, кирпичный.

При использовании 3 категорий домов вводятся 2 фиктивные переменные: z1 и z2.

Z1 примет значение 1 – для панельных домов; 0 – для кирпичных и для «хрущёвки».

Z2 примет значение 0 –для панельных домов и «хрущёвки»; 1 – для кирпичных.

Предположим, что уравнение регрессии с фиктивными переменными составило:

Y = 300 + 500x + 2200z1 + 1600z2.

Частные уравнения регрессии для отдельных типов домов:

«хрущевка» - y = 320+500x;

Панельные – y = 2520+500x;

Кирпичные – y = 1920+500x.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: