Регрессионные модели с переменной структурой (фиктивные переменные)

До сих пор в качестве факторов рассматривались экономические переменные принимающие количественные значения в некотором интервале.

Вместе с тем, может оказаться необходимым включить в модель фактор, имеющий 2 или более качественных уровня.

Это могут быть разного рода атрибутивные признаки, такие, например, как професссия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качествен?????????????????

Рассмотрим применение фиктивных переменных для функций спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены.

В общем виде для совокупности обследуемых уравнение регрессии имеет вид:

Y = a+bx+ϵ, где y – количество потребляемого кофе, x – цена.

Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: y₁ = a₁+b₁x₁+ϵ₁

И женского пола: y₂= a₂+b₂x₂+ϵ₂.

Различия в потреблении кофе проявятся в различии средних y₁с чертой и y₂ с чертой. Вместе с тем, сила влияния x на y может быть одинаковой, т.е. b = b₁ = b₂. В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной.

Объединяя уравнения y₁ и y₂ и, вводя фиктивные переменные, можно прийти к следующему выражению:

Y = a₁z₁ +a₂z₂+ bx+ ϵ, где z₁ и z₂ – фиктивные переменные, принимающие значения:

Z₁= 1 – мужской пол; 0 – женский пол;

Z₂= 0 – мужской пол; 1 – женский пол.??????????????

Для лиц мужского пола, когда z₁ = 1 и z₂ = 0, объединенное уравнение регрессии составит: y = a₁ + bx₁,

Для лиц женского пола, когда z₁ = 0 и z₂ = 1: y = a₂+bx.

Различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии a₁ ≠ a_2.

Параметр b является общим для всей совокупности лиц, как для мужчин, так и для женщин.

При введении 2 фиктивных переменных z₁ и z₂ в модель y = a₁z₁ + a₂z₂+ bx + ϵ применение МНК для оценивания параметров a₁ и a₂ приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок.

Объясняется это тем, что при использовании VYR в данном уравнении появляется свободный член, т.е. уравнение примет вид: y = A + a₁z₁+ a₂z₂ + bx + ϵ.

Поэтому переходим к уравнениям:

Y = A+A₁z₁ + bx+ϵ

Или

Y = A+A₂z₂ + bx+ϵ,

Т.е., каждое уравнение включает только 1 фиктивную переменную z₁или z₂.

Предположим, что определено уравнение:

Y = A+A₁z₁ + bx+ϵ

Где z₁ принимает значения 1 для мужчин и 0 для женщин.

Пример:

Проанализируем зависимость цены двухкомнатной квартиры от её полезной площади. При этом, в модель, могут быть введены фиктивные переменные, отражающие тип дома: «хрущевка», панельный, кирпичный.

При использовании 3 категорий домов вводятся 2 фиктивные переменные: z₁ и z₂.

Z₁примет значение 1 – для панельных домов; 0 – для кирпичных и для «хрущёвки».

Z₂примет значение 0 –для панельных домов и «хрущёвки»; 1 – для кирпичных.

Предположим, что уравнение регрессии с фиктивными переменными составило:

Y = 300 + 500x + 2200z₁ + 1600z₂.

Частные уравнения регрессии для отдельных типов домов:

«хрущевка» - y = 320+500x;

Панельные – y = 2520+500x;

Кирпичные – y = 1920+500x.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: