До сих пор в качестве факторов рассматривались экономические переменные принимающие количественные значения в некотором интервале.
Вместе с тем, может оказаться необходимым включить в модель фактор, имеющий 2 или более качественных уровня.
Это могут быть разного рода атрибутивные признаки, такие, например, как професссия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качествен?????????????????
Рассмотрим применение фиктивных переменных для функций спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены.
В общем виде для совокупности обследуемых уравнение регрессии имеет вид:
Y = a+bx+ϵ, где y – количество потребляемого кофе, x – цена.
Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: y1 = a1+b1x1+ϵ1
И женского пола: y2 = a2+b2x2+ϵ2.
Различия в потреблении кофе проявятся в различии средних y1 с чертой и y2 с чертой. Вместе с тем, сила влияния x на y может быть одинаковой, т.е. b = b1 = b2. В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной.
|
|
Объединяя уравнения y1 и y2 и, вводя фиктивные переменные, можно прийти к следующему выражению:
Y = a1z1 +a2z2+ bx+ ϵ, где z1 и z2 – фиктивные переменные, принимающие значения:
Z1 = 1 – мужской пол; 0 – женский пол;
Z2 = 0 – мужской пол; 1 – женский пол.??????????????
Для лиц мужского пола, когда z1 = 1 и z2 = 0, объединенное уравнение регрессии составит: y = a1 + bx1,
Для лиц женского пола, когда z1 = 0 и z2 = 1: y = a2+bx.
Различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии a1 ≠ a2.
Параметр b является общим для всей совокупности лиц, как для мужчин, так и для женщин.
При введении 2 фиктивных переменных z1 и z2 в модель y = a1z1 + a2z2 + bx + ϵ применение МНК для оценивания параметров a1 и a2 приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок.
Объясняется это тем, что при использовании VYR в данном уравнении появляется свободный член, т.е. уравнение примет вид: y = A + a1z1 + a2z2 + bx + ϵ.
Поэтому переходим к уравнениям:
Y = A+A1z1 + bx+ϵ
Или
Y = A+A2z2 + bx+ϵ,
Т.е., каждое уравнение включает только 1 фиктивную переменную z1 или z2.
Предположим, что определено уравнение:
Y = A+A1z1 + bx+ϵ
Где z1 принимает значения 1 для мужчин и 0 для женщин.
Пример:
Проанализируем зависимость цены двухкомнатной квартиры от её полезной площади. При этом, в модель, могут быть введены фиктивные переменные, отражающие тип дома: «хрущевка», панельный, кирпичный.
|
|
При использовании 3 категорий домов вводятся 2 фиктивные переменные: z1 и z2.
Z1 примет значение 1 – для панельных домов; 0 – для кирпичных и для «хрущёвки».
Z2 примет значение 0 –для панельных домов и «хрущёвки»; 1 – для кирпичных.
Предположим, что уравнение регрессии с фиктивными переменными составило:
Y = 300 + 500x + 2200z1 + 1600z2.
Частные уравнения регрессии для отдельных типов домов:
«хрущевка» - y = 320+500x;
Панельные – y = 2520+500x;
Кирпичные – y = 1920+500x.