Фиктивные переменные

Частный случай качественных переменных – фиктивные переменные, принимающие бинарное значение: 0 или 1 (0 – не признака, 1 – есть).

В общем случае при использовании фиктивных переменных необходимо соблюдать следующее правило: если каждый качественный признак имеет k градаций, то вводят (k-1) фиктивную переменную, т.е. в модель вводится не одна переменная, принимающая столько значений, сколько имеет градаций качественный признак, а вводится несколько бинарных фиктивных переменных для каждой градаций качественного признака.

Основная причина этого – то, что полученные коэффициенты регрессии легко можно интерпретировать и определить влияние того или иного признака на зависимую переменную.

Также с помощью фиктивных переменных можно моделировать наличие изменений в исходных данных (т.е. есть ли излом тенденции). В этом случае, если излом тенденции происходит на i-том наблюдении, то вводится фиктивная переменная, принимающая значение “0” с 1 наблюдения до i-го, а с i-го до последнего – “1”

y=a+b1x1+b2x2, где

x1 – независимая переменная

x2 – фиктивная переменная

Также фиктивные переменные применяются для моделирования сезонности во временных рядах.

До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может оказаться необходимым включить в модель фактор, имеющий два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т.е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными.

Рассмотрим применение фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для всех исследуемых данных уравнение регрессии имеет вид:

где

у - количество потребляемого кофе;

х — цена кофе.

Аналогичные уравнения находятся отдельно для лиц мужского пола:

и женского пола:

Разница в потреблении кофе проявятся в различии средних y1 и y2. Вместе с тем сила влияния х на у может быть одинаковой. В этом случае можно построить общее уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединяя уравнения y1 и y2 и вводя фиктивные переменные, можно прийти к следующему выражению:

где z1 и z2 - фиктивные переменные, принимают значения:
z1 = 1 – мужской пол, 0 – женский пол.
z2 = 0 – мужской пол, 1 – женский пол.

В общем уравнении регрессии переменная у рассматривается как функция не только цены х, но также и пола (z1, z2). Переменная z рассматривается как дихотомическая переменная, которая принимает всего два значения: 1 и 0. При этом когда z1 = 1, то z2 = 0 и наоборот.

Для лиц мужского пола, когда z1 = 1 и z2 = 0, объединенное уравнение регрессии составит:

Для лиц женского пола, когда z1 = 0 и z2 = 1


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: