Использование фиктивных переменных в регрессионных моделях

Фиктивная переменая (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учета влияния качественных признаков и событий на объясняемую переменную. При этом фиктивные переменные позволяют учесть влияние не только качественных признаков принимающих два, но и несколько возможных значения. В этом случае добавляются несколько фиктивных переменных. Фиктивная переменная может быть также индикатором принадлежности наблюдения к некоторой подвыборке. Последнее можно использовать для обнаружения структурных изменений.

 

Чтобы использовать эти переменные в регрессионной модели, им должны быть присвоены цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сформированные переменные в эконометрике называют фиктивными переменными. В российской литературе по дисциплине эконометрика можно встретить термин «структурные переменные».

Рассмотрим использование фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для всех исследуемых данных уравнение регрессии имеет вид:

где у - количество потребляемого кофе; х — цена кофе.

Аналогичные уравнения находятся отдельно для лиц мужского пола:

и женского пола:

Разница в потреблении кофе проявятся в различии средних y1 и y2. Вместе с тем сила влияния х на у может быть одинаковой. В этом случае можно построить общее уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединяя уравнения y1 и y2 и вводя фиктивные переменные, можно прийти к следующему выражению:

где z1 и z2 - фиктивные переменные, принимают значения:
z1 = 1 – мужской пол, 0 – женский пол.
z2 = 0 – мужской пол, 1 – женский пол.

В общем уравнении регрессии переменная у рассматривается как функция не только цены х, но также и пола (z1, z2). Переменная z рассматривается как дихотомическая переменная, которая принимает всего два значения: 1 и 0. При этом когда z1 = 1, то z2 = 0 и наоборот.

Для лиц мужского пола, когда z1 = 1 и z2 = 0, объединенное уравнение регрессии составит:

Для лиц женского пола, когда z1 = 0 и z2 = 1

Различия в потреблении для лиц мужского и женского пола обусловлены различиями свободных членов уравнения регрессии а. Параметр b является общим для всех лиц, как для мужчин, так и для женщин.

Следует иметь в виду, что при введении фиктивных переменных z1 и z2 в регрессионную модель применение МНК для оценивания параметров a1 и a2 в контрольные по эконометрике приведет к вырожденной матрице исходных данных, а значит к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в таком уравнении появляется свободный член, т.е. уравнение принимает вид

Теоретические значения размера потребления кофе для мужского пола будут получены из уравнения

Для женского пола соответствующие значения получим из уравнения

Сравнивая эти результаты, видно, что различия в уровне потребления мужчин и женщин состоят в различии свободных членов данных уравнений: А - для женщин и А + А1 - для мужчин.

 




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: