Использование фиктивных переменных в моделях регрессии

Фиктивные переменные вводятся в модель регрессии след. образом. Н-р, 1) пусть Х=(х1, х2, …, хК) — это набор объясняющих независимых переменных, Y(x)= f(x) —это ф-ия, описывающая зависимость з/п от различных факторов. Тогда первоначальная модель будет выглядеть след. образом: Y(x)= a1*x1+a2*x2+…+aK*xK+∑ (5.1). Надо определить влияние такого фактора, как наличие или отсутствие высшего образования. Для этого вводится фиктивная переменная d. Если работник имеет высшее образование, то d=1, если нет, то d=0. При введении фиктивной переменной ур-ие регрессии принимает след. вид Y(x)= a1*x1+a2*x2+…+aK*xK+ σ d+∑=x’*a+ σ d+∑ (5.2), где σ — коэф-т регрессии при фиктивной переменной.

При изучении модели (5.2) считают, что средняя з/п есть x’*a — при отсутствии высшего образования, x’*a+ σ — при его наличии. Т. о., σ интерпретируется как среднее изменение з/п при переходе из одной категории в др-ю.

<График>

К полученному ур-ию нужно применить МНК и получить оценки соответствующих коэф-тов. Станд. ошибки коэф-тов при фиктивных переменных используются для проверки гипотез и построения доверительных интервалов. Наиболее распр. их применение состоит в проверке значимости отличия коэф-тов от 0. Она выполняется делением коэф-та на станд. ошибку для получения t-критерия Стъюдента. Расчетные значения сравниваются с критическим табличным значением при заданном уровне значимости. Качественные переменные могут отвечать не только за сдвиги у постоянного члена, но и за наклон линии регрессии. В данном случае используется фиктивная переменная для коэф-та наклона, к-ая наз-ся переменная взаимодействия. В примере 1 был рассмотрен случай зависимости з/п от наличия высшего образования без учета опыта работы по данной специальности. Для рассмотрения влияния этого фактора вводится новая фиктивная переменная zdx, тогда Y(x) = x’*a+ σ d+ zdx +∑; Y(x) = σ d+ x*(a+zd) +∑; (5.3). Если d=0, то коэф-т при Х как и раньше равен а, если d=1, то коэф-т приобретает вид (a+z). Поэтому величина z рассматривается как разность между коэф-том при показателе наличия высшего образования для работника, к-ый имеет опыт работы, и коэф-том при показателе наличия высшего образования для работника без опыта работы. Качественные различия можно формализовать с помощью любой переменной, принимающей два значения. Однако в эк-ой практике обычно используется система 01, поскольку в этом случае интерпретация выглядит наиболее просто.

Понятие фиктивной переменой взаимодействия


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: