Введение фиктивных переменных в модель

Для того, чтобы ввести фиктивную переменную в регрессионную модель, ей необходимо присвоить некоторые числовые значения, придав тем самым фиктивным переменным количественное содержание. В случае дихотомической переменной это делается следующим образом. Фиктивной переменной придается значение 1, если признак присутствует в наблюдении, и 0 – при его отсутствии. Таким образом, если z – дихотомическая переменная, то в описанном выше двоичном виде она формализуется равенством

Что касается фиктивной переменой, имеющей k уровней качества (k > 2), то при построении регрессионной модели она заменяется на дихотомическую фиктивную переменную.

Например, при исследовании зависимости заработной платы от стажа работника и его образования модель может быть представлена в виде:

где – часть заработной платы, объясняемая стажем,

Третьей дихотомической переменной z ₃ и не требуется, так как если работник имеет начальное образование, то это уже учтено при . Более того, с точки зрения требований к качеству модели ее вводить нельзя, так как тогда для любого работника

z ₁ + z ₂ + z ₃= 1,

то есть переменные становятся линейно зависимыми, а это приводит к появлению мультиколлинеарности. Такая ситуация совершенной мультиколлинеарности получила название «ловушка фиктивной переменной». Чтобы избежать ее, необходимо руководствоваться следующим простым правилом.

Если фиктивная переменная z имеет k качественных уровней, то при моделировании вместо нее используются дихотомическая переменная z ₁, z ₂, …, z_k_- ₁.

7 8 9 10 11 12 13

Подборка статей по вашей теме:

Малообразованному человеку очень полезно читать книги цитат. «Знакомые цитаты» Бартлетта – восхитительная книга, и я внимательно изучал ее. Запечатленные в памяти цитаты вызывают плодотворные мысли. Они также вызывают желание подробнее ознакомиться с творчеством их авторов и отыскать в нем многое другое. © Черчилль ==> читать все изречения...

8342

7989