Модели бинарного выбора

В теме фиктивные переменные рассматриваются модели, в которых какие-либо независимые переменные принимают дискретные значения. Например, 0 и 1, выражая некоторые качественные признаки относительно зависимой переменной. Явно или неявно предполагалось, что она выражает количественный признак, принимая непрерывное множество значений, но довольно часто интересующая нас величина по своей природе является дискретной.

Рассмотрим несколько типичных ситуаций.

1 блок. Выбор из двух или нескольких альтернатив (голосование,например, решение работать или не работать, покупать или не покупать, выбор профессии, способ попадания из дома на работу).

xt= 1

Когда есть две возможности, т.е. бинарный выбор и результат наблюдаемый можно описать с помощью 1 и 0, то переменную называют бинарной.

Если есть выбор из k альтернатив (нескольких), то переменную называют номинальной, если альтернативы нельзя естественным образом упорядочить. Последние и предпоследние примеры – номинальные переменные.

2 блок. Ранжированный выбор.

Есть несколько альтернатив, но они некоторым образом упорядочены. Например, доходы семьи (высокие, низкие, средние), уровень образования (высшее, среднее), состояние здоровья (плохое, удовлетворительное, нормальное).

Такие переменные называются порядковыми (ранговыми).

xt= 2

k

3 блок. Количественная целочисленная характеристика.

Например, количество прибыльных предприятий, количество зарегистрированных патентов в течение года.

Для моделей с дискретными зависимыми переменными МНК применить достаточно сложно.

Для рассмотрения первого типа ситуаций(для бинарных переменных) можно применить модели бинарного выбора.

Модели с несколькими альтернативами можно свести к моделям бинарного выбора или исследовать аналогичные методы.

Другой класс моделей, рассматриваемый для качественных переменных, связан с цензурированными или урезанными выборками.

Пусть имеется общая модель линейной регрессии:

yt=x1/β+ε

yt=1

M(εt)=0

P(yt=1)=xt/β - линейная модель вероятности

Если в качестве уравнения выбрать функцию

P(yt=1)*F(xt/*β), где F – некоторая функция, область значений которой лежит в отрезке от 0 до 1.

Предположим, что существует некая количественная переменная yt*, связанная с независимыми переменными xt в обычном регресионном уравнении. Например, yt*=xt/*β+ε

Решение соответствующих значений yt=1 принимается тогда, когда yt* превосходит некоторые пороговые значения:

yt=1, если yt*=у пороговое;

yt=0, если yt= у пороговое

Если в качестве F используется функцию стандартизированного нормального распределения, то соответствующую модель называют probit-моделью.

Если в качестве F используется функцию логистического распределения, то соответствующую модель называют logit-моделью.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: