Модели бинарного выбора — модель с дискретной эндогенной переменной, где зависимая переменная принимает только два значения (либо 1 либо 0 – наличие или отсутствие каких-либо условий). Используется для описания:
1. количественной целочисленной характеристики (число аварий за год, число членов семьи);
2. порядковой характеристики – выбор среди нескольких упорядоченных альтернатив (уровень образования, уровень автоматизации производства);
3. качественной характеристики, определяющей одно из нескольких состояний объекта (результаты голосования, достаточность поликлиник в районе, выбор профессии, транспорта).
Примеры модели бинарного выбора:
1. Анализируется наличие работы у субъекта в зависимости от образования, возраста, семейного положения, доходов остальных членов семьи
yi = | { | 1, субъект имеет работу |
0, субъект имеет работу | ||
2. Анализируются результаты сдачи экзамена в ГАИ с первой попытки
yi = | { | 1, экзамен сдан с первой попытки |
0, экзамен не сдан с первой попытки |
3. в зависимости от использования компьютерной методики обучения
|
|
yi = | { | 1, компьютеры использовались |
0, компьютеры не использовались |
Виды бинарных моделей:
Линейно-вероятностная модель (LPM-Linear Probability Model)
Вектор бинарных (индикаторных) переменных: Y = (y1, y2, y3,… yi, … yn)
i-я строка матрицы регрессоров: xi = (xi1, xi2, …, xij, …, xik)
Вектор столбец случайных возмущений: ε = (ε1, …, εi, …, εn)T
Вектор столбец параметров модели: β = (β1, β2, …, βk)T
n – объём выборки, k – число параметров
yi=xi* β + εi
i = 1,..., n
Первая предпосылка Гаусса-Маркова:
E{ εi } = 0
Самым серьезным недостатком линейной модели вероятности является факт, что прогнозные значения могут лежать вне отрезка [0,1] что не поддается разумной интерпретации. Это обстоятельств существенно ограничивает область применения линейной модели вероятности. Ее целесообразно использовать при большом числе наблюдений и при достаточно точной спецификации модели, а также как инструмент первичной обработки данных для сравнения с результатами, получаемыми более тонким методами.
2. Пробит- модель. В пробит-модели в качестве F используется интегральная функция стандартного нормального распределения:
P(yt = l) = F(x'tβ)
3. Логит- модель. В пробит-модели в качестве F используется функция логистического распределения:
P(yt = l) = eu/ (1+ eu)
Оценка обычно производится методом максимального правдоподобия.
Матричная форма: Y = Xβ + ε
Условия Гаусса-Маркова: E{ εit} = 0 Сεε = σ2 * In
Алгоритм ММП
1. Формируются: функция максимального правдоподобия L, логарифмическая функция максимального правдоподобия Ln L
|
|
2. Составляются уравнения правдоподобия
3. Анализируется знак второй производной