Модель бинарного выбора: Спецификация модели. Оценка параметров модели методом максимального правдоподобия

Модели бинарного выбора — модель с дискретной эндогенной переменной, где зависимая переменная принимает только два значения (либо 1 либо 0 – наличие или отсутствие каких-либо условий). Используется для описания:

1. количественной целочисленной характеристики (число аварий за год, число членов семьи);

2. порядковой характеристики – выбор среди нескольких упорядоченных альтернатив (уровень образования, уровень автоматизации производства);

3. качественной характеристики, определяющей одно из нескольких состояний объекта (результаты голосования, достаточность поликлиник в районе, выбор профессии, транспорта).

Примеры модели бинарного выбора:

1. Анализируется наличие работы у субъекта в зависимости от образования, возраста, семейного положения, доходов остальных членов семьи

y_{i =}	{	1, субъект имеет работу
0, субъект имеет работу

2. Анализируются результаты сдачи экзамена в ГАИ с первой попытки

y_{i =}	{	1, экзамен сдан с первой попытки
0, экзамен не сдан с первой попытки

3. в зависимости от использования компьютерной методики обучения

y_{i =}	{	1, компьютеры использовались
0, компьютеры не использовались

Виды бинарных моделей:

Линейно-вероятностная модель (LPM-Linear Probability Model)

Вектор бинарных (индикаторных) переменных: Y = (y₁, y₂, y₃,… y_i, … y_n)

i-я строка матрицы регрессоров: x_i = (xⁱ₁, xⁱ₂, …, xⁱ_j, …, xⁱ_k)

Вектор столбец случайных возмущений: ε = (ε₁, …, ε_i, …, ε_n)^T

Вектор столбец параметров модели: β = (β₁, β₂, …, β_k)^T

n – объём выборки, k – число параметров

y_i=x_i* β + ε_i

i = 1,..., n

Первая предпосылка Гаусса-Маркова:

E{ ε_i } = 0

Самым серьезным недостатком линейной модели вероятности является факт, что прогнозные значения могут лежать вне отрезка [0,1] что не поддается разумной интерпретации. Это обстоятельств существенно ограничивает область применения линейной модели вероятности. Ее целесообразно использовать при большом числе наблюдений и при достаточно точной спецификации модели, а также как инструмент первичной обработки данных для сравнения с результатами, получаемыми более тонким методами.

2. Пробит- модель. В пробит-модели в качестве F используется интегральная функция стандартного нормального распределения:

P(y_t = l) = F(x'_tβ)

3. Логит- модель. В пробит-модели в качестве F используется функция логистического распределения:

P(y_t = l) = e^u/ (1+ e^u)

Оценка обычно производится методом максимального правдоподобия.

Матричная форма: Y = Xβ + ε

Условия Гаусса-Маркова: E{ ε_it} = 0 С_εε = σ²* I_n

Алгоритм ММП

1. Формируются: функция максимального правдоподобия L, логарифмическая функция максимального правдоподобия Ln L

2. Составляются уравнения правдоподобия

3. Анализируется знак второй производной

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: