Последовательные этапы построения модели множественной регрессии

Когда невозможно описать модель с помощью одного фактора, вводят другие факторы, то есть строят модель множественной регрессии:

y= a+ b₁x₁… + b_px_p + e

Пример: Функция потребления – Потребление зависит от дохода, цен, наличных денег, ликвидных активов.

Шаг первый: Выбор спецификации модели. Включает в себя два вопроса: a). выбор факторов и b). выбор вида уравнения регрессии

(Это еще и 15-й вопрос)

a) Очевидно, что включаемые факторы должны описывать модель. 2 требования к выбираемым факторам:
- они должны быть Количественно Измеримыми (либо дать им количественную определенность)

- факторы не должны коррелировать между собой (r_x₁_x₂=0). Иначе неустойчивость и ненадежность оценок коэффициентов регрессии

Для модели, включающей N факторов рассчитывается показатель детерминации R², который фиксирует долю объясненной вариации результативного признака за счет тех самых N факторов.

Влияние неучтенных факторов – это (1-R²)

Лишние факторы, статистически незначимые или дублирующие (с коэффициентом внутренней корреляции выше 0,7), выбрасываются из модели

При выявлении двух коллинеарных факторов один из них выбрасывается, при чем предпочтение отдается тому, чья связь с прочими факторами меньше.

Отбор факторов производится на основе теоретико-экономического анализа, но он не рассматривает количественную взаимосвязь признаков => ОТБОР ПРОВОДЯТ В 2 ЭТАПА:
1 – отбираются факторы, исходя из проблемы (логически)

2 – на основе матрицы показателей корреляции и определения t-статистики (значимости факторов) для параметров регрессии

Матрица парных коэффициентов корреляции:

	Y	X₁	X₂	X₃
Y
X₁	R_yx1
X₂	R_yx2	R_x1x2
X₃	R_yx3	R_x1x3	R_x2x3

Здесь появляется проблема мультиколлинеарности, которая относится к вопросу 23. Мультиколлинеарность факторов – ситуация, когда больше 2х факторов связаны между собой линейной зависимостью => невозможно оценить воздействие каждого фактора в отдельности.

Мультиколлинеарность – это плохо потому, что: 1 – затрудняется интерпретация факторов; 2 – оценки параметров ненадежны => модель непригодна для анализа и прогноза

Симптомы мультиколлинеарности:

1) завышенное значение коэффициента детерминации (чем ближе к 1, тем сильнее мультиколлинеарность). Сравнивая коэффициенты можно найти факторы, ответственные за Мультикол-ть

2) высокие стандартные ошибки для коэффициентов регрессии

3) широкие доверительные интервалы

4) низкое значение t-критерия

5) появление при коэффициентах регрессии знаков, противоположных ожидаемым

6) Значительное изменение параметров модели при незначительном уменьшение кол-ва наблюдений.

Меры по устранению мультиколлинеарность:

1) удаление из модели переменных с высоким коэффициентом парной корреляции между факторами, если это не противоречит теории, положенной в основу построения модели

2) увеличение числа наблюдений

3) изменение функциональной формы модели

4) функциональное преобразование тесно связанных м/у собой факторов. Например, факторы площадь и население заменить на один фактор – плотность населения.

5) Переход к уравнениям приведенной формы – в ур-ие регрессии подставляют рассматриваемый фактор, выраженный из другого ур-ия

6) Построение моделей по отклонению от средней величины

7) использование специальных методов обработки временных рядов

Парные коэффициенты не в полной мере решают вопрос выбора факторов. Матрица частных коэффициентов корреляции более точная или же используется t-критерий Стьюдента для исключения факторов с величиной t-критерия меньше табличного.

При отборе факторов рекомендуется использовать в 6-7 раз меньше факторов, чем объем совокупности, тогда F-критерий не будет меньше табличного.

Выявить мультиколлинеарность можно с помощью матрицы парных коэффициентов корреляции. Если определитель матрицы = 1, то связь м/у факторами полностью отсутствует, если он = 0, то связь близкая к функциональной. Итог: чем ближе определитель к 1, тем лучше.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

7 8 9 10 11 12 13

Общая характеристика русской литературы XIX века

Расчет себестоимости турпродукта

Виды и жанры научного стиля

Школы менеджмента

Феодальная раздробленность. Владимиро-Суздальское княжество, Галицко-Волынское княжество, Новгород

Гончарова О. М. Поэтическое наследие Ломоносова и русская поэзия XIX – XX вв.

Самый сильный аргумент, почему эволюция человека не могла быть