Когда невозможно описать модель с помощью одного фактора, вводят другие факторы, то есть строят модель множественной регрессии:
y= a+ b1x1 … + bpxp + e
Пример: Функция потребления – Потребление зависит от дохода, цен, наличных денег, ликвидных активов.
Шаг первый: Выбор спецификации модели. Включает в себя два вопроса: a). выбор факторов и b). выбор вида уравнения регрессии
(Это еще и 15-й вопрос)
a) Очевидно, что включаемые факторы должны описывать модель. 2 требования к выбираемым факторам:
- они должны быть Количественно Измеримыми (либо дать им количественную определенность)
- факторы не должны коррелировать между собой (rx1x2=0). Иначе неустойчивость и ненадежность оценок коэффициентов регрессии
Для модели, включающей N факторов рассчитывается показатель детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет тех самых N факторов.
Влияние неучтенных факторов – это (1-R2)
Лишние факторы, статистически незначимые или дублирующие (с коэффициентом внутренней корреляции выше 0,7), выбрасываются из модели
|
|
При выявлении двух коллинеарных факторов один из них выбрасывается, при чем предпочтение отдается тому, чья связь с прочими факторами меньше.
Отбор факторов производится на основе теоретико-экономического анализа, но он не рассматривает количественную взаимосвязь признаков => ОТБОР ПРОВОДЯТ В 2 ЭТАПА:
1 – отбираются факторы, исходя из проблемы (логически)
2 – на основе матрицы показателей корреляции и определения t-статистики (значимости факторов) для параметров регрессии
Матрица парных коэффициентов корреляции:
Y | X1 | X2 | X3 | |
Y | ||||
X1 | Ryx1 | |||
X2 | Ryx2 | Rx1x2 | ||
X3 | Ryx3 | Rx1x3 | Rx2x3 |
Здесь появляется проблема мультиколлинеарности, которая относится к вопросу 23. Мультиколлинеарность факторов – ситуация, когда больше 2х факторов связаны между собой линейной зависимостью => невозможно оценить воздействие каждого фактора в отдельности.
Мультиколлинеарность – это плохо потому, что: 1 – затрудняется интерпретация факторов; 2 – оценки параметров ненадежны => модель непригодна для анализа и прогноза
Симптомы мультиколлинеарности:
1) завышенное значение коэффициента детерминации (чем ближе к 1, тем сильнее мультиколлинеарность). Сравнивая коэффициенты можно найти факторы, ответственные за Мультикол-ть
2) высокие стандартные ошибки для коэффициентов регрессии
3) широкие доверительные интервалы
4) низкое значение t-критерия
5) появление при коэффициентах регрессии знаков, противоположных ожидаемым
6) Значительное изменение параметров модели при незначительном уменьшение кол-ва наблюдений.
|
|
Меры по устранению мультиколлинеарность:
1) удаление из модели переменных с высоким коэффициентом парной корреляции между факторами, если это не противоречит теории, положенной в основу построения модели
2) увеличение числа наблюдений
3) изменение функциональной формы модели
4) функциональное преобразование тесно связанных м/у собой факторов. Например, факторы площадь и население заменить на один фактор – плотность населения.
5) Переход к уравнениям приведенной формы – в ур-ие регрессии подставляют рассматриваемый фактор, выраженный из другого ур-ия
6) Построение моделей по отклонению от средней величины
7) использование специальных методов обработки временных рядов
Парные коэффициенты не в полной мере решают вопрос выбора факторов. Матрица частных коэффициентов корреляции более точная или же используется t-критерий Стьюдента для исключения факторов с величиной t-критерия меньше табличного.
При отборе факторов рекомендуется использовать в 6-7 раз меньше факторов, чем объем совокупности, тогда F-критерий не будет меньше табличного.
Выявить мультиколлинеарность можно с помощью матрицы парных коэффициентов корреляции. Если определитель матрицы = 1, то связь м/у факторами полностью отсутствует, если он = 0, то связь близкая к функциональной. Итог: чем ближе определитель к 1, тем лучше.