Проблема мультиколлинеарности в моделях множественной регрессии. Виды мультиколлинеарности, признаки, последствия. Методы устранения мультиколлинеарности

Множественная регрессия позволяет построить и проверить модель линейной связи между зависимой (эндогенной) и несколькими независимыми (экзогенными) переменными: y = f(x1,...,xр), где у - зависимая переменная (результативный признак); х1,...,хр - независимые переменные (факторы). Множественная линейная регрессионная модель имеет вид: y=a+b1x1+b2x2+…+bpxp+ε Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1. быть количественно измеримы. При включении качественного фактора нужно придать ему количественную определенность

2. не должны быть коррелированы между собой и тем более и годиться в точной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией, когда ryx1 < rx1x2 может повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Поскольку одним из условий построения уравнения множественной регрессии является независимость действия факторов, коллинеарность факторов нарушает это условие. Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами

Признаки мультиколлинеарности.

1.В модели с двумя переменными одним из признаков мультиколлинеарности является близкое к единице значение коэффициента парной корреляции. Если значение хотя бы одного из коэффициентов парной корреляции больше, чем 0,8, то мультиколлинеарность представляет собой серьезную проблему. Однако в модели с числом независимых переменных больше двух, парный коэффициент корреляции может принимать небольшое значение даже в случае наличия мультиколлинеарности. В этом случае лучше рассматривать частные коэффициенты корреляции. 2. Для проверки мультиколлинеарности можно рассмотреть детерминант матрицы коэффициентов парной корреляции |r|. Этот детерминант называется детерминантом корреляции |r| ∈(0; 1). Если |r| = 0, то существует полная мультиколлинеарность. Если |r|=1, то мультиколлинеарность отсутствует. Чем ближе |r| к нулю, тем более вероятно наличие мультиколлинеарности.

3. Если оценки имеют большие стандартные ошибки, невысокую значимость, но модель в целом значима (имеет высокий коэффициент детерминации), то это свидетельствует о наличие мультиколлинеарности.

4. Если введение в модель новой независимой переменной приводит к существенному изменению.

19. Фиктивные переменные: определение, назначение, типы (спецификация, смысл параметра при фиктивной переменной). Фиктивная переменная (англ. dummy variable) — качественная переменная, принимающая значения 0 и 1, включаемая в эконометрическую модель для учёта влияния качественных признаков и событий на объясняемую переменную. При этом фиктивные переменные позволяют учесть влияние не только качественных признаков принимающих два, но и несколько возможных значения. В этом случае добавляются несколько фиктивных переменных.

В некоторых случаях, при повышении качества моделей, возникает необходимость оценки влияния качественных признаков на эндогенную переменную (пр.: для ф-ии спроса – это вкус потребителя, возраст, сезонность...).

Эти показатели нельзя представить в численном виде. Поэтому используют фиктивные переменные – переем-е с дискретным множеством значений, которые образом описывают качественные признаки. Обычно используются фиктивные переменные бинарного типа «О—1»: В принципе можно оценивать соответствующие зависимости по отдельности внутри каждой категории, а затем изучать различия между ними, но введение фиктивных переменных позволяет оценивать одно уравнение сразу по всем категориям.

Тем не менее, переменная такая же «равноправная» переменная, как и любая другая «обычная» переменная. Ее «фиктивность» состоит только в том, что она количественным образом описывает качественный признак. Все статистические процедуры регрессионного анализа для модели с фиктивными переменными (оценка параметров регрессии, проверка значимости и т. д.) проводятся точно так же, как и в случае «обычных» количественных объясняющих переменных. В общем случае, когда качественный признак имеет более двух значений, вводится несколько бинарных переменных. При использовании нескольких бинарных переменных необходимо исключить линейную зависимость между переменными, так как в противном случае, при оценке параметров, это приведет к полной мультиколлинеарности.

Поэтому применяется следующее правило: если качественная

переменная имеет к альтернативных значений, то при моделировании используются только к-1 фиктивная переменная.

В регрессионных моделях применяются фиктивные переменные двух типов: переменные сдвига и переменные наклона.

Фиктивные переменные бывают двух типов - сдвига и наклона. Фиктивная переменная сдвига - это переменная, которая меняет точку пересечения линии регрессии с осью ординат в случае применения качественной переменной. Фиктивная переменная наклона - это та переменная, которая изменяет наклон линии регрессии в случае использования качественной переменной
модель с фиктивной переменной сдвига;

модель с фиктивной переменной наклона;

модель с фиктивной переменной наклона и сдвига.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: