Способы отбора факторов, включаемых в модель множественной регрессии

При рассмотрении экономических процессов чаще всего приходится обращаться к моделям, содержащим более одного фактора-признака. Таким образом, следует включить в модель не один фактор, а несколько, т.е. построить уравнение множественной регрессии. Уравнение множественной регрессии имеет вид:

y=f(x1,x2,…,xk)

Простейшая функция для построения множественной регрессионной модели – линейная:

y = a + b1x1 + b2x2 +…+ bkxk +ε.

Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике.

Основная цель – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также их совокупное воздействие на моделируемый показатель.

Факторы, включаемые в множественную регрессию, должны отвечать следующим требованиям:

- быть количественно измеримы. Если необхо­димо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количествен­ную определенность (баллы, ранжирование).

- не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, может привести к нежелательным последствиям – система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми.

- включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р факторов, то для нее рассчитывается показатель детерминации R², который фиксирует долю объясненной ва­риации результативного признака за счет рассматриваемых в ре­грессии р факторов. Влияние других, не учтенных в модели фак­торов, оценивается как 1—R² с соответствующей остаточной дисперсией S². При дополнительном включении в регрессию р+1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:

R²p+1 R²p и S²p+1 S²p.

Если же этого не происходит и данные показатели практиче­ски мало отличаются друг от друга, то включаемый в анализ фак­тор Xp+1 не улучшает модель и практически является лишним фактором. Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа.

Отбор факторов обычно производится в две стадии:

- отбираются факторы, исходя из сущности проблемы

- на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии. Коэффициенты интеркорреляции позволяют исключать дублирующие факторы (переменные коллинеарны, если коэффициент больше 0,7). Предпочтение в данном случае отдается тому фактору, который имеет наименьшую тесноту связи с другими факторами. Матрица парных коэффициент корреляции играет большую роль в отборе, но парные коэффициенты не могут полностью решить задачу. Эту роль выполняют показатели частной корреляции, оценивающие в чистом виде тесноту связи фактора и результата.

1) Наибольшую трудность представляет мультиколлениарность факторов. Коэффициенты множественной детерминации позволяют выявить такие переменные. Чем ближе значение коэффициента к 1, тем сильнее проявляется мультиколлиниарность факторов.

2) Существуют пути преобразование факторов, которые позволяют уменьшить корреляцию факторов.

- переход к совмещенным уравнениям регрессии, которые отражают не только влияние факторов, но и их взаимодействие. Такие уравнения строятся, например, при исследовании эффекта влияния на урожайность разных видов удобрений.

- переход к уравнения приведенной формы, где рассматриваемый фактор выражается из другого уравнения. Например, для регрессии с двумя факторами, если исключить один фактор, то мы придем к парной регрессии.

Выделяют следующие основные методы: метод исключения (отсев факторов из полного набора), метод включения (дополнительное введение фактора), шаговый регрессионный анализ (исключение ранее введенного фактора).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: