Отбор факторов при построении множественной регрессии

Спецификация модели

Оценка надежности результатов множественной регрессии и корреляции

Множественная корреляция

Выбор формы и оценка параметров уравнения множественной регрессии.

Отбор факторов при построении множественной регрессии

Спецификация модели

Тема 3 Множественная линейная регрессия и корреляция

Равносторонняя гипербола.

Обратная регрессия.

Уравнение регрессии

Приведем уравнение к линейному виду, т.е.

Параметры данного уравнения регрессии можно найти с помощью МНК, т.е через систему нормальных уравнений.

Коэффициент корреляции:

Коэффициент эластичности:

Уравнение регрессии

Введем условную величину zи приведем уравнение к линейному виду

Коэффициент корреляции равен

Коэффициент эластичности определятся по формуле

При выборе наилучшей формы связи предпочтение отдается той функции, где коэффициент детерминации и F- критерий Фишера больше, а средняя ошибка аппроксимации меньше.

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Однако исследователь никогда не может быть уверен в справедливости данного предположения, т.к. поведение отдельных экономических переменных контролировать нельзя, т.е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии.

В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Уравнение множественной регрессии имеет следующий вид:

у = а + b1 ∙ x1 + b2 ∙ x2 +…+ bp ∙ xp + ε,

где bj – частные коэффициенты регрессии.

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Она включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.

1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2. Факторы не должны быть интеркоррелированы (т.е. между объясняющими переменными присутствует корреляция) и тем более находиться в точной функциональной связи.

Включение в модель факторов свысокой интеркорреляцией может привести к ненадежной оценке коэффициентов регрессии, так как нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми.

Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р факторов, то для нее рассчитывается показатель детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р факторов. Влияние других, не учтенных в модели факторов, оценивается как (1– R2) с соответствующей остаточной дисперсией S2.

При дополнительном включении в регрессию р+ 1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться.

Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемый в анализ фактор хp+1 не улучшает модель и практически является лишним фактором.

Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t -критерию Стьюдента.

Отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют t -статистики для параметров регрессии.

Коэффициенты интеркорреляции позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно коллинеарны, т. е. находятся между собой в линейной зависимости, если парный коэффициент корреляции.

Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.

Пусть, например, при изучении зависимости y= f(x, z, v) матрица парных коэффициентов корреляции оказалась следующей:

  y х z v
y        
х 0,8      
z 0,7 0,8    
v 0,6 0,5 0,2  

Очевидно, что факторы х и z дублируют друг друга. В анализ целесообразно включить фактор z, а не х, так как корреляция z с результатом у слабее, чем корреляция фактора х с у (ryz < ryx), но зато слабее межфакторная корреляция rzv < rxv. Поэтому в данном случае в уравнение множественной регрессии включаются факторы z, v.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: