Спецификация модели
Оценка надежности результатов множественной регрессии и корреляции
Множественная корреляция
Выбор формы и оценка параметров уравнения множественной регрессии.
Отбор факторов при построении множественной регрессии
Спецификация модели
Тема 3 Множественная линейная регрессия и корреляция
Равносторонняя гипербола.
Обратная регрессия.
Уравнение регрессии
Приведем уравнение к линейному виду, т.е.
Параметры данного уравнения регрессии можно найти с помощью МНК, т.е через систему нормальных уравнений.
Коэффициент корреляции:
Коэффициент эластичности:
Уравнение регрессии
Введем условную величину zи приведем уравнение к линейному виду
Коэффициент корреляции равен
Коэффициент эластичности определятся по формуле
При выборе наилучшей формы связи предпочтение отдается той функции, где коэффициент детерминации и F- критерий Фишера больше, а средняя ошибка аппроксимации меньше.
|
|
Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Однако исследователь никогда не может быть уверен в справедливости данного предположения, т.к. поведение отдельных экономических переменных контролировать нельзя, т.е. не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т.е. построить уравнение множественной регрессии.
В настоящее время множественная регрессия – один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
Уравнение множественной регрессии имеет следующий вид:
у = а + b1 ∙ x1 + b2 ∙ x2 +…+ bp ∙ xp + ε,
где bj – частные коэффициенты регрессии.
Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Она включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.
Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.
1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.
|
|
2. Факторы не должны быть интеркоррелированы (т.е. между объясняющими переменными присутствует корреляция) и тем более находиться в точной функциональной связи.
Включение в модель факторов свысокой интеркорреляцией может привести к ненадежной оценке коэффициентов регрессии, так как нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми.
Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р факторов, то для нее рассчитывается показатель детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р факторов. Влияние других, не учтенных в модели факторов, оценивается как (1– R2) с соответствующей остаточной дисперсией S2.
При дополнительном включении в регрессию р+ 1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться.
Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемый в анализ фактор хp+1 не улучшает модель и практически является лишним фактором.
Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t -критерию Стьюдента.
Отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют t -статистики для параметров регрессии.
Коэффициенты интеркорреляции позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно коллинеарны, т. е. находятся между собой в линейной зависимости, если парный коэффициент корреляции.
Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.
Пусть, например, при изучении зависимости y= f(x, z, v) матрица парных коэффициентов корреляции оказалась следующей:
y | х | z | v | |
y | ||||
х | 0,8 | |||
z | 0,7 | 0,8 | ||
v | 0,6 | 0,5 | 0,2 |
Очевидно, что факторы х и z дублируют друг друга. В анализ целесообразно включить фактор z, а не х, так как корреляция z с результатом у слабее, чем корреляция фактора х с у (ryz < ryx), но зато слабее межфакторная корреляция rzv < rxv. Поэтому в данном случае в уравнение множественной регрессии включаются факторы z, v.