Понятие множественной регрессии

Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов на объект исследования, можно пренебречь. Например, при построении модели потребления некоторого товара от дохода предполагают, что в каждой группе дохода одинаково влияние на потребление таких факторов, как цена товара, размер семьи и ее состав. Однако справедливость данного предположения неочевидна. Для получения правильного представление о влиянии дохода на потребление, необходимо изучить их корреляцию при неизменном уровне других факторов. Прямой путь решения такой задачи состоит в отборе единиц совокупности с одинаковыми значениями всех других факторов, кроме дохода. Для этого в химических, физических, биологических исследованиях применяют метод планирования эксперимента. Но в экономике поведение отдельных экономических переменных контролировать нельзя, поэтому не удается обеспечить равенство всех прочих условий для оценки влияния одного исследуемого фактора. Тогда следует попытаться выявить влияние других факторов, т. е. построить уравнение множественной регрессии

(3.1)

В данном уравнении каждый коэффициент регрессии показывает, на сколько единиц изменится величина результативного фактора у при изменении соответствующего фактора на одну единицу при неизменном среднем уровне прочих факторов.

Уравнение такого вида можно использовать, например, при изучении потребления. Тогда коэффициенты будут частными производными потребления у по соответствующим факторам :

(3.2)

Множественную регрессию используют в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических и в других расчетах. Основная цель множественной регрессии – построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также их совокупное воздействие на результативный признак. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1) они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задают в виде баллов; в модели стоимости объектов недвижимости учитывают район нахождения недвижимости, а районы предварительно ранжируют);

2) факторы не должны быть интеркоррелированы и не должны находиться в точной функциональной связи.

Включение в модель

(3.3)

факторов с высокой интеркорреляцией, т. е. когда , может привести к тому, что система нормальных уравнений будет плохо обусловлена и оценки коэффициентов регрессии окажутся неустойчивыми и ненадежными.

Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный признак и параметры уравнения регрессии оказываются неинтерпретируемыми. Так, в уравнении (3.3) предполагают, что факторы и независимы друг от друга, т. е. . Тогда можно говорить, что параметр измеряет силу влияния фактора на результативный признак у при неизменном значении фактора . Если же , то с изменением фактора фактор не может оставаться неизменным и коэффициенты и нельзя интерпретировать как показатели раздельного влияния и на у.

Включаемые во множественную регрессию факторы должны объяснить вариацию результативного признака. Если строят модель с набором р факторов, то для нее рассчитывают показатель детерминации , который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р факторов. Влияние других не учтенных в модели факторов оценивают как с соответствующей остаточной дисперсией .

При дополнительном включении в регрессию -го фактора коэффициент детерминации должен возрастать, а остаточная дисперсия – уменьшаться:

Если этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемый в анализ фактор не улучшает модель и практически является лишним фактором. Например, если для регрессии, включающей пять факторов, коэффициент детерминации составлял и включение шестого фактора дало коэффициент детерминации , то включать в модель этот шестой фактор не целесообразно.