Множественная (многофакторная) регрессия

Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрес­сии:

Построение моделей множественной регрессии включает несколь­ко этапов:

1.Выбор формы связи (уравнения регрессии);

2.Отбор факторных признаков;

3.Обеспечение достаточного объема совокупности.

Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определен­ной степени будут описывать эти связи. Основное значение имеют ли­нейные модели в силу простоты и логичности их экономической интерпретации.

Важным этапом построения уже выбранного уравнения множест­венной регрессии является отбор и последующее включение факторных признаков.

С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерно­стью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически я статистически несущественных факторов способствует простоте и качеству ее реализа­ции. В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.

Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе интуитивно-логических или многомерных статистических методов анализа.

Наиболее приемлемым способом отбора факторных признаков яв­ляется шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Факторы поочередно вводятся в уравнение так называемым «пря­мым методом». При проверке значимости введенного фактора опреде­ляется, на сколько уменьшается сумма квадратов остатков и увеличива­ется величина множественного коэффициента корреляции (). Одно­временно используется и обратный метод, то есть исключение факторов, ставших незначимыми.

Фактор является незначимым, если его включение в уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака вели­чина множественного коэффициента корреляции увеличивается, а коэф­фициента регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.

При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель ( > 0,8).

Наличие мультиколлинеарности между признаками приводит к:

• искажению величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков;

• изменению смысла экономической интерпретации коэффициентов регрессии.

В качестве причин возникновения мультиколлинеарности между признаками, можно выделить следующие:

• изучаемые факторные признаки являются характеристикой одной и той же стороны явления или процесса. Например: показатели объема производимой продукции и среднегодовой стоимости основных фон­дов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;

• факторные признаки являются составляющими элементами друг дру­га;

• факторные признаки по экономическому смыслу дублируют друг друга.

Устранение мультиколлинеарности может реализовываться через исключение из корреляционной модели одного или нескольких линейносвязанных факторных признаков или преобразование исходных фактор­ных признаков в новые, укрупненные факторы.

Вопрос о том, какой из факторов следует отбросить, решается на основании качественного и логического анализа изучаемого явления.

Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекват­ных статистических моделей.

Аналитическая форма связи результативного признака от ряда факторных выражается и называется многофакторным (множествен­ным) уравнением регрессии или моделью связи.

Линейное уравнение множественной регрессии имеет вид:

где- теоретические значения результативного признака, полу­ченные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;

- факторные признаки;

- параметры модели (коэффициенты регрессии).

Параметры уравнения могут быть определены графическим мето­дом, методом наименьших квадратом и так далее.

Пример. По следующим данным о прибыли (у), затратах на 1 руб. произведенной продукции (х) и стоимости основных фондов () опре­делим зависимость между признаками.

Таблица 9.4.

Расчетная таблица для определения параметров уравнения регрессии

Прибыль (млн. руб.) Затраты на 1 руб. произведенной продукции (коп.) Стоимость основных фондов (млрд. руб.) ()
        412,8 454,3 454,3 347,1 352,6 396,9   18,49 34,81 34,81 15,21 18,49 24,01 145,82 950,3 6313,0 5905,9 2363,4 3349,7 3866,1 22748,4

Система нормальных линейных уравнений имеет вид:

Таким образом:


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: