Множественная многофакторная регрессия – это изучение связи между 3 и более связанных между собой признаков.
Построение модели множественной регрессии включает следующие этапы:
- Выбор формы связи, то есть уравнения регрессии
- Отбор факторных признаков
- Обеспечение достаточного объема совокупности для получения несмешанных оценок
В основном используются 5 типов моделей:
1) линейная
2) степенная
3) показательная
4) параболическая
5) гиперболическая
Основное значение имеют линейные модели в силу своей простоты, а также, потому что нелинейные формы зависимости приводятся к линейным путем линеаризации.
Существует проблема отбора признаков для построения модели. Основные требования, предъявляемые к включаемым в модель факторам:
- Каждый из факторов должен быть обоснован теоретически
- В перечень целесообразно включать только важнейшие факторы, оказывающие существенное воздействие на изучаемые показатели. При этом рекомендуется, чтобы количество включаемых в модель факторов не превышало одной трети от числа наблюдений выборки.
- Факторы не должны быть линейно-зависимыми, то есть они могут характеризовать либо одно и то же свойство изучаемого явления, либо являться составными частями одного и того же признака. Включение в модель линейно-взаимозависимых факторов приводит к возникновению явления мультиколлинеарности, которое отрицательно сказывается на качестве модели.
- Влияющие на экономический процесс факторы могут быть количественными и качественными. В модель рекомендуется включать только такие факторы, которые могут быть численно измеренными.
- В одну модель нельзя включать совокупный фактор и образующие его частные факторы, так как это тоже приводит к явлению мультиколлинеарности.
При отборе факторов используются статистические методы отбора:
|
|
1. Метод исключения – предполагает построение уравнения, включая всю совокупность переменных с последующим пошаговым сокращением числа переменных в модели до тех пор, пока не выполнится некоторое наперед заданное условие.
2. Метод включения – его суть состоит в последовательном включении переменных в модель до тех пор, пока регрессионная модель не будет отвечать заранее установленному критерию качества. Последовательность включения определяется с помощью частного коэффициента корреляции. Переменные, имеющие относительно исследуемого показателя большое значение частного коэффициента корреляции, первыми включаются в регрессионное уравнение.