Теоретическая часть

ЛАБОРАТОРНАЯ РАБОТА № 12

ИНТЕГРИРОВАННАЯ СИСТЕМА STATISTICA .

РЕГРЕССИОННЫЙ АНАЛИЗ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ.

МНОГОФАКТОРНЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ

Цель работы: приобрести практические навыки построения и анализа качества многофакторных регрессионных моделей линейной и нелинейной структуры с помощью специализированных модулей интегрированной системы (ИС) STATISTICA.

ТЕОРЕТИЧЕСКАЯ ЧАСТЬ

В общем случае в регрессионный анализ вовлекаются несколько независимых переменных. Это, конечно же, наносит ущерб наглядности получаемых результатов, так как подобные множественные связи в конце концов становится невозможно представить графически.

Для построения и анализа многофакторных регрессионных моделей линейной структуры, как уже говорилось в лабораторной работе №11, ИС STATISTICAпредлагает модуль«Множественная регрессия» (Multiple Regression).Основное назначение данного модуля — построение зависимостей между многомерными переменными, подбор простой линейной модели и оценка ее адекватности.

Линейная многофакторная модель (12.1) представляет собой уравнение прямой в многомерном пространстве и имеет вид

Y = b + m1x1 + m2x2 +…+mnxn, (12.1)

где x1, …, xn – независимые переменные (факторы);

Y – зависимая переменная;

m0, …, mn – коэффициенты уравнения регрессии;

n — количество независимых переменных.

По сравнению с простым регрессионным анализом в случае множественного регрессионного анализа необходимо оценить коэффициенты уравнения множественной регрессии m0, …, mn.

Кроме того, при работе с моделями множественной регрессии необходимо провести предварительный анализ целесообразности включения выбранных переменных в регрессионную модель, поскольку переменные, объявленные независимыми, могут сами коррелировать между собой. Этот факт, называемый мультиколлинеарностью, необходимо обязательно учитывать при определении коэффициентов уравнения регрессии для того, чтобы избежать ложных корреляций. Не рекомендуется включать в модель переменные, слабо связанные с результативным признаком, а также переменные, тесно связанные друг с другом. В этом случае решение становится неустойчивым, незначительное изменение состава выборки (значений признаков) или состава объясняемых переменных может вызвать кардинальное изменение модели, что делает ее использование малопригодным в практических целях. Наиболее распространенные в таких случаях приемы: исключение одной из двух сильно связанных переменных, использование гребневой регрессии, переход от первоначальных переменных к их главным компонентам.

Установка флажка в поле Review descr. stats, corr. Matrix (Обзор описательных статистик, корреляционная матрица) позволит провести предварительный анализ исходных переменных и построить корреляционную матрицу, анализ которой дает возможность сделать важные выводы о структуре связей между выбранными переменными.

Если сбросить флажок в поле Perform default analysis(Метод анализа по умолчанию), то появляется доступ к диалоговому окну Model Definition, открывающему возможность дополнительного выбора методов анализа, среди которых имеются методы пошаговой (Stepwise)и гребневой (Ridge ) регрессии.

Методы пошаговой регрессии позволяют из множества независимых переменных отобрать только те, которые наиболее значимы для адекватного описания многопараметрической регрессии. В модуле реализованы две процедуры отбора переменных, каждая из которых может давать различный конечный набор пе­ременных: последовательное включение ( Forwardstepwise)и последовательное исключение (Backwardstepwise).

Гребневая регрессия используется для получения более устойчивых оценок параметров регрессионной модели в условиях мультиколлинеарности переменных.

Кроме линейного регрессионного анализа, STATISTICA предоставляет возможность проведения нелинейногорегрессионного анализа. Для этой цели служит модуль NonlinearEstimation (Нелинейное оценивание ). Он позволяет строить произвольную регрессионную модель, задаваемую некоторой алгебраической формулой, которая может быть нелинейной как по переменным, так и по параметрам. Для расчета модели могут использоваться различные итерационные алгоритмы минимизации. Программа осуществляет полный контроль за всеми аспектами вычислительных процедур (начальное значение, размер шага, критерий сходимости и т.д.). Большинство обычных нелинейных регрессионных моделей задано в модуле и может быть просто выбрано из меню.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: