Этапы построения регрессионных моделей

Регрессионная модель – модель связи между зависимой и независимыми переменными. Например, зависимая переменная – объем сельскохозяйственного урожая, а независимые: количество внесенных удобрений, уровень влажности почвы, качество семян и пр.

Использование регрессионных моделей в управлении (анализе, прогнозировании и принятии решения) предполагает реализацию трех взаимосвязанных этапов.

1.Сбор, анализ, обобщение исходной информации. Формулирование гипотезы о наличии регрессионной связи и выбор вида зависимости.

Показатели, используемые в регрессионном анализе, должны отвечать следующим требованиям:

· показатели должны быть количественно измеримы (если необходимо включить в модель качественный фактор (качество семян), то ему нужно придать количественную определённость, например, например, в виде баллов);

· объясняющие переменные не должны быть интеркорреллированны между собой: коэффициент корреляции между факторами не должен превышать коэффициент корреляции между фактором и результативным

2.Второй этап - построение модели связи включает расчет параметров уравнения регрессии.

При выборе вида зависимости руководствуются следующим: он должен согласовываться с профессионально-логическими соображениями относительно природы и характера исследуемых связей; по возможности используют простые зависимости, не требующие сложных расчетов, легко поддающиеся интерпретации и практическому применению.

Выбор вида регрессионной зависимости можно осуществлять с применением дисперсионного анализа. Основной идеей дисперсионного анализа является разложение общей суммы квадратов отклонений результативной переменной y от среднего значения y на «объясненную» и «остаточную»:

Для приведения дисперсий к сопоставимому виду, определяют дисперсии на одну степень свободы. Результаты вычислений заносят в специальную таблицу дисперсионного анализа (табл).

В данной таблице n – число наблюдений, m – число параметров при переменных х.

Результаты дисперсионного анализа

Компоненты дисперсии Сумма квадратов Число степеней свободы Оценка дисперсии на одну степень свободы
Общая n-1
Объясненная n
Остаточная n-m-1

Величина характеризует надежность оценок, полученных по регрессионному уравнению, а величина показывает надежность оценок с помощью средней. Данные два вида регрессии должны иметь минимальные значения при выборе типа регрессионной модели (линейная, степенная или полиномиальная, аддитивная или мультипликативная и пр.)

Также выбор регрессионной модели можно осуществить на основе расчета коэффициента детерминации:

Величина R2 или коэффициент детерминации характеризует силу воздействия данной причины на связанный с ней показатель. Например, R2=0,99; это означает, что на 99% фактор “х” определяет колеблемость “у”.

Для перехода к первой степени извлекается квадратный корень из приведенного выражения. В результате получаем коэффициент или индекс корреляции (r). Другими словами, устанавливается степень соответствия типа функции реальным условиям или рассчитывается множественный коэффициент корреляции.

r = .

Уравнение зависимости и коэффициент корреляции являются двумя важнейшими характеристиками корреляционной зависимости между изучаемыми признаками. Уравнение в конкретной количественной форме показывает, какая существует зависимость между переменными, а коэффициент корреляции позволяет судить о силе этой зависимости о тесноте изучаемой связи.

Корреляция может быть положительной или отрицательной (коэффициент корреляции имеет тот же знак, который имеет параметр уравнения связи); знак характеризует направленность связи (прямая или обратная связь).

В таблице примерные критерии оценки тесноты связи по коэффициенту корреляции.

Количественные критерии оценки тесноты связи

Величина коэффициента корреляции Характер связи
До | ±0,3| Практически отсутствует
от | ±0,3| до | ±0,5| Слабая
от | ±0,5| до | ±0,7| Умеренная
от | ±0,7| до | ±1,0| Сильная

Величина коэффициента корреляции и, соответственно, коэффициента детерминации, равная 1 свидетельствует о функциональной зависимости, что требует корректировки в разработке модели.

Практика регрессионного анализа говорит о том, что уравнение линейной регрессии часто достаточно хорошо выражает зависимость между показателями даже тогда, когда на самом деле они оказываются более сложными. Это объясняется тем, что в пределах исследуемых величин самые сложные зависимости могут носить приближенно линейный характер.

В общей форме прямолинейное уравнение регрессии имеет вид:

y=a0+b1*x1+b2*x2+........+bm*xm,

где y - результативный признак, исследуемая переменная;

xi - обозначение фактора (независимая переменная);

m - общее число факторов;

a0 - постоянный (свободный) член уравнения;

bi - коэффициент регрессии при факторе.

В экономических исследованиях широко распространены элементарные и комбинированные регрессионные функции. Особое место в их “ассортименте” занимает группа “производственных функций”. Частным случаем регрессионной функции является тренд (зависимость y от времени t).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: