Регрессионная модель – модель связи между зависимой и независимыми переменными. Например, зависимая переменная – объем сельскохозяйственного урожая, а независимые: количество внесенных удобрений, уровень влажности почвы, качество семян и пр.
Использование регрессионных моделей в управлении (анализе, прогнозировании и принятии решения) предполагает реализацию трех взаимосвязанных этапов.
1.Сбор, анализ, обобщение исходной информации. Формулирование гипотезы о наличии регрессионной связи и выбор вида зависимости.
Показатели, используемые в регрессионном анализе, должны отвечать следующим требованиям:
· показатели должны быть количественно измеримы (если необходимо включить в модель качественный фактор (качество семян), то ему нужно придать количественную определённость, например, например, в виде баллов);
· объясняющие переменные не должны быть интеркорреллированны между собой: коэффициент корреляции между факторами не должен превышать коэффициент корреляции между фактором и результативным
|
|
2.Второй этап - построение модели связи включает расчет параметров уравнения регрессии.
При выборе вида зависимости руководствуются следующим: он должен согласовываться с профессионально-логическими соображениями относительно природы и характера исследуемых связей; по возможности используют простые зависимости, не требующие сложных расчетов, легко поддающиеся интерпретации и практическому применению.
Выбор вида регрессионной зависимости можно осуществлять с применением дисперсионного анализа. Основной идеей дисперсионного анализа является разложение общей суммы квадратов отклонений результативной переменной y от среднего значения y на «объясненную» и «остаточную»:
Для приведения дисперсий к сопоставимому виду, определяют дисперсии на одну степень свободы. Результаты вычислений заносят в специальную таблицу дисперсионного анализа (табл).
В данной таблице n – число наблюдений, m – число параметров при переменных х.
Результаты дисперсионного анализа
Компоненты дисперсии | Сумма квадратов | Число степеней свободы | Оценка дисперсии на одну степень свободы |
Общая | n-1 | ||
Объясненная | n | ||
Остаточная | n-m-1 |
Величина характеризует надежность оценок, полученных по регрессионному уравнению, а величина показывает надежность оценок с помощью средней. Данные два вида регрессии должны иметь минимальные значения при выборе типа регрессионной модели (линейная, степенная или полиномиальная, аддитивная или мультипликативная и пр.)
Также выбор регрессионной модели можно осуществить на основе расчета коэффициента детерминации:
|
|
Величина R2 или коэффициент детерминации характеризует силу воздействия данной причины на связанный с ней показатель. Например, R2=0,99; это означает, что на 99% фактор “х” определяет колеблемость “у”.
Для перехода к первой степени извлекается квадратный корень из приведенного выражения. В результате получаем коэффициент или индекс корреляции (r). Другими словами, устанавливается степень соответствия типа функции реальным условиям или рассчитывается множественный коэффициент корреляции.
r = .
Уравнение зависимости и коэффициент корреляции являются двумя важнейшими характеристиками корреляционной зависимости между изучаемыми признаками. Уравнение в конкретной количественной форме показывает, какая существует зависимость между переменными, а коэффициент корреляции позволяет судить о силе этой зависимости о тесноте изучаемой связи.
Корреляция может быть положительной или отрицательной (коэффициент корреляции имеет тот же знак, который имеет параметр уравнения связи); знак характеризует направленность связи (прямая или обратная связь).
В таблице примерные критерии оценки тесноты связи по коэффициенту корреляции.
Количественные критерии оценки тесноты связи
Величина коэффициента корреляции | Характер связи |
До | ±0,3| | Практически отсутствует |
от | ±0,3| до | ±0,5| | Слабая |
от | ±0,5| до | ±0,7| | Умеренная |
от | ±0,7| до | ±1,0| | Сильная |
Величина коэффициента корреляции и, соответственно, коэффициента детерминации, равная 1 свидетельствует о функциональной зависимости, что требует корректировки в разработке модели.
Практика регрессионного анализа говорит о том, что уравнение линейной регрессии часто достаточно хорошо выражает зависимость между показателями даже тогда, когда на самом деле они оказываются более сложными. Это объясняется тем, что в пределах исследуемых величин самые сложные зависимости могут носить приближенно линейный характер.
В общей форме прямолинейное уравнение регрессии имеет вид:
y=a0+b1*x1+b2*x2+........+bm*xm,
где y - результативный признак, исследуемая переменная;
xi - обозначение фактора (независимая переменная);
m - общее число факторов;
a0 - постоянный (свободный) член уравнения;
bi - коэффициент регрессии при факторе.
В экономических исследованиях широко распространены элементарные и комбинированные регрессионные функции. Особое место в их “ассортименте” занимает группа “производственных функций”. Частным случаем регрессионной функции является тренд (зависимость y от времени t).