Предположим, что в результате статистического наблюдения были получены данные, характеризующие две переменные – Х и Y. С помощью корреляционного анализа было доказано наличие взаимосвязи между данными переменными. Следующим этапом исследования является задача определения точного вида выявленной зависимости между переменными с помощью регрессионного анализа.
Регрессионный анализ – это определение аналитического выражения связи или вида функции, в которой изменение одной величины (результативной переменной) обусловлено влиянием независимой величины (факторной переменной). Регрессионное уравнение, или регрессионная функция, количественно характеризует данную взаимосвязь.
Базисная регрессионная модель – это модель парной, или однофакторной, регрессии, в которой участвуют одна факторная и одна результативная переменные. Модель однофакторной регрессии называется полиномом первой степени и используется для описания равномерно развивающихся во времени процессов.
Модель парной регрессии зависимости результативной переменной у от факторной переменной х в общем виде записывается следующим образом:
yi = в0 + в1xi + ε i,
где yi – значения результативной переменной, /= 1 ,n; хi – значения факторной переменной, /= 1 ,n;
в 0, в 1 – неизвестные параметры модели парной регрессии;
n – количество наблюдений.
Модель парной регрессии зависимости результативной переменной х от факторной переменной у в общем виде записывается следующим образом:
хi = в0 + в1уi + ε i.
Параметр ε i модели парной регрессии называется случайной ошибкой модели. Появление случайной ошибки в модели регрессии обусловлено следующими объективными предпосылками: 1) существованием вероятности того, что переменные, участвующие в модели, могут быть измерены с ошибкой.
2) включение в модель парной регрессии только одной факторной переменной, которая не способна полностью объяснить вариацию результативной переменной.
Вид функции регрессии, т. е. аналитическую форму зависимости между результативной и факторной переменными, можно определить двумя методами.
1. Путем визуальной оценки характера связи. На линейном графике по оси абсцисс откладываются значения факторной переменной х, по оси ординат – значения результативной переменной у. На пересечении соответствующих значений отмечаются точки. Полученный точечный график в указанной системе координат называется корреляционным полем. Если соединить полученные точки, то полученная линия будет называться эмпирической.
2. Путем теоретического и логического анализа природы изучаемых явлений, их социально‑экономической сущности.
Параметр в 1 уравнения парной регрессии называется коэффициентом регрессии. Его величина показывает, насколько в среднем изменится результативный признак у при изменении факторного признака х на единицу своего измерения. Знак параметра β1 в уравнении парной регрессии указывает на направление связи между переменными:
1) если в 1 > 0, то связь между переменными прямая, т. е. с увеличением значения факторной переменной х увеличивается и значение результативной переменной у, и, наоборот, с уменьшением значения факторной переменной х уменьшается и значение результативной переменной у;
2) если в1 < 0, то связь между переменными обратная, т. е. с увеличением значения факторной переменой x значение результативной переменной y уменьшается, и, наоборот, с уменьшением значения факторной переменой x значение результативной переменной y увеличивается.