После того как между изучаемыми переменными установлена линейная корреляция достаточной тесноты, регрессионный анализ позволяет найти формулу связи X и Y.
Модель парной линейной регрессии предполагает, что случайные значения Y складываются из закономерной (неслучайной) составляющей и чисто случайной добавки e. Определить точный вид довольно сложно, поэтому для нее подбирают подходящую аппроксимацию (приближение). В случае тесной линейной связи переменных таким приближением служит функция регрессии (рис. 1, а).
Складывая закономерную и случайную составляющие для линейно связанных X и Y, получим
. (4)
Соотношение (4) называют моделью парной линейной регрессии.
В литературе закономерную составляющую называют тренд, а чисто случайную – шум. Эти термины отражают суть регрессионного подхода к математическому моделированию статистической связи случайных величин: тренд – это доминирующая и закономерная тенденция в изменении Y от X, а шум – это случайные остатки, «ошибки» относительно тренда.
|
|
Таким образом, регрессионная модель предлагает неизвестные истинные значения Y оценивать посредством функции регрессии, то есть аппроксимировать взаимосвязь X и Y трендом f (x). В частности, линейная регрессия предполагает, что при массовых наблюдениях случайного показателя Y его значения изменяются в среднем по линейному закону, а результаты отдельных наблюдений незначительно отклоняются от линейной тенденции на случайную величину e.