Оценка адекватности модели прогнозирования

Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблюдаемым данным проводится на основе анализа остатков – ε_i. При построении уравнения регрессии мы можем разбить значение у в каждом наблюдении на 2 составляющие: . Остаток представляет собой отклонение фактического значения зависимой переменной от значения данной переменной, полученное расчетным путем: . Если ε_i=0, то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значениями. Графически это означает, что теоретическая линия регрессии (линия, построенная по функции у=а₀+а₁х) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи. Следовательно, результативный признак у полностью обусловлен влиянием фактора х. На практике, как правило, имеет место некоторое рассеивание точек корреляционного поля относительно теоретической линии регрессии, т.е. отклонения эмпирических данных от теоретических (). Величина этих отклонений и лежит в основе расчета показателей качества (адекватности) уравнения.

для оценки качества регрессионных моделей используют также к-т множественной корреляции: . Данный коэффициент является универсальным, т.к. он отражает тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. Коэффициент множественной корреляции, возведенный в квадрат, называется к-том детерминации: . Он показывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, т.е. определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов. Чем ближе он к 1, тем выше качество модели.