Оценка значимости уравнения регрессии

Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (соответствия) модели наблюдаемым данным проводится на основе анализа остатков, т.е. величин для каждого момента времени ti, отражающих несовпадения между исходными точками и полученными значениями на эмпирической кривой в моменты времени t1, t2, …, tn. Чем меньше влияние неучтенных факторов на величину Y, тем лучше модель соответствует фактическим данным.

В качестве оценок построенной зависимости применяются:

А) Коэффициент детерминации:

. (8)

Здесь – среднее значение измеренных величин yi:

(9)

Коэффициент детерминации определяет, какая доля вариации результативного признака Y учтена в модели и обусловлена влиянием на него рассматриваемого фактора t. Чем ближе R2 к единице, тем выше качество модели. Для оценки качества регрессионных моделей целесообразно также использовать коэффициент множественной корреляции (индекс корреляции):

. (10)

Этот коэффициент является универсальным – он отражает и тесноту связи и точность модели, а также может использоваться при любой форме связи переменных. В случае однофакторной модели индекс корреляции равен коэффициенту линейной корреляции: .

Также для оценки точности регрессионных моделей целесообразно использовать среднюю относительную ошибку аппроксимации A[4]:

. (11)

Чем меньше рассеяние эмпирических точек вокруг теоретической линии регрессии, тем меньше величина A. Ошибка аппроксимации меньше 7% говорит о хорошем качестве модели. После построения уравнения регрессии выполняется проверка значимости построенного уравнения в целом, а затем и её отдельных параметров.

Оценить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между Y и t, фактическим данным[5], и достаточно ли только параметра t для описания зависимой переменной Y. Оценка значимости выполняется для проверки пригодности уравнения регрессии для практического использования, например, для прогнозирования.

При этом выдвигают гипотезу о незначимости уравнения в целом[6], что формально сводится к гипотезе о равенстве нулю коэффициента детерминации, т.е. . Для проверки значимости модели (что фактически будет означать подтверждение или отрицание выдвинутой гипотезы) применяют критерий Фишера или F-критерий: по определенным правилам вычисляют расчётное значение этого критерия и сравнивают его с табличным значением для подобных же условий.

Для нашего случая (модели парной регрессии) расчётное значение F-критерия вычисляется по формуле:

. (12)

Табличное значение F-критерия в случае парной регрессии определяется при и степенях свободы при заданном уровне значимости a. Уровень значимости характеризует нашу уверенность в правильности проверки гипотезы. Обычно a берут равным 0.1, 0.05, 0.01 и т.д. Чем ниже величина a, тем большую уверенность в правильности проверки гипотезы она подразумевает. Рассчитывается также табличное значение F-критерия.

Если расчётное значение критерия Фишера больше табличного, т.е. F>Fтабл., то модель считается значимой.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: