Оценка качества уравнения регрессии

После того как найдено уравнение регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

Чтобы иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации:

. (2.12)

где  - индивидуальная ошибка аппроксимации.

Если  - модель отличного качества; если  - модель хорошего качества; если  - удовлетворительная модель; если - необходимо строить другую модель.

Оценка значимости уравнения регрессии в целом производится на основе - критерия Фишера, которому предшествует дисперсионный анализ. В математической статистике дисперсионный анализ рассматривается как самостоятельный инструмент статистического анализа. В эконометрике он применяется как вспомогательное средство для изучения качества регрессионной модели.

Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной  от среднего значения  раскладывается на две части – «объясненную» и «необъясненную»:

,

где  – общая сумма квадратов отклонений;

 – факторная сумма квадратов отклонений (сумма квадратов отклонений, объясненная регрессией);

 – остаточная сумма квадратов отклонений.

Любая сумма квадратов отклонений связана с числом степеней свободы df, т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n и с числом определяемых по ней констант. Разделив каждую сумму квадратов на соответствующее число степеней свободы, получим дисперсию на одну степень свободы.

Схема дисперсионного анализа имеет вид, представленный в таблице 2.1 ( – число наблюдений,  – число параметров при переменной ).

Таблица 2.1

Компоненты дисперсии Сумма квадратов Число степеней свободы Дисперсия на одну степень свободы
Общая
Факторная
Остаточная

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину - критерия Фишера:

. (2.13)

Оценивание качества модели по F -критерию Фишера состоит в проверке гипотезы H0 о статистической незначимости уравнения регрессии. Для этого наблюдаемое значение -критерия Фишера (2.13) сравнивается с критическим (табличным) значением при уровне значимости и степенях свободы и . Уровень значимости α – вероятность отвергнуть гипотезу при условии что она верна. Обычно принимается равной 0,05 или 0,01.

Если Fнабл > Fкр, то признается статистическая значимость и надежность уравнения регрессии. Если Fнабл < Fкр, то признается статистическая незначимость и ненадежность уравнения регрессии.

Величина - критерия связана с коэффициентом детерминации , и ее можно рассчитать по следующей формуле:

. (2.14)

Для парной линейной регрессии , поэтому

. (2.15)

Для оценки статистической значимости параметров уравнения регрессии применяется t -распределение Стьюдента. Величина параметра сравнивается с его стандартной ошибкой, т.е. определяется наблюдаемое (фактическое) значение - критерия Стьюдента:

, (2.16)

которое затем сравнивается с критическим (табличным) значением  при уровне значимости  и числе степеней свободы .

Стандартные ошибки параметров линейной регрессии определяются по формулам:

, (2.17)

. (2.18)

где – остаточная дисперсия на одну степень свободы. (2.19)

Если | tнабл | > tкр, то параметр bj признается статистически значимым. Если | tнабл | < tкр, то признается статистическая незначимость параметра bj.

Величина стандартной ошибки совместно с -распределением Стьюдента применяется для расчета доверительного интервала параметров регрессии:

. (2.20)

Поскольку знак коэффициента регрессии b1 указывает на рост результативного признака  при увеличении факторного признака (), уменьшение результативного признака при увеличении признака-фактора () или его независимость от независимой переменной () (см. рис. 2.3), то границы доверительного интервала для коэффициента регрессии не должны содержать противоречивых результатов, например, . Такого рода запись указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего не может быть.

 
 

 

Рисунок 2.4 - Наклон линии регрессии в зависимости от значения параметра

Связь между F -критерием Фишера и t -критерием Стьюдента выражается равенством:

. (2.21)

В прогнозных расчетах по уравнению регрессии определяется предсказываемое значение как точечный прогноз  при , т.е. путем подстановки в уравнение регрессии соответствующего значения . Однако точечный прогноз явно нереален, поэтому он дополняется интервальной оценкой прогнозного значения :

, (2.22)

где – средняя ошибка прогнозируемого индивидуального значения y:

. (2.23)


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: