Оценка качества и значимости модели множественной регрессии

Для оценки качества модели множественной регрессии используют следующие показатели:

· средняя ошибка аппроксимации – характеризует среднее отклонение расчетных значений от фактических значений y. Величину определяют по формуле (2.9);

· коэффициент множественной детерминации – характеризует долю вариации результативного признака, обусловленную регрессией или изменчивостью факторов. Чем ближе к единице, тем лучше регрессия описывает зависимость между факторами и результативным признаком.

(3.18)

Вместе с тем использование только одного коэффициента детерминации для выбора наилучшего уравнения регрессии может оказаться недостаточным. На практике встречаются случаи, когда плохо определенная модель регрессии может дать сравнительно высокий коэффициент .

Недостатком коэффициента детерминации является то, что он увеличивается при добавлении новых факторов, хотя при этом качества регрессионной модели может не улучшиться. Предпочтительнее использовать скорректированный коэффициент детерминации , определяемый по формуле

(3.19)

Данная формула показывает, что чем больше число объясняющих переменных p, тем меньше по сравнению с . Скорректированный коэффициент может уменьшаться при введении в модель новых факторов, не оказывающих существенного влияния на результативный признак. Однако даже увеличение скорректированного коэффициента детерминации при введении в модель нового фактора не всегда означает, что ее коэффициенты регрессии значимы. Это происходит только в случае, если соответствующее значение t -статистики больше единицы по абсолютной величине, т. е. .

Если известен коэффициент детерминации , то критерий значимости уравнения регрессии имеет вид:

(3.20)

· t-критерий. Выдвигается гипотеза о случайной природе параметров уравнения регрессии , , , …, . Оценку значимости этих параметров выполняют с помощью t-критерия Стьюдента путем сопоставления их значений с величиной случайных ошибок:

(3.21)

Случайные ошибки параметров определяют по формулам:

	;	(3.22)
	;	(3.23)
	…
	,	(3.24)

где ; – обращенный определитель системы, в котором каждый элемент равен ; – алгебраическое дополнение элемента , получаемое путем вычеркивания i -й строки и j -го столбца из определителя ; – элемент обращенного определителя, стоящий на главной диагонали.

Сравнивая фактическое и критическое (табличное) значения t-статистик с , принимают или отвергают гипотезу .

3.5. Прогнозирование значений результативного признака
с использованием модели множественной регрессии

При прогнозировании ожидаемого значения результативного фактора рассчитывают точечную и интервальную оценки.

Точечную оценку (прогнозное значение) определяют путем подстановки в уравнение регрессии (3.1) соответствующих прогнозных значений факторов, которые следует записать в виде вектора-строки . Затем вычисляют среднюю стандартную ошибку прогноза. Для ожидаемого среднего значения уравнение ошибки прогноза имеет вид: