Алгоритм проверки адекватности множественной регрессионной модели

Проверка качества или адекватности множественной модели регрессии состоит из следующих этапов:

· Проверка качества уравнения регрессии;

· Проверка значимости уравнения регрессии;

· Анализ статистической значимости параметров модели;

· Проверка выполнения предпосылок МНК.

Для проверки качества уравнения регрессии вычисляют коэффициент множественной корреляции R и коэффициент детерминации R2:

Чем ближе к единице значение этих характеристик, тем выше качество модели. В многофакторной регрессии добавление дополнительных объясняющих переменных увеличивает коэффициент детерминации. Следовательно, коэффициент детерминации должен быть скорректирован с учетом числа независимых переменных. Скорректированный R2 рассчитывается так:

Для проверки значимости уравнения регрессии используется F-критерий Фишера, вычисляемый по формуле:

Если расчетное значение с v1 = k и v2 = n – k – 1 степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости α, то модель считается значимой.

Анализ статистической значимости параметров модели (коэффициентов регрессии) проводится с использованием t-статистики Стьюдента:

, где Saj – это стандартное (среднеквадратическое) отклонение коэффициента уравнения регрессии аj.

Если расчетное значение t-критерия с (n-k-1) степенями свободы больше его табличного значения при заданном уровне значимости α, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели (при этом ее качество не ухудшится).

Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, представляют собой предпосылки МНК:

· Мат. ожидание случайной составляющей в любом направлении должно быть равно 0;

· Зависимая переменная yi есть величина случайная, а объясняющая переменная xi– величина неслучайная => теоретическая ковариация между независ. переменной и случ. членом равна нулю;

· В любых двух наблюдениях отсутствует систематическая связь между значениями случайной составляющей;

· Дисперсия случайной величины должна быть постоянна для всех наблюдений.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: