Оценка значимости уравнения множественной регрессии. Оценка значимости фактора, дополнительно включенного в модель регрессии. Общий и частный F- критерий

Оценка значимости уравнения множественной регрессии осуществляется путем проверки основной гипотезы Н0: или (гипотеза о статистической незначимости уравнения регрессии).

Альтернативной гипотезой – Н1 (которая принимается, если основная окажется не верна) является гипотеза о статистической значимости уравнения регрессии: или .

Для проверки основной гипотезы используют общий F-критерий Фишера.

При этом вычисляют фактическое (наблюдаемое) значение F-статистики критерия, например, через коэффициент детерминации ( ) с учетом изменения числа степеней свободы:

,

где n — число наблюдений;

h — число оцениваемых параметров (в случае двухфакторной линейной регрессии h = 3).

По таблицам распределения Фишера-Снедоккора находят критическое значение F-статистики — Fкр. Для определения Fкр задаются уровнем значимости (обычно его берут равным 0,05) и двумя числами степеней свободы k1=h-1 и k2=n-h.

Сравнивают фактическое значение F-статистики критерия, вычисленное по данным наблюдений — (Fнабл) с критическим – .Если ,то основную гипотезу о незначимости уравнения регрессии не отвергают. Если ,то основную гипотезу отвергают и принимают альтернативную гипотезу о статистической значимости уравнения регрессии.

Оценка значимости дополнительного включения фактора (частный F-критерий). Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличить долю объясненной вариации результативного признака. Это может быть связано с последовательностью вводимых факторов (т. к. существует корреляция между самими факторами).

Мерой оценки значимости улучшения качества модели, после включения в нее фактора хj, служит частный F-критерий – Fxj:

,

где h – число оцениваемых параметров.

В числителе – прирост доли вариации у за счет дополнительно включенного в модель фактора хj.

Если наблюдаемое значение Fxj больше , то дополнительное введение фактора xj в модель статистически оправдано.

Допустим, что оценивается значимость фактора х1 как дополнительно включенного в модель . Тогда частный F-критерий будет вычисляться по формуле:

.

Частный F-критерий оценивает значимость коэффициентов «чистой» регрессии (). Существует взаимосвязь между частным F-критерием — Fxj и t -критерием, используемым для оценки значимости коэффициента регрессии при j -м факторе: .

Рассмотрим методику расчета общего и частного F-критериев на примере. Пусть по данным о 20 рабочих исследуется влияние на заработную плату рабочего за месяц у факторов: возраста х1, и выработки за смену х2. Данные приведены в табл. 2.1.

Оценим с помощью общего F-критерия значимость уравнения регрессии, построенного по имеющимся данным (см. п.2.1.2):

. (2.2)

Теоретический коэффициент детерминации для данного уравнения равен (расчет смотри в п. 2.1.5).

Тогда: .

.

Fнабл =41,9> Fкр, следовательно, уравнение регрессии (2.2) статистически значимо и может быть использовано на практике.

Оценим с помощью частного F-критерия:

1) целесообразность включения в модель регрессии фактора х2 после введения х1 (Fx2);

2) целесообразность включения в модель регрессии фактора х1, после введения х2 (Fx1);

3) значимость коэффициентов регрессии.

Для проверки гипотезы о целесообразности включения фактора х2 в модель регрессии после введения х1, определим наблюдаемое значение частного F-критерия:

где (коэффициент парной корреляции ryx1 рассчитан в п. 2.2.1).

.

Сравним наблюдаемое значение частного F-критерия с критическим: Fx2>Fкр, следовательно, фактор х2 (выработка рабочего) целесообразно включать в модель после введения фактора х1 (возраст рабочего).

Для проверки гипотезы о целесообразности включения фактора х1, в модель регрессии после введения х2 определим наблюдаемое значение частного F-критерия:

где (коэффициент парной корреляции ryx2 рассчитан в п. 2.2.1).

Сравним наблюдаемое значение частного F-критерия с критическим: , следовательно, фактор х1 – возраст рабочего целесообразно включать в модель после введения фактора х2 – выработка за смену.

Для проверки гипотезы о значимости (значимом отличии от нуля) коэффициента , при факторе х1 (возраст) определим наблюдаемое значение t -статистики: . Сравним его с критическим значением .Так как наблюдаемое значение больше критического, то гипотеза о незначимости коэффициента регрессии отвергается, следовательно, коэффициент регрессии значимо отличается от нуля.

Для проверки гипотезы о значимости (значимом отличии отнуля) коэффициента при факторе х2 (выработка рабочего) определим наблюдаемое значение t- статистики: . Сравним его с критическим значением . Так как наблюдаемое значение больше критического, то гипотеза о незначимости коэффициента регрессии отвергается, следовательно, коэффициент регрессии значимо отличается от нуля.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: