Оценка значимости уравнения регрессии

Если нулевая гипотеза H 0 справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Если H 0 несправедлива, то факторная дисперсия превышает остаточную в несколько раз. Английским статистиком Снедекором разработаны таблицы критических значений F -отношений при разных уровнях значимости нулевой гипотезы и различном числе степеней свободы. Табличное значение F -критерия – это максимальная величина отношений дисперсий, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F -отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи:

F факт > F табл, H 0 отклоняется.

Если же величина F окажется меньше табличной, то вероятность нулевой гипотезы выше заданного уровня (например, 0,05) и она не может быть отклонена без риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым: F факт < F табл, H 0 не отклоняется.

В примере 2.1:

– общая сумма квадратов;

– факторная сумма квадратов, в данном случае равна факторной дисперсии на одну степень свободы s 2факт;

– остаточная сумма квадратов;

s 2ост = 263,16 / 5 = 52,63 – остаточная дисперсия на одну степень свободы;

s = (52,63)1/2 = 7,255 – стандартная ошибка;

F = 14736,84 / 52,63 = 280;

Fa =0,05 = 6,61; Fa =0,01 = 16,26.

Поскольку F факт > F табл как при 1%-ном, так и при 5%-ном уровне значимости, можно сделать вывод о значимости уравнения регрессии (связь доказана).

Величина F -критерия связана с коэффициентом детерминации r 2. Факторную сумму квадратов отклонений можно представить как

,

а остаточную сумму квадратов – как

.

Тогда значение F -критерия можно выразить следующим образом:

.

В нашем примере r 2 = 0,982. В таком случае .

Оценка значимости уравнения регрессии обычно дается в виде таблицы дисперсионного анализа (табл.2.2).

Таблица 2.2. Дисперсионный анализ результатов регрессии

Источники вариации Число степеней свободы Сумма квадратов отклонений Дисперсия на одну степень свободы F-отношение
фактическое табличное при a=0,05
Общая    
Объясненная   14376,84 14736,84   6,61
Остаточная   263,16 52,63  

В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: