1(у-у)2
Средняя нз квадратов остатков» — -т*,
Остат.
Которая измеряет вариацию, не объясненную регрессией.
Замечание: Общее число степеней свободы равно п-1, где п — число данных в совокупности, в данном примере n=16, dfperpec. ~ число степеней свободы для регрессии, которая задана числом независимых переменных к. В данной модели k=5=dfOCTirr — число степеней свободы для остатков может быть найдено как:
*^остат. = dfoum. ~ dfperpce.= (n~D — число независимых переменных.
В данном примере df^^., = 16-1-5=10.
Если модель описывает связь между у и всеми независимыми переменными х, то величина остаточной вариации будет очень малой. Для всей модели в целом: Н0: нет линейной связи между какими-либо независимыми переменными и
продажей, т.е. Pi=P2=P3eP4=Ps=0-Ht: существует линейная связь между одной или большим числом независимых
переменных, т.е. по крайней мере одна величина Р(*0.
270 4.2. Анализ данных как составная часть принятия решений
Для того чтобы модель была полезной и имела силу, мы должны отвергнуть Hq и принять Н|. Значение F-критерия есть соотношение двух величин, описанных выше:
|
|
__ Средний квадрат отклоиенией, обусловленных регрессией ~ Средний квадрат отклонений, обусловленных остатками
Этот критерий с одним «хвостом» (односторонний), потому, что средний квадрат, обусловленный регрессией, должен быть больше, чтобы мы могли принять Ht. В предыдущих разделах, когда мы использовали F-критерий, критерии были двусторонние, так как во главу угла ставилось большее значение вариации, каким бы оно ни было. В регрессионном анализе нет выбора — наверху (в числителе) всегда вариация у по регрессии. Если она меньше, чем вариация по остаточной величине, мы принимает Hq, так как модель не объясняет изменений у. Это значение F-критерия сравнивается с табличным:
F0,05, k,(n-1-k) •
Из таблиц стандартного распределения F-критерия:
^0,05,1,ю = 3,326. В нашем примере значение критерия:
F = 28271 / 1736 = 16,3.
16,3 > F, поэтому мы получили результат с высокой достоверностью.
Проверим каждое из значений коэффициентов регрессии. Предположим, что компьютер сосчитал все необходимые t-критерии. Для первого коэффициента гипотезы формулируются так:
Н0: время не помогает объяснить изменение продаж при условии, что остальные переменные присутствуют в модели, т.е. Pi=0.
Ht: время дает существенный вклад и должно быть включено в модель, т.е. pt*0.
Проведем испытание гипотезы на 5%-ном уровне, пользуясь двусторонним t-критерием при:
(n-1-k) = 10 степенях свободы.
Граничные значения на данном уровне:
4,025,10 = ±2.228. Значение критерия:
Ь.-О
t- —-------.
Sb,