Эта величина измеряет вариацию, объясненную регрессионной моделью

1(у-у)2

Средняя нз квадратов остатков» — -т*,

Остат.

Которая измеряет вариацию, не объясненную регрессией.

Замечание: Общее число степеней свободы равно п-1, где п — число данных в совокупности, в данном примере n=16, dfperpec. ~ число степеней свободы для регрессии, которая задана числом независимых переменных к. В данной модели k=5=dfOCTirr — число степеней свободы для остатков может быть найдено как:

*^остат. = dfoum. ~ dfperpce.= (n~D число независимых переменных.

В данном примере df^^., = 16-1-5=10.

Если модель описывает связь между у и всеми независимыми переменными х, то величина остаточной вариации будет очень малой. Для всей модели в целом: Н0: нет линейной связи между какими-либо независимыми переменными и

продажей, т.е. Pi=P2=P3eP4=Ps=0-Ht: существует линейная связь между одной или большим числом независимых

переменных, т.е. по крайней мере одна величина Р(*0.


270 4.2. Анализ данных как составная часть принятия решений

Для того чтобы модель была полезной и имела силу, мы должны отвергнуть Hq и принять Н|. Значение F-критерия есть соотношение двух величин, описанных выше:

__ Средний квадрат отклоиенией, обусловленных регрессией ~ Средний квадрат отклонений, обусловленных остатками

Этот критерий с одним «хвостом» (односторонний), потому, что средний квадрат, обусловленный регрессией, должен быть больше, чтобы мы могли принять Ht. В предыдущих разделах, когда мы использовали F-критерий, критерии были двусторонние, так как во главу угла ставилось большее значение вариации, каким бы оно ни было. В регрессионном анализе нет выбора — наверху (в числителе) всегда вариация у по регрессии. Если она меньше, чем вариация по остаточной величине, мы принимает Hq, так как модель не объясняет изменений у. Это значение F-критерия сравнивается с табличным:

F0,05, k,(n-1-k) •

Из таблиц стандартного распределения F-критерия:

^0,05,1,ю = 3,326. В нашем примере значение критерия:

F = 28271 / 1736 = 16,3.

16,3 > F, поэтому мы получили результат с высокой достоверностью.

Проверим каждое из значений коэффициентов регрессии. Предположим, что компьютер сосчитал все необходимые t-критерии. Для первого коэффициента гипотезы формулируются так:

Н0: время не помогает объяснить изменение продаж при условии, что осталь­ные переменные присутствуют в модели, т.е. Pi=0.

Ht: время дает существенный вклад и должно быть включено в модель, т.е. pt*0.

Проведем испытание гипотезы на 5%-ном уровне, пользуясь двусторонним t-критерием при:

(n-1-k) = 10 степенях свободы.

Граничные значения на данном уровне:

4,025,10 = ±2.228. Значение критерия:

Ь.-О
t- —-------.

Sb,


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: