Для задачи 5 вычислить R12 и R22, сравнить, объяснить различие и выбрать лучшее уравнение регрессии, объяснить почему.
Ответ: R12 = 0,96886, R22 = 0,42433, первое уравнение лучше.
В линейной регрессии обычно оценивается значимость не только уравнения в целом, но и отдельных его параметров. С этой целью по каждому из параметров и коэффициенту регрессии определяется его стандартная ошибка: mb и ma, mr
Выдвигается гипотеза о случайной природе показателей, т.е. о незначительном их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
Затем сравнивая фактическое и критическое (табличное значения t-статистики) принимаем или отвергаем гипотезу .
Если tтабл < tфакт, то отклоняется.
(Если критерий 2х сторонний: tфакт ≥ tтабл и tфакт ≤ tтабл или tфакт ≥ |tтабл|).
Для задач 3 и 6 найти критерий Стьюдента для a,b и rxy и вычислить доверительные интервалы для коэффициентов.
|
|
Проверка: Связь между F-критериями Фишера и t-статистикой Стьюдента
Из таблицы 2 для уровня значимости α = 0,05 и числа степеней свободы n – 2 = 5, получим tb = 2.57. Т.к. фактически значение > табличного, то гипотезу о несущественности коэффициента регрессии ''b'' можно отклонить. Доверительный интервал для коэффициента регрессии определяется как
tтабл.=2,57
-0,7752>-2,75, т.е. коэффициент «а» статистически не значим, т.е. Но не отклоняется. Доверительный интервал для «а» не определяется.
Значимость линейного коэффициента корреляции определим на основе величины ошибки mr
; , т.е.
Рассмотренная формула для тr рекомендуется к применению при большом числе наблюдений и если r не близко к +1 или -1. Если корреляция близка к +1, то распределение его оценок отличается от нормального или распределения Стьюдента, т.к. величина rxy ограничена значениями. Р. Фишер предложил для оценки вклада rxy ввести вспомогательную величину z, связанную с rxy следующим отношением:
При изменении r от -1 до +1 z изменяется от до , что соответствует нормальному распределению. Стандартная ошибка вычисляется по формуле
, где n – число наблюдений.
В нашем примере тогда , а
Для вычисления величины z есть таблицы z -преобразований, приложения III из [11], для числа степеней свободы и уровня значимости даны фактические значения .
Если не пользоваться таблицами, то стандартную ошибку можно определить
отвергается, т.е.
6. Стандартная ошибка уравнения регрессии. Прогнозное значение.
В прогнозных расчетах по уравнению регрессии можно определить предсказываемое значение (ур) как точечный прогноз при , т.е. путем подстановки в уравнение регрессии соответствующего значения х. Вычислим сначала стандартную ошибку , а затем интервальную оценку прогнозного значения у*
|
|
Стандартная ошибка зависит от ошибки и ошибки коэффициента регрессии b, т.е.
; где S2 остаточная дисперсия на одну степень свободы.
найдем при хк=4.
;
-табличное значение критерия Стьюдента
- точечный прогноз.
Этот доверительный интервал получился без учета случайной ошибки , если ее учитывать получим
Доверительный интервал в этом случае будет
Задача 9. Наблюдения 16 пар (Х и Y) дали следующие результаты:
Оцените регрессию и проверьте гипотезу, что коэффициент b=1,0.
1. Оценим параметры регрессии
Оценка дисперсии ошибок равна
2. Проверка гипотезы Н1:
Оценка дисперсии b:
;
Для проверки гипотезы Н1 найдем:
, следовательно , следовательно 4 > 2,145.
Поэтому Н1: не отвергаем (на уровне значимости ) и при тоже нет оснований отвергать гипотезу H1, т.к. .
Задача 10. Получена регрессионная зависимость расходов на питание от располагаемого личного дохода населения США за 25-летний срок (1959-1983 гг.). Уравнение регрессии имеет вид:
Цифры в скобках есть стандартные ошибки.
Сформулируем Н0: b0=0 и попытаемся ее опровергнуть
, оцениваем два параметра «а» и «b».
; Н0 отвергается.
Критерий можно записать в виде неравенств:
, что противоречит Н0, поэтому ее отвергаем, т.е. , значит коэффициент «b» статистически значим.
Для параметра «а»
Коэффициент «а» статистически значим.
Задача 11. Модель зависимость между общей инфляцией и инфляцией, вызванной ростом заработной платы имеет вид (в скобках указаны стандартные ошибки)
Проверить значимость коэффициентов «а» и «b», если число наблюдений , а уровень значимости
Ответ:
Задача 12. Уравнения регрессии между расходами на коммунальные услуги и (1) располагаемым личным доходом и (2) временем за период с 1959г. по 1983г. в США имеют вид:
(1) (2)
В скобках указаны стандартные ошибки.
Выполните t -тест для проверки значимости коэффициентов.
.