Оценка статистической значимости коэффициентов регрессии и коэффициента корреляции

Оценим статистическую значимость полученных коэффициентов регрессии b0 и b1, коэффициента корреляции rух с помощью t -критерия Стьюдента на уровне значимости α = 0,05. Эта проверка проводится по единой схеме, с помощью статистических гипотез. Выдвигается нулевая гипотеза Н0 о случайной природе полученного коэффициента, о незначимом его отличии от нуля, то есть гипотеза Н0 состоит в том, что коэффициент =0. Альтернативная ей гипотеза Н1 состоит в том, что  неслучайно, то есть полученный коэффициент статистически значим. Чтобы опровергнуть гипотезу Н0 и подтвердить гипотезу Н1 должно выполняться неравенство  на уровне значимости α и с (n– 2 ) степенями свободы, где n – количество наблюдений, уровень значимости d – вероятность совершить ошибку, опровергнув гипотезу Н0, когда она верна.

Для b1: Н0: b1=0, Н1: .

Рассчитаем стандартную ошибку коэффициента регрессии b1. Потребуется сделать промежуточные вычисления: подставляя фактические значения хi в уравнение регрессии найдем теоретические (смоделированные) значения , затем вычислим разность между фактическими и смоделированными значениями, т.е. остатки , затем возведём остатки в квадрат еi2 и просуммируем; результаты представлены в расчетной таблице. Теперь подставим необходимые данные в формулу для расчёта :

и t -статистики по модулю: .

Или

Затем сравним наблюдаемое значение с табличным значением t -критерия Стьюдента. Табличное значение по таблице распределения Стьюдента на уровне значимости α=0,05 с n– 2=21–2=19степенями свободы: tтабл =2,093 или с помощью функции СТЬЮДРАСПОБР(α; ν)= 2,093. Наблюдаемое значение t -статистики превышает табличное значение t -критерия: 3,646 > 2,093, то есть выполнено неравенство , а значит, Н0 о случайной природе полученного коэффициента отвергается, и принимается альтернативная ей гипотеза Н1, свидетельствующая в 95% случаев о статистической значимости полученного коэффициента регрессии b1. Т.о., можно считать, что предполагаемая зависимость количества легковых автомобилей от размера среднедушевых доходов подтвердилась и статистически установлена.

Для b0: Н0: b0=0, Н1: .

Рассчитаем стандартную ошибку коэффициента регрессии b0. Все необходимые цифры уже имеются в расчетной таблице, подставим эти данные в формулу: , а затем рассчитаем t -статистику по модулю: .

Сравнивая рассчитанное значение с табличным значением t -критерия Стьюдента на уровне значимости α = 0,05 с n– 2=21-2=19степенями свободы: tтабл =2,093, можно сделать вывод о статистической значимости полученного коэффициента регрессии b0  в 95% случаев.

Для rух: Н0: rух =0, Н1: .

Для этого рассчитаем стандартную ошибку коэффициента корреляции   rух  – :  и t -статистику по модулю: .

Сравнивая рассчитанное значение с табличным значением t -критерия Стьюдента на уровне значимости α=0,05 с n– 2=21-2=19степенями свободы: tтабл =2,093, можно сделать вывод о статистической значимости полученного коэффициента корреляции   rух  в 95% случаев, можно считать, что предполагаемая зависимость количества легковых автомобилей от размера среднедушевых доходов подтвердилась и статистически установлена.

Проверим правильность вычислений: , действительно 3,6462=3,6462.

 

6) Доверительные интервалы для параметров регрессионной модели b0 и b1

Доверительный интервал для b0 с надежностью g=1–α: . Выбрав уровень значимости d=0,05, получаем надежность g=0,95. Все необходимые цифровые значения уже рассчитаны ранее, тогда , откуда получаем .

Доверительный интервал для b1 с надежностью g=1–α: . При выбранной надежности g=0,95: , откуда

Таким образом, с надежностью 95% можно утверждать, что истинное значение параметра b0 для всей генеральной совокупности будет заключено в пределах от 135,958 до 251,9, а истинное значение параметра b1 - расположено в границах от 0,0155 до 0,0565. Следует отметить, что доверительные интервалы не очень широки, но и не узки. А это подтверждает, что количество автомобилей в регионах действительно зависит от среднедушевых доходов, но вместе с тем оказывают существенное влияние и другие факторы, и ими не стоит пренебрегать. Именно потому, что они не учтены в модели, доверительные интервалы получились не узкими, а, значит, точность модели невысока, но вполне приемлема.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: