Доверительные интервалы в линейном регрессионном анализе

Проведя испытания гипотез (пункт 7), мы пришли к выводу, что связь между переменными x, y линейна и задается неизвестной нам формулой y = α + βx. Мы производим парную выборку значений пе­ременных x, y и методом наименьших квадратов получаем оценки коэффициентов α и βa и b соответственно. Получена формула у = a + bx, которой мы можем воспользоваться для оценки значений у при заданном значении х.

По полученным точечным оценкам строят доверительные интер­валы — интервалы значений, в пределах которых, как мы можем на­деяться, находятся параметры генеральной совокупности. Наша надежда выражается доверительной вероятностью — вероятностью, с которой доверительный интервал «захватит» истинное значение па­раметра генеральной совокупности.

Чем выше доверительная вероятность, тем шире доверительный интервал. Значение доверительной вероятности выбирает сам иссле­дователь. Обычно это 0,9; 0,95; 0,99.

Мы ограничимся построением доверительного интервала для по­казателя наклона линии линейной регрессии. Задается доверитель­ная вероятность p. Пусть n – объем парной выборки. В этом случае α = (1 – р)/2. По таблице t -распределения находим tα ; n-2.

Доверительный интервал для показателя наклона линии линей­ной регрессии имеет вид b ± tα ; n-2 Sb, где Sb – стандартная ошибка ко­эффициента b.

Пример 6. Вернемся к примерам 1 и 5. Найдем доверитель­ный интервал для показателя наклона линии линейной регрессии. Доверительная вероятность p = 95%.

b ± tα ; n-2 Sb = -0,11 ± 3,182×0,03 ≈ -0,11 ± 0,10, т. е. -0,21 < p < -0,01.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: