Проведя испытания гипотез (пункт 7), мы пришли к выводу, что связь между переменными x, y линейна и задается неизвестной нам формулой y = α + βx. Мы производим парную выборку значений переменных x, y и методом наименьших квадратов получаем оценки коэффициентов α и β – a и b соответственно. Получена формула у = a + bx, которой мы можем воспользоваться для оценки значений у при заданном значении х.
По полученным точечным оценкам строят доверительные интервалы — интервалы значений, в пределах которых, как мы можем надеяться, находятся параметры генеральной совокупности. Наша надежда выражается доверительной вероятностью — вероятностью, с которой доверительный интервал «захватит» истинное значение параметра генеральной совокупности.
Чем выше доверительная вероятность, тем шире доверительный интервал. Значение доверительной вероятности выбирает сам исследователь. Обычно это 0,9; 0,95; 0,99.
Мы ограничимся построением доверительного интервала для показателя наклона линии линейной регрессии. Задается доверительная вероятность p. Пусть n – объем парной выборки. В этом случае α = (1 – р)/2. По таблице t -распределения находим tα ; n-2.
|
|
Доверительный интервал для показателя наклона линии линейной регрессии имеет вид b ± tα ; n-2 Sb, где Sb – стандартная ошибка коэффициента b.
Пример 6. Вернемся к примерам 1 и 5. Найдем доверительный интервал для показателя наклона линии линейной регрессии. Доверительная вероятность p = 95%.
b ± tα ; n-2 Sb = -0,11 ± 3,182×0,03 ≈ -0,11 ± 0,10, т. е. -0,21 < p < -0,01.