Гл. 8. Линейная регрессия. На рис. 8.14 показан пример данных, которые распределяются вдоль линии регрессии неравномерно, в этом случае метод наименьших квадратов непригоден для подбора



На рис. 8.14 показан пример данных, которые распределяются вдоль линии регрессии неравномерно, в этом случае метод наименьших квадратов непригоден для подбора "наилучшей" линии.

Если остатки распределяются так, как на рис. 8.15, то мы делаем вывод, что вариация у изменяется с изменениями х.

В нашем примере выделяются два значения остатка (-1,89 и 1,63). Они свидетельствуют, что данные не соответствуют предположениям о едином характере вариации. Следовательно, доверительный интервал, описанный в следующей части, не будет применим.

Остатки * k

• - у - у О

Ряс. 8.15. График остатков для данных, вариация которых не является постоянной для всех значений х

Единственным способом продолжать статистический анализ доверительных интервалов и испытание гипотез в таком случае является трансформация данных (часто используются логарифмы значений х) до тех пор, пока график остатков не покажет случайное рассеяние точек относительно е = 0 при небольших значениях остатков.

Оценка устойчивости и колеблемости линейной модели регрессии может быть длительной процедурой, особенно если ряд данных увеличивается не постоянно, а с замедлением. Существует множество ППП для статистической обработки. Может показаться, что дело обстоит просто: нужно собрать данные и ввести их в компьютер. Программа рассчитывает линейную модель, не обращая внимание на то, годится она или нет. В следующем разделе мы рассмотрим, как установить и оценить линейную регрессионную модель.


256 4.2. Анализ данных как составная часть принятия решений

СТАТИСТИЧЕСКИЙ ВЫВОД В АНАЛИЗЕ ЛИНЕЙНОЙ РЕГРЕССИИ


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: