На рис. 8.14 показан пример данных, которые распределяются вдоль линии регрессии неравномерно, в этом случае метод наименьших квадратов непригоден для подбора "наилучшей" линии.
Если остатки распределяются так, как на рис. 8.15, то мы делаем вывод, что вариация у изменяется с изменениями х.
В нашем примере выделяются два значения остатка (-1,89 и 1,63). Они свидетельствуют, что данные не соответствуют предположениям о едином характере вариации. Следовательно, доверительный интервал, описанный в следующей части, не будет применим.
Остатки * k
• - у - у О
Ряс. 8.15. График остатков для данных, вариация которых не является постоянной для всех значений х
Единственным способом продолжать статистический анализ доверительных интервалов и испытание гипотез в таком случае является трансформация данных (часто используются логарифмы значений х) до тех пор, пока график остатков не покажет случайное рассеяние точек относительно е = 0 при небольших значениях остатков.
Оценка устойчивости и колеблемости линейной модели регрессии может быть длительной процедурой, особенно если ряд данных увеличивается не постоянно, а с замедлением. Существует множество ППП для статистической обработки. Может показаться, что дело обстоит просто: нужно собрать данные и ввести их в компьютер. Программа рассчитывает линейную модель, не обращая внимание на то, годится она или нет. В следующем разделе мы рассмотрим, как установить и оценить линейную регрессионную модель.
|
|
256 4.2. Анализ данных как составная часть принятия решений
СТАТИСТИЧЕСКИЙ ВЫВОД В АНАЛИЗЕ ЛИНЕЙНОЙ РЕГРЕССИИ