· Теснота связи между фактором и откликом. Для этой цели служит коэффициент корреляции r_{xy, rxy∈[−1,1]. Отрицательное значение rxy означает, что увеличение фактора приводит к уменьшению отклика и наоборот.
· Доля вариации отклика y, объясненная полученным уравнением регрессии характеризуется коэффициентом детерминации R2,R2∈[0,1].
6)Проверка статистической значимости уравнения регрессии.. На этом этапе производится оценка достаточно ли велик R2, чтобы говорить о существовании значимой связи между величинами x и y. Для этого рассчитывается значение F-критерия Фишера. В качестве нулевой гипотезы H0 берется предположение о равенстве 0 всех коэффициентов регрессии. Если F>F∗крит^, то H0 отвергается, иначе принимается. F∗крит^ берется из таблиц для заданного уровня значимости.
7)Характеристика оценок коэффициентов уравнения регрессии. Вычисляем стандартные ошибки - это оценка среднеквадратического отклонения дисперсии случайной величины от ее истинного значения: sb=∑e2i(n−1)∑(xi−x¯)−−−−−−−√. Сравнивая значение коэффициента с его стандартной ошибкой sb, можно судить о значимости коэффициента. Коэффициент называется значимым, если есть достаточно высокая вероятность того, что его истинное значение отлично от нуля. Для стандартных ошибок нет таблиц критических уровней, поэтому используется t-статистика.
|
|
8)Построение доверительных интервалов. На этом этапе строится интервал, в который попадет значение с заданной вероятностью.
9)Проверка статистической значимости коэффициентов регрессии. В качестве H0 берется предположение, что коэффициент равен 0. Для ее проверки рассчитывается t-статистика: tb=bsb. Если |t|<tγ(n−1) – гипотеза Н0 не отвергается, т.е. выбранная переменная никакого влияния на отклик не оказывает, соответственно переменная не значима.
Оценка параметров множественной регрессии
· Несмещенность - математическое ожидание остатков равно 0
· Состоятельность - увеличение точности оценок с увеличением выборки
· Эффективность - оценки характеризуются наименьшей дисперсией.
Исследование остатков.
1 случайный характер остатков
2 нулевая средняя величина остатков, не зависящая от xi
3 дисперсия каждого отклонения εi одинакова для всех значений x.
4 отсутствие автокорреляции остатков. Значения остатков распределены независимо друг от друга.
Возможные причины:
· неверно выбрана функция регрессии
· имеется неучтенная объясняющая переменная (переменные)
5 остатки подчиняются нормальному распределению