Исследование регрессионной модели

· Теснота связи между фактором и откликом. Для этой цели служит коэффициент корреляции r_{xy, rxy∈[−1,1]. Отрицательное значение rxy означает, что увеличение фактора приводит к уменьшению отклика и наоборот.

· Доля вариации отклика y, объясненная полученным уравнением регрессии характеризуется коэффициентом детерминации R2,R2∈[0,1].

6)Проверка статистической значимости уравнения регрессии.. На этом этапе производится оценка достаточно ли велик R2, чтобы говорить о существовании значимой связи между величинами x и y. Для этого рассчитывается значение F-критерия Фишера. В качестве нулевой гипотезы H0 берется предположение о равенстве 0 всех коэффициентов регрессии. Если F>F∗крит^, то H0 отвергается, иначе принимается. F∗крит^ берется из таблиц для заданного уровня значимости.

7)Характеристика оценок коэффициентов уравнения регрессии. Вычисляем стандартные ошибки - это оценка среднеквадратического отклонения дисперсии случайной величины от ее истинного значения: sb=∑e2i(n−1)∑(xi−x¯)−−−−−−−√. Сравнивая значение коэффициента с его стандартной ошибкой sb, можно судить о значимости коэффициента. Коэффициент называется значимым, если есть достаточно высокая вероятность того, что его истинное значение отлично от нуля. Для стандартных ошибок нет таблиц критических уровней, поэтому используется t-статистика.

8)Построение доверительных интервалов. На этом этапе строится интервал, в который попадет значение с заданной вероятностью.

9)Проверка статистической значимости коэффициентов регрессии. В качестве H0 берется предположение, что коэффициент равен 0. Для ее проверки рассчитывается t-статистика: tb=bsb. Если |t|<tγ(n−1) – гипотеза Н0 не отвергается, т.е. выбранная переменная никакого влияния на отклик не оказывает, соответственно переменная не значима.

Оценка параметров множественной регрессии

· Несмещенность - математическое ожидание остатков равно 0

· Состоятельность - увеличение точности оценок с увеличением выборки

· Эффективность - оценки характеризуются наименьшей дисперсией.

Исследование остатков.

1 случайный характер остатков

2 нулевая средняя величина остатков, не зависящая от xi

3 дисперсия каждого отклонения εi одинакова для всех значений x.

4 отсутствие автокорреляции остатков. Значения остатков распределены независимо друг от друга.

Возможные причины:

· неверно выбрана функция регрессии

· имеется неучтенная объясняющая переменная (переменные)

5 остатки подчиняются нормальному распределению


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: