Коэффициент детерминации и его значение. Проверка гипотез, относящихся к оценке адекватности регрессионной модели в целом

Отношение объясненной части дисперсии переменной (у) к общей дисперсии называют коэффициентом детерминации и используют для характеристики качества уравнения регрессии или соответствующей модели связи. Соотношение между объясненной и необъясненной частями общей дисперсии можно представить в альтернативном варианте:

Коэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0≤ R2 ≤1. Коэффициент детерминации R2показывает, какая часть дисперсии результативного признака (y) объяснена уравнением регрессии. Чем больше R2, тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. При отсутствии зависимости между (у) и (x) коэффициент детерминации R2 будет близок к нулю. Таким образом, коэффициент детерминации R2 может применяться для оценки качества (точности) уравнения регрессии. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1.0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных).

Чтобы проверить достаточно ли высока степень адаптации модели, необходимо проверить гипотезу о значимости R2:

1. Выдвигаются 2 противополож. гипотезы о коэффиценте ДЕТЕРМИНАЦИИ.

а)Но-истинность которой проверяется: Но: R2=0

б)альтернативная гипотеза: Н1: R2не равно 0

2. Рассчитаем R2, для этого вычисли суммы: Sфакт. =

Sобщ. = =>R2= Sфакт./Sобщ.

3. Вычислим выборочное значение проверочной статистики:

4. Зададим уровень значимости альфа и по таблице распределения Фишера установим критическое значение: Fкр (альфа, К1;К2), К1=м, К2=n-m-1

Применим решающее правило: Если Выборочное значение меньше критического

, то нулевую гипотезу принимаем на уровне значимости альфа (коэффициент детерминации не существенно отличается от нуля), если же Выборочное значение больше критического, то нулевую гипотезу отклоняем в пользу альтернативной на уровне значимости альфа (т.е.R2 имеет существенное значение и модель регрессии в целом значима на уровне значимости альфа, т.е. хорошо адаптирована к данным наблюдений).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: