Расчет средней ошибки аппроксимации

Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии т.е у и ỹх. Чем меньше это отличие, тем ближе теоретические значения подходят к эмпирическим данным, это лучшее качество модели. Величина отклонений фактических и расчетных значений результативного признака(y-ỹх) по каждому наблюдению представляет собой ошибку аппроксимации. Их число соответствует объему совокупности. В отдельных случаях ошибка аппроксимации может оказаться равной нулю. Для сравнения используются величины отклонений, выраженные в процентах к фактическим значениям.

Поскольку (y-ỹх) может быть как величиной положительной так и отрицательной, то ошибки аппроксимации для каждого наблюдения принято определять в процентах по модулю.

Отклонения (y-ỹх) можно рассматривать как абсолютную ошибку аппроксимации, а

как относительную ошибку аппроксимации. Что б иметь общее суждение о качестве модели из относительных отклонений по каждому наблюдению, определяют среднюю ошибку аппроксимации как среднюю арифметическую простую:

18. Анализ вариации зависимой переменной в регрессии

После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Оценка значимости уравнения регрессии в целом дается с помощью F-критерия Фишера. При этом выдвигается нулевая гипотеза, что коэффициент регрессии равен нулю, т. е. b= 0, и, следовательно, фактор х не оказывает влияния на результат у.

Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложение общей суммы квадратов отклонений переменной у от среднего значения у на две части – «объясненную» и «необъясненную».

+ ,

TSS RSS ESS

где TSS – общая сумма квадратов отклонений;

RSS – сумма квадратов отклонений, объясненная регрессией;

ESS – остаточная сумма квадратов отклонений.

Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы. Если фактор не оказывает влияния на результат, то линия регрессии на графике параллельна оси ОХ и среднее значение у равно оценке (). Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной (TSS=ESS). Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю (ESS). В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов (TSS=RSS).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: