-коэф. Детерминации (r2xy)
-средняя ошибка аппроксимации (Ȃ)
-F-критерий Фишера
Коэффициент детерминации – обобщающий показатель оценки построенного уравнения регрессии. Показывает, какая часть вариации y обусловлена вариацией фактора x. Это положение опирается на правило сложения дисперсий: ∂ 2y общ = ∂ 2y фактор + ∂ 2 остаточ
∂ 2y общ - общая диспресия следствия или зависимой переменной y под влиянием всех факторов
∂ 2y фактор оценивает вариацию y от всех прочих факторов yx или независ.перемен. x
∂ 2y фактор / ∂ 2y общ – влияние фактора х в общем влиянии
Чем доля выше, тем большую часть Vy определеяет Vx – это общий смысл детерминации.
Коэф.корреляции - rxy = b*∂x/∂y
Шкала значений коэффициента корреляции:
· До 0,3 связь слабая
· 0,3-0,5 связь умеренная
· 0,5-0,7 связь заметная
· 0,7-0,9 связь высокая
· 0,9-1,0 связь весьма высокая, близкая к функциональной
Допустим r2xy = 0,85, тогда можно сделать вывод о том,что на 0,85 общая вариация y обусловлена вариацией x. На 85% доля расходов на питание (к примеру) обусловлена ср.зар.платой (тоже к примеру) и на 15% - прочими неучтенными факторами.
|
|
Чем ближе к r2xy 1, тем лучше (тем меньше доля остаточной функции)
8. Оценка соответствия ур-ия регрессии исходным данным на основе ср.ошибки апроксимацци
Фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии, т. е.y и ŷ.Чем меньше эти отличия, тем ближе теоретические значения к эмпирическим данным, тем лучше качество модели. Величина отклонений фактических и расчетных значений результативного признака (y-y^) по каждому наблюдению представляет собой ошибку аппроксимации. В отдельных случаях она может оказаться равной 0. Поскольку (y-y^) может быть величиной как положительной, так и отрицательной, ошибки аппроксимации для каждого наблюдения принято определять в процентах по модулю.
Коэф. Аппроксимации – степень соответствия модели исходным данным. Показ.на какую величину в среднем отклоняется каждое индивид.значение yфакт от своего теор. значения. Измеряется в %.
Она показывает близость фактических и расчетных значений, 5-7%-нормальная ошибка,свидетельствует о хорошем подборе модели к исходным данным.
n – число наблюдений
по модулю, так как отклонения бывают и с плюсом, и с минусом.
Когда ср.ошибка апр. меньше критической отметки в 10%, то построенная модель в целом соответ. исходным данным.
Чем значение меньше, тем модель является более качественной.
9. Оценка стат.значимости ур-ия регрессии (критерий Фишера)
Под “стат.значим” понимается достоверность модели, т.е. ее адекватность фактич.данным.
Принцип оценок: по математич.табл.определяют теор.значения критерия; по специальным формулам рассчит.критич.значения критериев и сопоставляют их. Это проверка 0-гипотезы (H0).
Если фактор>табл., то критерий параметра стат.значимый. Информации можно доверять и исп.для принятия решений и прогнозирования.
Факт.значение F-критерия опред.по след.ф-ле: Fфакт = [r2yx/1-r2yx]*(n-2)
Для нахожд.таблич.значения F-критерия нам нужно определить число степеней свободы K1 и K2 (по тблице)
Табличное значение F-критерия- это максимальная величина отношения дисперсий, которая может иметь место при случайном расхождении их для данного уровня вероятности наличия нулевой гипотезы.
|
|
Если K1=1, то K2=n-2
Математич. Таблицы основаны на т.вероятности, т.е.получ.рез-ты не явл.100% точными и поэтому обязательно устанавливается порог вероятности. К примеру, когда α =0,05, то рез-т гаранитируется на 95%. 5% риск того,что рез-ты недостоверны.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.
2. Далее определяют фактическое значение F-критерия:
где m=1 для парной регрессии.
3. Табличное значение определяется по таблицам распределения Фишера для заданного уровня значимости, принимая во внимание, что число степеней свободы для общей суммы квадратов (большей дисперсии) равно 1 и число степеней свободы остаточной суммы квадратов (меньшей дисперсии) при линейной регрессии равно n-2.
4. Если фактическое значение F-критерия меньше табличного, то говорят, что нет основания отклонять нулевую гипотезу.
В противном случае, нулевая гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения в целом.
Допустим, табличное значение критерия со степенями свободы k1=1 и k2=5, Fkp = 6.61, а факт значение равно 5
Поскольку фактическое значение F < Fkp, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
10.Оценка стат.значимости параметров эконометрич.модели на основе кр.Стьюдента
t-критерий Стьюдента — общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.
Отношение коэф.регрессии к его стндарт.ошибке дает t-статистику,которая подчиняется статистике Стьюдента при (n-2) степенях свободы. Эта статистика применяется для проверки стат.значимости коэф.регрессии и для расчета его доверит интервалов.
Для оценки значимости коэф.регрессии его величину сравнивают с его стандарт. Ошибкой, т.е. определеяют факт.значение t-крит.Стьюдента:, которое затем сравнивают с табл.значением при опред.уровне
значимости α и числе степепеней свободы (n-2)
Seb - стандартная ошибка коэффициента регрессии
Если фактическое значение t критерия превышает табл., гипотезу о несущ. Коэф. Регрессии можно отклонить. Доверит.интервал для коэф.регрессии определяется как b плюс/минус t*mb