Чтобы определить правильность подбора формул уравнения рассчитывают коэффициент детерминации.
К.д.- является одной из наиболее эффективных оценок адекватности регрессионной модели, мерой качества подгонки регрессионной модели к наблюдаемым значениям.
Компоненты дисперсии:
1. Регрессия; сумма квадратов- значок суммы(уi(с кр)-у(ср.) 2 , число степеней свободы (m-1), средние квадраты S2 объяснённая регрессия= значок суммы(уi(с кр)-у(ср.) 2 / m-1
2. Остаток; сумма квадратов - значок суммы(уi(с кр)-у)2 ;число степеней свободы (n-m), средние квадраты S2 остаточная=…
3. Общая; сумма квадратов- значок суммы(уi)-у(ср.) 2; число степеней свободы (n-1), S2 общая=…
В последнем столбце таблицы представлены несмещённые оценки зависимой переменной, m-число оцениваемых параметров уравнения регрессии, n- число наблюдений. В случае линейной парной регрессии, m=2, т.к у(с кр.)=a+bx содержит два параметра a и b.
Коэффициент детерминации показывает долю дисперсии результативного признака, объясненную регрессией в общей доле дисперсии результативного признака. Обозначается
R2= значок суммы(уi(с кр)-у(ср.) 2/ значок суммы(уi)-у(ср.) 2
В случае линейной парной регрессии R2=r2
0<= R2<=1, чем ближе R2 к 1, тем более адекватно построенная модель к исходным данным. Чем ближе R2 к 0, тем больше несоответствие между реальными наблюдениями и построенной моделью.
Основная формула дисперсионного анализа.
значок суммы(уi(с кр)-у(ср.) 2+ значок суммы(уi(с кр)-у)2= значок суммы(уi)-у(ср.) 2
Оценка значимости уравнения регрессии и параметров линейной регрессии, корреляции (критерий Фишера, Стьюдента).
Оценить значимость уравнения регрессии означает установить соответствует ли математическая модель выражающая зависимость между переменными экспериментальным данным и выявить, достаточно ли включённых в уравнения объясняющих переменных для описания зависимой переменной.
Проверка значимости уравнения регрессии проводится с помощью дисперсионного анализа. Для того, чтобы применить критерий Фишера выдвигают гипотезу H0=(коэффициент регрессии =0, фактор х не оказывает влияния на у).
Для того, чтобы потвердить или опровергнуть эту гипотезу рассчитываем F расчётное=S2 регресии/S2остатков= значок суммы(уi(с кр)-у(ср.) 2 (n-m)/ значок суммы(уi(с кр)-у)2 (m-1)
Fрасч.линей.=r2(n-m)/1-r2 для линейной модели
Затем по таблице приложений смотрим табличное значение F табл.
F табл. – это максимально возможное значение критерия при заданном уровне значимости альфа и числе степеней свободы.
Уровень значимости (альфа)- это вероятность допустить ошибку первого рода, т.е вероятность отвергнуть правильную гипотезу.
Чаще всего альфа=0,05, а также альфа 0, 01.
Число степеней свободы для F критерия определяется по формуле k1=m-1, K2=n-m.
Fтабл. смотрим по таблице приложения(1)
Если, F расч> Fтабл, то гипотеза H0 отклоняется, уравнение признаётся значимым и надёжным. Если F расч< Fтабл, то гипотеза H0 принимается, фактор х не оказывает влияния на у, уравнение не значимо не надёжно.
Оценка значимости коэффициентов регрессии (a и b), и коэффициентов корреляции (r).
Проверить значимость коэффициентов a, b и r, можно с помощью t-критерия Стьюдента.
Выдвигается гипотеза H0(коэффициент b(либо a,r) сформирован случайно. Чтобы подтвердить или опровергнуть данную гипотезу рассчитывается расчетное значение ta,tb,tr по формулам.
ta=a/ma
tb=b/mb
tr=r/mr
Табличное значение критерия, смотрим по табл. Приложения при альфа=0,05,и числе степеней свободы k=n-m(приложение 2)
Если tрасч.>tтабл, то гипотеза H0 отклоняется, значит коэффициенты неслучайно отличаются от 0 и сформированы под воздействием фактора х.
Если tрасч.<tтабл, то гипотеза H0 принимается, коэффициенты a,b,r - случайно отличаются от 0 и фактор х не влияет на их формирование.
Геометрическая интерпретация регрессии.
Пусть число наблюдений n=3, тогда у1,у2,у3 – значение зависимой переменной, х1,х2,х3- значение объесняющей переменной. Рассмотрим 3-х мерное пространство с осями координат 1, 2, 3. Рассмотрим в этом пространстве вектор
У(вектор)(у1,у2,у3)
Х(вектор)( х1,х2,х3)
S(вектор)(1,1,1)
Тогда у1(с кр), у2(с кр.),у3(с кр) можно представить, как линейную комбинацию S(вектор) и Х(вектор).
У(с кр)=a=bx
Записываем в столбец (у1(с кр), у2(с кр.),у3(с кр))=а*столбец (1,1,1)+b* столбец(х1,х2,х3)
У(с кр.)=а*S(вектор)+b*X(вектор)
Из векторной алгебры известно, что у(с кр. И вектор) будет лежать в плоскости П.Разница ei=yi(c кр.)-yi будет минимальной, если вектор у(с кр.) расположен перпендикулярно плоскости П.
Тогда, вектор e перпендикулярен S(вектору), вектор e перпендикулярен вектору Х.
Векторы перпендикулярны, если их скалярное произведение равно 0.
В результате мы получим те же условия из которых находятся «наилучшие» оценки a, b методом наименьших квадратов.
Аналогично можно получить результаты при n>3, но геометрически показать это не получится.