Ты регрессии и корреляции незначимы

Однако, если нулевая гипотеза определяет некоторое ненулевое значение величины а₁, то необходимо использовать более общее выражение:

t = (а₁ – а⁰) / σ_а1, (3.12)

где а⁰ некоторое ненулевое значение величины а₁, принимаемое в качестве нулевой гипотезы.

Для проверки адекватности уравнения в целом применяют F-тест, с помощью которого оценивают статистическую значимость и надежность оцениваемых характеристик уравнения регрессии. При этом рассчитывается

F _факт. как отношение значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.

(d_{f 1} = m = p - 1 и d_{f 2} = n – m - 1 = n – p):

F _факт. = r²_xy* (n-2); F _факт = n - p _* S ²_факт.

1 - r²_xy p - 1 S²_ост_.

, (3. 13)

где p -число параметров модели.

Так как 1 ≤ F ≤ ∞, то при F _факт < 1, следует рассматриватьвеличину 1/ F _факт _.

Примечание:Если использовать m -число факторов модели, то p = m + 1 и, тогда, необходимо умножить на _*(n – m - 1)/ m).

F _факт. можно также найти с помощью статистической функции ЛИНЕЙН - элемент (4, 1) в матрице результатов. F _факт. сравнивается с

F _табл. -табличное значение F - критерия Фишера при выбранном уров-

не значимости α и d_f₁ = p – 1,() d_f₂ = n – p () - степенях свободы.

Если F _факт. < F _табл.,то гипотеза H₀принимается и признается статистическая незначимость, ненадежность уравнения регрессии.

Если F _факт. > F _табл,то оцениваемые характеристики уравнения регрессии статистически значимы и надежны.

Для расчета доверительного интервала определяем предельную ошибку ∆ для каждого показателя:

∆ а₀ = t_табл.· Sа₀; ∆ а₁ = t_табл. · Sа_1,(3. 14)

Где

S а₁=S _ост_./ σ_x√n - 2, S_a0=S _ост/√п - 2, Sr =√ (1-r²)/(n-2)

S²ост. = Σ(Y – Ŷ)²/ n

Формулы для расчета доверительных интервалов имеют следующий вид:

а₀ ± ∆ а₀; а₁ ± ∆ а₁ (3. 15)

Если в границы доверительного интервала попадает 0,т.е. нижняя граница отрицательная, а верхняя положительная, то оцениваемый параметр прини -

мается нулевым, так как он не может одновременно принимать и положительные и отрицательные значения.

Прогнозное значение y_pнайдем, подставив в уравнение регрессии

у_х = а ₀+а₁ ·х

соответствующее (прогнозное) значениех_р.

Вычислим среднюю ошибку прогноза my_p:

my_p = σ_ост.. √1 + 1/ n +((x_p – x)²/ Σ(x_i – x)²) (3. 16)

Где

σ_ост.= √Σ(y – y _x)²/(n – (m – 1)); (3. 17)

тогдадоверительный интервал прогноза:

у_р ± ∆ у_р; где ∆ у_р = t_табл. mу_р_.(3. 18)

Пример2. Вернемся к предыдущему примеру1 и проверим адекватность пос-

троенной модели.Для этого найдем, используя вспомогательную таблицу 2:

Таблица 2.

у-у	(у- у)²	Ŷ- у	(Ŷ- у)²	у - ŷ	(у-Ŷ)²
-3.3	10.89	-2.7	7.29	-0.6	0.36
-2.3	5.29	-2.1	4.41	-0.2	0.04
-1.3	1.69	-1.5	2.25	0.2	0.04
-0.3	0.09	-0.9	0.81	0.6	0.36
-0.3	0.09	-0.3	0.09
0.7	0.49	0.3	0.09	0.4	0.16
0.7	0.49	0.9	0.81	-0.2	0.04
1.7	2.89	1.5	2.25	0.2	0.04
2.7	7.29	2.1	4.41	0.6	0.36
1.7	2.89	2.7	7.29	-1
Σ	32.1	-	29.7	-	2.4

Sост. =√Σ(у – ŷ)²/ n = √ 2.4/10 =0.49

σ_x = √ 38.5 – (5.5)² = 2.87

Тогда расчетные значения t - критерия равны:

t _β₀ = 4* √(10 – 2) / 0.49 = 23.1; t _β₁ = 0.6* (√(10 – 2) /0.49)* 2.87= 9.94

По таблице распределения Стьюдента для 10 – 2 = 8 степеней свободы и уровне значимости α = 0.05, найдем критическое значение t– критерия: t табличное равно 2.31.

Так как t расчетное больше t табличного, для каждого параметра, то оба параметра β₀ и β₁ значимы.

Вычислим коэффициент корреляции:

r _xy =(yx – y. x)/σ_xσ_y = ( 45.1 – 5.5*7.3)/2.87*1.792 = = 0.962.

так как σ_y = у² – (у)²= 56.5 – 7.3²=1.7917

Вывод: существует достаточно тесная связь между производительностью труда и стажем работы.

и коэффициент детерминации:

R² = 0,962*0,962 = 0,925

Вывод: 92,5% вариации у объясняется вариацией х.

Проверим значимость коэффициента корреляции используя критерий Стьюдента:

t = r * (n-2)/(1-r²) = 0,962 * (10 – 2)/ (1 – 0,925) = 9,93.

Вывод: Так как расчетное значение больше критического значения, то коэффициент корреляции значим.

Таким образом, построенная модель в целом адекватна, и выводы, полученные по результатам малой выборки, можно с достаточной вероятностью распространить на всю гипотетическую генеральную совокупность.

Из модели, следует, что возрастание на 1 год стажа рабочего приводит к увеличению им дневной выработкм в среднем на 0.6 изделия.

Вычислив коэффициент эластичности

Э = β₁ х / у = 0,6*5,5/ 7.3 = 0,45 сделаем вывод: с возрастанием стажа работы на 1% следует ожидать повышение производительности труда в среднем на 0,45%.

Анализируя остатки модели можно сделать ряд практических выводов, в частности определить наиболее передовых (наибольшие положительные остатки) и отстающих (наибольшие отрицательные остатки) рабочих.