Пригодность построенной модели или ее верификация, а также
качество оценивания регрессии может быть проверено двумя равноценными
способами: дисперсионным анализом в регрессии и с использованием
элементов теории корреляции.
а) Дисперсионный анализ в регрессии
Суть метода заключается в разложении общей суммарной дисперсии премий и вознаграждений на составляющие, обусловленные действием производительности труда, и остаточную дисперсию, обусловленную ошибкой или всеми неучтенными в данной модели переменными. Для проверки гипотезы о равенстве таких дисперсий используется критерий Фишера (F -критерий). Поскольку для оценок дисперсий используются суммы квадратов SS отклонений значений данной переменной от ее средней величины, то можно говорить о разложении общей суммы квадратов SSобщ. на составляющие. Найдем эти суммы. Сначала вычислим среднее значение зависимой переменной:
тыс. руб. – средняя сумма премий и вознаграждений в течение наблюдаемого периода.
Для расчета сумм квадратов составим третью таблицу:
|
|
№ | |||||
0,689625 | 0,580375004 | 0,336835145 | 0,1225 | 0,053072642 | |
0,89067 | 0,68933047 | 0,475176496 | 0,4356 | 0,000860276 | |
0,535399 | 0,144600948 | 0,020909434 | 0,0576 | 0,147917889 | |
1,065551 | -0,205550735 | 0,042251104 | 0,0036 | 0,021185016 | |
1,588817 | 0,39118267 | 0,153023881 | 1,1236 | 0,447316621 | |
0,693756 | -0,363756048 | 0,132318463 | 0,3481 | 0,051186326 | |
0,695133 | -0,245133066 | 0,06009022 | 0,2209 | 0,050565138 | |
0,494089 | 0,245911468 | 0,06047245 | 0,0324 | 0,181400579 | |
1,155057 | -1,125056863 | 1,265752944 | 0,7921 | 0,055251729 | |
0,898932 | 0,091068366 | 0,008293447 | 0,0049 | 0,000443876 | |
0,295798 | -0,055798032 | 0,00311342 | 0,4624 | 0,389628097 | |
0,667593 | -0,097592719 | 0,009524339 | 0,1225 | 0,063709436 | |
1,207384 | 0,012616478 | 0,000159176 | 0,09 | 0,082589289 | |
0,828704 | -0,148703749 | 0,022112805 | 0,0576 | 0,008335005 | |
0,98293 | 0,017070307 | 0,000291395 | 0,0064 | 0,003960146 | |
0,739198 | 0,070802379 | 0,005012977 | 0,0121 | 0,0326895 | |
1,298267 | -0,028266668 | 0,000799005 | 0,1225 | 0,143085672 | |
1,017355 | 0,122644873 | 0,015041765 | 0,0484 | 0,009478021 | |
1,603965 | 0,286035479 | 0,081816295 | 0,9409 | 0,467807466 | |
1,051781 | -0,381780561 | 0,145756397 | 0,0625 | 0,017366116 | |
сумма | 18,4 | 2,838751159 | 5,0666 | 2,227848841 | |
SS ост ↑ | SS общ ↑ | SS R ↑ | |||
R min ↑ | 5,0666 |
- величина, характеризующая разброс
Значений относительно среднего значения . Разобьем эту сумму на две
части: объясненную регрессионным уравнением и не объясненную (т.е.
связанную с ошибками e i):
– сумма квадратов, объясненная регрессией,
– остаточная сумма квадратов, обусловленная ошибкой.
Проверка: SSобщ=SS R+SSост =2,2278+2,83875=5,0666 (верно).
Найдем коэффициент детерминации, или долей объясненной дисперсии
y, называется
Значение коэффициента детерминации близко к 0. Это означает, 43,97%
линейная регрессия y на x объясняет дисперсию y, т.е. 43,97% общей
вариации премий и вознаграждений объясняется производительностью труда. При этом остальные 56,03 % приходятся на долю прочих факторов, не учтенных в уравнении регрессии. Например, к этим факторам можно отнести: особую организационную систему премирования, качественное и оперативное выполнение важных заданий, поручений своевременное, добросовестное, качественное выполнение трудовых обязанностей.
|
|
Далее при заданном уровне значимости a =0,05 проверяем гипотезу об
отсутствии линейной функциональной связи между x и y H 0: b =0,
используя статистику критерия Фишера:
Число степеней свободы (1, n-2). MS R и MS ост обозначены средние квадраты, которые дают несмещенные оценки соответствующих теоретических дисперсий.
F кр = F(,1,20-2)=4,41
Составим четвертую вспомогательную таблицу:
Источник дисперсии | Число степ. свободы | Сумма квадратов SS | Средний квадрат MS | Критерий Фишера Fо | Критическая точка F кр | Гипотеза Ho: b=0 |
Регрессор | 2,227848841 | 2,227848841 | 14,1263805 | 4,413873419 | Отклонить | |
x | ||||||
Ошибка (остаток) | 2,838751159 | 0,157708398 | ||||
Итог (общая дисперс.) | 5,0666 |
Критическая область правосторонняя:
Если при заданном уровне значимости a =0,05 наблюдаемое значение F -
статистики больше критической точки F > Fкр, т.е. 14,1263 > 4,41. Гипотеза
H 0: b =0 отвергается, то есть линейная связь между x и y есть, и результаты
наблюдений не противоречат предположению о ее линейности. Полученную
модель =0.1377x-0.2247в целом можно считать пригодной для
дальнейшего использования.
б) Использование элементов теории корреляции
Другой способ верификации линейной модели состоит в использовании элементов теории корреляции. Мерой линейной связи двух величин является коэффициент корреляции:
Проверка (верно).
Значение коэффициента корреляции 0,6631 говорит о том, что линейная связь между производительностью труда и премиями и вознаграждениями средняя, т.е. рост производительности труда приводит к увеличению премий и вознаграждений.
Проверяем гипотезу об отсутствии линейной связи между x и y с помощью критерия Стьюдента
Критическая область двухсторонняя:
С вероятностью 0,95 гипотезу отвергаем, так как , т.е.
3.7585 > 2,101. Это означает, что коэффициент корреляции статистически
значим.
в) средняя ошибка аппроксимации
Составим вспомогательную таблицу:
1,27 | 0,689625 | 0,580375004 | 0,456988 |
1,58 | 0,8906695 | 0,68933047 | 0,436285 |
0,68 | 0,5353991 | 0,144600948 | 0,212648 |
0,86 | 1,0655507 | -0,205550735 | 0,239012 |
1,98 | 1,5888173 | 0,39118267 | 0,197567 |
0,33 | 0,693756 | -0,363756048 | 1,102291 |
0,45 | 0,6951331 | -0,245133066 | 0,54474 |
0,74 | 0,4940885 | 0,245911468 | 0,332313 |
0,03 | 1,1550569 | -1,125056863 | 37,5019 |
0,99 | 0,8989316 | 0,091068366 | 0,091988 |
0,24 | 0,295798 | -0,055798032 | 0,232492 |
0,57 | 0,6675927 | -0,097592719 | 0,171215 |
1,22 | 1,2073835 | 0,012616478 | 0,010341 |
0,68 | 0,8287037 | -0,148703749 | 0,218682 |
0,9829297 | 0,017070307 | 0,01707 | |
0,81 | 0,7391976 | 0,070802379 | 0,08741 |
1,27 | 1,2982667 | -0,028266668 | 0,022257 |
1,14 | 1,0173551 | 0,122644873 | 0,107583 |
1,89 | 1,6039645 | 0,286035479 | 0,151342 |
0,67 | 1,0517806 | -0,381780561 | 0,569822 |
Сумма | 42,70394 |
A = %>7% это свидетельствует о плохом подборе линейной модели к исходным данным.