Этап. Верификация модели

Пригодность построенной модели или ее верификация, а также

качество оценивания регрессии может быть проверено двумя равноценными

способами: дисперсионным анализом в регрессии и с использованием

элементов теории корреляции.

а) Дисперсионный анализ в регрессии

Суть метода заключается в разложении общей суммарной дисперсии премий и вознаграждений на составляющие, обусловленные действием производительности труда, и остаточную дисперсию, обусловленную ошибкой или всеми неучтенными в данной модели переменными. Для проверки гипотезы о равенстве таких дисперсий используется критерий Фишера (F -критерий). Поскольку для оценок дисперсий используются суммы квадратов SS отклонений значений данной переменной от ее средней величины, то можно говорить о разложении общей суммы квадратов SSобщ. на составляющие. Найдем эти суммы. Сначала вычислим среднее значение зависимой переменной:

тыс. руб. – средняя сумма премий и вознаграждений в течение наблюдаемого периода.

Для расчета сумм квадратов составим третью таблицу:

  0,689625 0,580375004 0,336835145 0,1225 0,053072642
  0,89067 0,68933047 0,475176496 0,4356 0,000860276
  0,535399 0,144600948 0,020909434 0,0576 0,147917889
  1,065551 -0,205550735 0,042251104 0,0036 0,021185016
  1,588817 0,39118267 0,153023881 1,1236 0,447316621
  0,693756 -0,363756048 0,132318463 0,3481 0,051186326
  0,695133 -0,245133066 0,06009022 0,2209 0,050565138
  0,494089 0,245911468 0,06047245 0,0324 0,181400579
  1,155057 -1,125056863 1,265752944 0,7921 0,055251729
  0,898932 0,091068366 0,008293447 0,0049 0,000443876
  0,295798 -0,055798032 0,00311342 0,4624 0,389628097
  0,667593 -0,097592719 0,009524339 0,1225 0,063709436
  1,207384 0,012616478 0,000159176 0,09 0,082589289
  0,828704 -0,148703749 0,022112805 0,0576 0,008335005
  0,98293 0,017070307 0,000291395 0,0064 0,003960146
  0,739198 0,070802379 0,005012977 0,0121 0,0326895
  1,298267 -0,028266668 0,000799005 0,1225 0,143085672
  1,017355 0,122644873 0,015041765 0,0484 0,009478021
  1,603965 0,286035479 0,081816295 0,9409 0,467807466
  1,051781 -0,381780561 0,145756397 0,0625 0,017366116
сумма 18,4   2,838751159 5,0666 2,227848841
      SS ост ↑ SS общ ↑ SS R ↑
      R min ↑ 5,0666  

- величина, характеризующая разброс

Значений относительно среднего значения . Разобьем эту сумму на две

части: объясненную регрессионным уравнением и не объясненную (т.е.

связанную с ошибками e i):

– сумма квадратов, объясненная регрессией,

– остаточная сумма квадратов, обусловленная ошибкой.

Проверка: SSобщ=SS R+SSост =2,2278+2,83875=5,0666 (верно).

Найдем коэффициент детерминации, или долей объясненной дисперсии

y, называется

Значение коэффициента детерминации близко к 0. Это означает, 43,97%

линейная регрессия y на x объясняет дисперсию y, т.е. 43,97% общей

вариации премий и вознаграждений объясняется производительностью труда. При этом остальные 56,03 % приходятся на долю прочих факторов, не учтенных в уравнении регрессии. Например, к этим факторам можно отнести: особую организационную систему премирования, качественное и оперативное выполнение важных заданий, поручений своевременное, добросовестное, качественное выполнение трудовых обязанностей.

Далее при заданном уровне значимости a =0,05 проверяем гипотезу об

отсутствии линейной функциональной связи между x и y H 0: b =0,

используя статистику критерия Фишера:

Число степеней свободы (1, n-2). MS R и MS ост обозначены средние квадраты, которые дают несмещенные оценки соответствующих теоретических дисперсий.

F кр = F(,1,20-2)=4,41

Составим четвертую вспомогательную таблицу:

Источник дисперсии Число степ. свободы Сумма квадратов SS Средний квадрат MS Критерий Фишера Fо Критическая точка F кр Гипотеза Ho: b=0
             
Регрессор   2,227848841 2,227848841 14,1263805 4,413873419 Отклонить
x            
Ошибка (остаток)   2,838751159 0,157708398      
Итог (общая дисперс.)   5,0666        

Критическая область правосторонняя:

Если при заданном уровне значимости a =0,05 наблюдаемое значение F -

статистики больше критической точки F > Fкр, т.е. 14,1263 > 4,41. Гипотеза

H 0: b =0 отвергается, то есть линейная связь между x и y есть, и результаты

наблюдений не противоречат предположению о ее линейности. Полученную

модель =0.1377x-0.2247в целом можно считать пригодной для

дальнейшего использования.

б) Использование элементов теории корреляции

Другой способ верификации линейной модели состоит в использовании элементов теории корреляции. Мерой линейной связи двух величин является коэффициент корреляции:

Проверка (верно).

Значение коэффициента корреляции 0,6631 говорит о том, что линейная связь между производительностью труда и премиями и вознаграждениями средняя, т.е. рост производительности труда приводит к увеличению премий и вознаграждений.

Проверяем гипотезу об отсутствии линейной связи между x и y с помощью критерия Стьюдента

Критическая область двухсторонняя:

С вероятностью 0,95 гипотезу отвергаем, так как , т.е.

3.7585 > 2,101. Это означает, что коэффициент корреляции статистически

значим.

в) средняя ошибка аппроксимации

Составим вспомогательную таблицу:

1,27 0,689625 0,580375004 0,456988
1,58 0,8906695 0,68933047 0,436285
0,68 0,5353991 0,144600948 0,212648
0,86 1,0655507 -0,205550735 0,239012
1,98 1,5888173 0,39118267 0,197567
0,33 0,693756 -0,363756048 1,102291
0,45 0,6951331 -0,245133066 0,54474
0,74 0,4940885 0,245911468 0,332313
0,03 1,1550569 -1,125056863 37,5019
0,99 0,8989316 0,091068366 0,091988
0,24 0,295798 -0,055798032 0,232492
0,57 0,6675927 -0,097592719 0,171215
1,22 1,2073835 0,012616478 0,010341
0,68 0,8287037 -0,148703749 0,218682
  0,9829297 0,017070307 0,01707
0,81 0,7391976 0,070802379 0,08741
1,27 1,2982667 -0,028266668 0,022257
1,14 1,0173551 0,122644873 0,107583
1,89 1,6039645 0,286035479 0,151342
0,67 1,0517806 -0,381780561 0,569822
    Сумма 42,70394

A = %>7% это свидетельствует о плохом подборе линейной модели к исходным данным.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: