Проверьте данные на наличие структурного сдвига при помощи теста Чоу

Используя критерий Г. Чоу, выясним, можно ли считать одной и той же линейную регрессию для компаний с руководителями мужчинами и женщинами.

По 13 наблюдениям для компаний, руководителями которых являются мужчины, построим уравнение регрессии от факторов х2 и х3. Исходные данные представлены в таблице 8.3.4.

Таблица 8.3.4 – Исходные данные для построения модели по первой подвыборке (руководитель компании – мужчина)

№ п/п № предприятия y x2 x3
             
    0,9 18,9   1,365575 0,21676
    1,7 13,7 64,7 1,468945 0,053386
    0,7 18,5   1,226775 0,277492
    1,7 4,8 50,2 1,27922 0,177056
    2,6 21,8   1,84115 0,575853
    4,1     4,30495 0,042005
    1,6 20,1 85,6 1,679735 0,006358
    6,9 60,6   6,75635 0,020635
    1,9 18,9 42,7 1,363445 0,287891
    1,8     2,01095 0,0445
    1,9 11,9 59,3 1,413055 0,237115
    0,9 1,6   1,8217 0,849531
    1,3 8,6 70,7 1,46182 0,026186
Итого     311,4 1911,2 27,99367 2,814768

Результаты регрессионного анализа представлены в таблице 8.3.5.

Таблица 8.3.5 – Вывод итогов регрессионного анализа по первой подвыборке

ВЫВОД ИТОГОВ              
                 
Регрессионная статистика              
Множественный R 0,957031              
R-квадрат 0,915908              
Нормированный R-квадрат 0,899089              
Стандартная ошибка 0,530543              
Наблюдения                
                 
Дисперсионный анализ            
  df SS MS F Значимость F      
Регрессия   30,65755 15,32877 54,45856 4,21E-06      
Остаток   2,814759 0,281476          
Итого   33,47231            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 0,875936 0,202874 4,317628 0,001519 0,423904 1,327968 0,423904 1,327968
b1 0,009754 0,008027 1,215131 0,252226 -0,00813 0,027639 -0,00813 0,027639
b2 0,007103 0,001083 6,560521 6,39E-05 0,004691 0,009516 0,004691 0,009516

Уравнение примет вид: . Расчетные значения по нему представлены в таблице 8.3.5, графа 6.

Построим модель регрессии по 12 предприятиям руководителями, которых являются женщины (исходные данные представлены в таблице 8.3.6).

Таблица 8.3.6 – Исходные данные для построения модели для второй подвыборке (руководитель компании – женщина)

№ п.п. № предприятия y x2 x3
             
    1,3 5,8 96,6 0,8956 0,16354
    0,4 1,4 4,1 1,081 0,46376
    1,3   26,8 1,4992 0,03968
    1,9 13,2 61,8 1,726 0,03028
    1,4 12,6   0,7744 0,39138
    0,4 12,2   1,3828 0,9659
    0,8 3,2 33,5 1,0558 0,06543
    0,9 6,9   0,9916 0,00839
    1,1     1,408 0,09486
      11,5 65,4 1,5616 0,19219
    0,6 1,9 23,1 1,009 0,16728
    0,7 5,8 80,8 0,9904 0,08433
Итого 12,8 - - 14,3754 2,66702

Результаты регрессионного анализа представлены в таблице 8.3.7.

Таблица 8.3.7 – Вывод итогов регрессионного анализа по второй подвыборке

ВЫВОД ИТОГОВ              
                 
Регрессионная статистика              
Множественный R 0,390218              
R-квадрат 0,15227              
Нормированный R-квадрат -0,01728              
Стандартная ошибка 0,74669              
Наблюдения                
                 
Дисперсионный анализ            
  df SS MS F Значимость F      
Регрессия   1,00147 0,500735 0,898106 0,437811      
Остаток   5,575453 0,557545          
Итого   6,576923            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 0,988419 0,418744 2,360437 0,039923 0,055399 1,921439 0,055399 1,921439
x2 0,084052 0,064939 1,294327 0,224643 -0,06064 0,228745 -0,06064 0,228745
x3 -0,00587 0,0051 -1,15176 0,276212 -0,01724 0,005489 -0,01724 0,005489

Модель регрессии примет вид: . Теоретические значения по уравнению представлены в графе 6 таблицы 8.3.6.

По всем 25 предприятиям (таблица 8.3.8) рассчитаем уравнение регрессии для объединенной выборки.

Результаты регрессионного анализа представлены в таблице 8.3.9.

Таблица 8.3.8 – Исходные данные для построения объединенной модели с фиктивными переменными

№ предприятия y x2 x3
           
  0,9
18,9
 
1,235157 0,11233
  1,7 13,7 64,7 1,27426 0,181255
  0,7 18,5   1,109561 0,16774
  1,7 4,8 50,2 1,01988 0,462563
  2,6 21,8   1,680633 0,845236
  1,3 5,8 96,6 1,327026 0,00073
  4,1     4,604089 0,254106
  1,6 20,1 85,6 1,522348 0,00603
  6,9 60,6   6,372157 0,278618
  0,4 1,4 4,1 0,670333 0,07308
  1,3   26,8 0,93331 0,134462
  1,9 18,9 42,7 1,23329 0,444502
  1,9 13,2 61,8 1,246994 0,426417
  1,4 12,6   2,170471 0,593626
  0,4 12,2   1,497339 1,204153
  0,8 3,2 33,5 0,886461 0,007476
  1,8     1,742309 0,003328
  0,9 6,9   1,343583 0,196765
  1,1     1,766755 0,444562
  1,9 11,9 59,3 1,20746 0,479612
  0,9 1,6   1,463594 0,317638
  1,3 8,6 70,7 1,217522 0,006803
    11,5 65,4 1,238036 0,580589
  0,6 1,9 23,1 0,797774 0,039114
  0,7 5,8 80,8 1,228719 0,279543
Итого 40,8 408,9 2856,3 40,78906 7,540277

Модель примет вид: . Теоретические значения по данной модели представлены в графе 5 таблицы 8.3.8.

Таблица 8.3.9 – Вывод итогов регрессионного анализа по всей совокупности

ВЫВОД ИТОГОВ              
                 
Регрессионная статистика              
Множественный R 0,910236              
R-квадрат 0,82853              
Нормированный R-квадрат 0,812942              
Стандартная ошибка 0,58544              
Наблюдения                
                 
Дисперсионный анализ            
  df SS MS F Значимость F      
Регрессия   36,43413 18,21706 53,15132 3,77E-09      
Остаток   7,540272 0,34274          
Итого   43,9744            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение 0,619445 0,154174 4,017831 0,000577 0,299708 0,939182 0,299708 0,939182
b1 0,018445 0,0082 2,249314 0,034833 0,001439 0,035451 0,001439 0,035451
b2 0,006222 0,00114 5,457397 1,75E-05 0,003858 0,008586 0,003858 0,008586

Рассчитываем F- критерий по формуле:

,

где - сумма квадратов отклонений фактических значений результативного признака от теоретических для объединенной выборки (таблица 8.3.8, итог графы 6);

- сумма квадратов отклонений фактических значений результативного признака от расчетных для первой подвыборки (таблица 8.3.4, итог графы 7);

- сумма квадратов отклонений фактических значений результативного признака от расчетных для второй подвыборки (таблица 8.3.6, итог графы 7).

Табличное значение критерия Фишера составило 3,127. Так как расчетное значение критерия меньше табличного, то влияние фактора «пол» несущественно, и в качестве оценки регрессионной модели можно рассматривать уравнение регрессии, полученное по объединенной выборке.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: