Временные ряды. Варианты индивидуальных заданий

Варианты индивидуальных заданий

Задача 1. По территориям региона приводятся данные за 199X г. (см. таблицу своего варианта).

Требуется:

1. Построить линейное уравнение парной регрессии от .

2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.

3. Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.

4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.

5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

6. На одном графике построить исходные данные и теоретическую прямую.

Вариант 4

Номер региона Среднедушевой прожиточный минимум в день одного трудоспособного, руб., Среднедневная заработная плата, руб.,
     
     
     
     
     
     
     
     
     
     
     
     

1.Рассчитаем параметры уравнения парной регрессии

y^=a+b*x для этого воспользуемся формулой

a= -b* , b=

cov(x,y)= - * , -

Получим b = = = =0,900682

a= -b* =64,20747

  x y x*y x^2 y^2 yшляпа
            138,9641
            143,4675
            131,7586
            144,3681
            140,7654
            135,3613
            137,1627
            151,5736
            135,3613
            145,2688
            139,8647
            165,0838
сумма            
сред знач 86,83333 142,4167 12447,25 7629,667 20399,92  
cov(x,y) 80,73611          
Q2x 89,63889          
b 0,900682          
a 64,20747          

2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.

rxy=b* = 0,900682* =0,786987

близость коэффициента корреляций к 1 указывает на тесную связь между признаками

коэффициент детерминаций rxy^2=0,619349

показывает, что уравнение регрессий объясняется 61,9 % дисперсий результативного признака, а на долю прочих факторов приходится 38,1%

3. Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.

F- критерия Фишера

F= *(n-2)=16,27075

t- критерий Стьюдента

= = 49883,45

mb= = = =6.81

ma=Sост* = * =223.34*805.87=179985.18

mr= = =0.19

фактические значения статистик

tb= = =0.132

ta= =0.00035

tr= =4.1

Табличное значение t критерия Стьюдента при а=0.05 и числе степеней свободы v=n-2=10,есть tтабл= 2.447. Так как tb<tтабл, ta<tтабл, tr>tтабл, то признаём статическую значимость параметров регрессий и показателя тесноты связи.

Средняя ошибка аппроксимаций

A= *100%=3.44

Говорит о хорошем качестве уравнения регрессий, т.е. свидетельствует о хорошем подборе модели к исходным данным.

4. Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.

xр=1.07*xср=1*86.8=92.8

yшлr=a+b*xr=64.02+0.9*92.8=147.54

Значит при заработной плате в 147.54 среднедушевой прожиточный минимум будет 92.8

5. Найдём доверительный интервал прогноза

MyшлR=Sост* + = + =234.5

  x y x*y x^2 y^2 yшляпа y-yшл (y-yшл)^2 A
            138,9641 -1,96405 3,857505 3,443935
            143,4675 -1,46746 2,153445  
            131,7586 -3,7586 14,12707  
            144,3681 -4,36814 19,08068  
            140,7654 -7,76542 60,3017  
            135,3613 17,63867 311,1228  
            137,1627 4,83731 23,39957  
            151,5736 2,426402 5,887428  
            135,3613 -3,36133 11,29851  
            145,2688 4,731174 22,38401  
            139,8647 -7,86474 61,85406  
            165,0838 0,916176 0,839378  
сумма           1002,718 706,2822 498834,5  
сред знач 86,83333 142,4167 12447,25 7629,667 20399,92 83,55982 58,85685 41569,54  
cov(x,y) 80,73611                
Q2x 89,63889 117,4097              
b 0,900682                
a 64,20747                
Q 9,467782 10,83558              
rxy 0,786987                
rxy^2 0,619349                
F 16,27075                
Sост^2 49883,45                

Множественная регрессия и корреляция

По 20 предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов (% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих (%) (смотри таблицу своего варианта).

Требуется:

1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.

3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

4. С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации .

5. С помощью частных -критериев Фишера оценить целесообразность включения в уравнение множественной регрессии фактора после и фактора после .

6. Составить уравнение линейной парной регрессии, оставив лишь один значащий фактор.

Вариант 4

Номер предприятия Номер предприятия
    3,5       6,3  
    3,6       6,5  
    3,9       7,2  
    4,1       7,5  
    4,2       7,9  
    4,5       8,2  
    5,3       8,4  
    5,5       8,6  
    5,6       9,5  
    6,1       9,6  
y x1 x2 yx1 yx2 x1x2 x1^2 x2^2 y^2
    3,5   24,5   31,5 12,25    
    3,6   25,2     12,96    
    3,9   27,3   46,8 15,21    
    4,1   28,7   69,7 16,81    
    4,2   33,6   75,6 17,64    
    4,5       85,5 20,25    
    5,3   47,7   100,7 28,09    
    5,5   49,5     30,25    
    5,6       117,6 31,36    
    6,1       128,1 37,21    
    6,3       138,6 39,69    
    6,5         42,25    
    7,2   79,2   172,8 51,84    
    7,5       187,5 56,25    
    7,9   94,8   213,3 62,41    
    8,2   106,6     67,24    
    8,4   109,2   260,4 70,56    
    8,6   120,4   283,8 73,96    
    9,5       332,5 90,25    
    9,6       345,6 92,16    
сумма       1394,7     868,64    
средн зн 10,3 6,3 22,55 69,735 250,8 156,25 43,432 565,55 112,5

Найдем средние квадратические отклонения признаков:

Qy= - = =2.531

Qx1= - = 6,3^2=1,934

Qx2= - = =7,552

1. Вычисление параметров линейного уравнения множественной регрессии.

Для нахождения параметров линейного уравнения множественной регрессии

необходимо решить следующую систему линейных уравнений относительно неизвестных параметров , , :

либо воспользоваться готовыми формулами:

; ;

.

Рассчитаем сначала парные коэффициенты корреляции:

cov(y;x1)= - * = 69,735-10,3*6,3=4,845

cov(y;x2)= - * = 250,8-10,3*22,55=18,535

cov(x1;x2)= - * = 156,25-6,3*22,55=14,185

= = =0,989

= =0,969

= =0,971

Находим

= * =1,308* =1,101

= * =0,335* =0,047 =10,3-1,101*6,3-0,047*22,55=10,3-6,936-1,059=2,305

Таким образом, получили следующее уравнение множественной регрессии:

Yшл=2,305+1,101*x1+b2*x2

Коэффициенты и стандартизованного уравнения регрессии находятся по формулам:

B1=b1 =1,101* =0,841

B2=b2 =0,047* =0,140

Т.е. уравнение будет выглядеть следующим образом:

tшлY=0,841* +0,140*

Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что ввод в действие новых основных фондов оказывает большее влияние на выработку продукции, чем удельный вес рабочих высокой квалификации.

Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности:

.

Вычисляем:

=1,101* =0,67 =0,047* =0,10

Т.е. увеличение только основных фондов (от своего среднего значения) или только удельного веса рабочих высокой квалификации на 1% увеличивает в среднем выработку продукции на 0,67% или 0,10% соответственно. Таким образом, подтверждается большее влияние на результат фактора , чем фактора .

2. Коэффициенты парной корреляции мы уже нашли:

=0,989 0,969 0,971

Они указывают на весьма сильную связь каждого фактора с результатом, а также высокую межфакторную зависимость (факторы и явно коллинеарны, т.к 0,971>0,7). При такой сильной межфакторной зависимости рекомендуется один из факторов исключить из рассмотрения.

Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при элиминировании (устранении влияния) других факторов, включенных в уравнение регрессии.

При двух факторах частные коэффициенты корреляции рассчитываются следующим образом:

= = =3,42

= = =0,258

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.

Коэффициент множественной корреляции определить через матрицу парных коэффициентов корреляции:

,

где

– определитель матрицы парных коэффициентов корреляции;

– определитель матрицы межфакторной корреляции.

= =1

= =0,057

Коэффициент множественной корреляции

= = 0,996

Нескорректированный коэффициент множественной детерминации

3. =0,988 оценивает долю вариации результата за счет представленных в уравнении факторов в общей вариации результата. Здесь эта доля составляет 98,8% и указывает на весьма высокую степень обусловленности вариации результата вариацией факторов, иными словами – на весьма тесную связь факторов с результатом.

Скорректированный коэффициент множественной детерминации

= 1 – (1- ) =1 – (1 – 0,988) =0,987

определяет тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает такую оценку тесноты связи, которая не зависит от числа факторов и поэтому может сравниваться по разным моделям с разным числом факторов. Оба коэффициента указывают на весьма высокую (более 98%) детерминированность результата в модели факторами и .

2.

Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает -критерий Фишера:

.

В нашем случае фактическое значение -критерия Фишера:

= * =645,34

Получили, что > (при ), т.е. вероятность случайно получить такое значение -критерия не превышает допустимый уровень значимости . Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи .

4. С помощью частных -критериев Фишера оценим целесообразность включения в уравнение множественной регрессии фактора после и фактора после при помощи формул:

;

.

Найдем и

=0,989^2=0,978

=0,969^2=0,938

Имеем

= * =19,295

= * =1,368

Получили, что . Следовательно, включение в модель фактора после того, как в модель включен фактор статистически нецелесообразно: прирост факторной дисперсии за счет дополнительного признака оказывается незначительным, несущественным; фактор включать в уравнение после фактора не следует.

Если поменять первоначальный порядок включения факторов в модель и рассмотреть вариант включения после , то результат расчета частного -критерия для будет иным. , т.е. вероятность его случайного формирования меньше принятого стандарта . Следовательно, значение частного -критерия для дополнительно включенного фактора не случайно, является статистически значимым, надежным, достоверным: прирост факторной дисперсии за счет дополнительного фактора является существенным. Фактор должен присутствовать в уравнении, в том числе в варианте, когда он дополнительно включается после фактора .

5. Общий вывод состоит в том, что множественная модель с факторами и с =0,988 содержит неинформативный фактор . Если исключить фактор , то можно ограничиться уравнением парной регрессии:

=0,978

Временные ряды

Требуется:

1. Построить автокорреляционную функцию и сделать вывод о наличии сезонных колебаний.

2. Построить аддитивную модель временного ряда (для нечетных вариантов) или мультипликативную модель временного ряда (для четных вариантов).

3. Сделать прогноз на 2 квартала вперед.

Варианты 3, 4

  5,5   8,0
  4,6   5,6
  5,0   6,4
  9,2   10,9
  7,1   9,1
  5,1   6,4
  5,9   7,2
  10,0   11,0
  t yt yt-1 yt-yшл1 yt-1-yшл2 d1*e1 (yt-yшл1)^2 (yt-1-yшл2)^2  
    5,5 - - - - - -  
    4,6 5,5 -2,7125 -1,56667 4,249583 7,357656 2,454444  
      4,6 -2,3125 -2,46667 5,704167 5,347656 6,084444  
    9,2   1,8875 -2,06667 -3,90083 3,562656 4,271111  
    7,1 9,2 -0,2125 2,133333 -0,45333 0,045156 4,551111  
    5,1 7,1 -2,2125 0,033333 -0,07375 4,895156 0,001111  
    5,9 5,1 -1,4125 -1,96667 2,777917 1,995156 3,867778  
      5,9 2,6875 -1,16667 -3,13542 7,222656 1,361111  
        0,6875 2,933333 2,016667 0,472656 8,604444  
    5,6   -1,7125 0,933333 -1,59833 2,932656 0,871111  
    6,4 5,6 -0,9125 -1,46667 1,338333 0,832656 2,151111  
    10,9 6,4 3,5875 -0,66667 -2,39167 12,87016 0,444444  
    9,1 10,9 1,7875 3,833333 6,852083 3,195156 14,69444  
    6,4 9,1 -0,9125 2,033333 -1,85542 0,832656 4,134444  
    7,2 6,4 -0,1125 -0,66667 0,075 0,012656 0,444444  
      7,2 3,6875 0,133333 0,491667 13,59766 0,017778  
  сумма     1,8125 -1,1E-14 10,09667 65,17234 53,95333  
  сред знач 7,3125 7,066667 - - - - -  
                         

= = =0,170

Автокорреляция второго порядка

t yt yt-2 yt-yшл3 yt-2-yшл4 d1*e1 (yt-yшл3)^2 (yt-2-yшл4)^2
  5,5 - - - - - -
  4,6 - - - - - -
    5,5 -2,3125 -1,55714 3,600893 5,347656 2,424694
  9,2 4,6 1,8875 -2,45714 -4,63786 3,562656 6,037551
  7,1   -0,2125 -2,05714 0,437143 0,045156 4,231837
  5,1 9,2 -2,2125 2,142857 -4,74107 4,895156 4,591837
  5,9 7,1 -1,4125 0,042857 -0,06054 1,995156 0,001837
    5,1 2,6875 -1,95714 -5,25982 7,222656 3,830408
    5,9 0,6875 -1,15714 -0,79554 0,472656 1,33898
  5,6   -1,7125 2,942857 -5,03964 2,932656 8,660408
  6,4   -0,9125 0,942857 -0,86036 0,832656 0,88898
  10,9 5,6 3,5875 -1,45714 -5,2275 12,87016 2,123265
  9,1 6,4 1,7875 -0,65714 -1,17464 3,195156 0,431837
  6,4 10,9 -0,9125 3,842857 -3,50661 0,832656 14,76755
  7,2 9,1 -0,1125 2,042857 -0,22982 0,012656 4,173265
    6,4 3,6875 -0,65714 -2,42321 13,59766 0,431837
сумма   98,8 4,525 -1,1E-14 -29,9186 57,81469 53,93429
сред знач 7,3125 7,057143 - - - - -

Вычисление коэффициента второго порядка

= = =0,5357

t yt yt-2 yt-yшл4 yt-3-yшл4 d1*e1 (yt-yшл3)^2 (yt-3-yшл5)^2
  5,5 - - - - - -
  4,6 - - - - - -
    - - - - - -
  9,2 5,5 1,8875 -1,60769 -3,03452 3,562656 2,584675
  7,1 4,6 -0,2125 -2,50769 0,532885 0,045156 6,288521
  5,1   -2,2125 -2,10769 4,663269 4,895156 4,442367
  5,9 9,2 -1,4125 2,092308 -2,95538 1,995156 4,377751
    7,1 2,6875 -0,00769 -0,02067 7,222656 5,92E-05
    5,1 0,6875 -2,00769 -1,38029 0,472656 4,030828
  5,6 5,9 -1,7125 -1,20769 2,068173 2,932656 1,458521
  6,4   -0,9125 2,892308 -2,63923 0,832656 8,365444
  10,9   3,5875 0,892308 3,201154 12,87016 0,796213
  9,1 5,6 1,7875 -1,50769 -2,695 3,195156 2,273136
  6,4 6,4 -0,9125 -0,70769 0,645769 0,832656 0,500828
  7,2 10,9 -0,1125 3,792308 -0,42663 0,012656 14,3816
    9,1 3,6875 1,992308 7,346635 13,59766 3,96929
сумма   92,4 6,8375 -8E-15 5,306154 52,46703 53,46923
сред знач 7,3125 7,107692 - - - - -

=0,0137 =0,7773

=0,9637

=0,1267

=-0,6237

=-0,0113

=0,9013

=0,1166

=-0,6052

=-0,0928


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: