Тема: Модель множественной регрессии

Цель: Построение уравнения множественной регрессии и оценка ее параметров.

Пример [1] (для сокращения объема вычислений ограничимся только десятью наблюдениями). Пусть имеются следующие данные (условные) о сменной добыче угля на одного рабочего y (т), мощности пласта (м) и уровне механизации работ (%), характеризующие процесс добычи угля в 10 шахтах.

Таблица 1

                   
                   
                   
                   

Предполагая, что между переменными y, , существует линейная корреляционная зависимость, найдем уравнение регрессии y, по и .

Для удобства дальнейших вычислений составляем таблицу ():

Таблица 2

                       
                    5,13 0,016
                    8,79 1,464
                    9,64 0,127
                    5,98 1,038
                    5,86 0,741
                    6,23 0,052
                    6,35 0,121
                    5,61 0,377
                    5,13 0,762
                    9,28 1,631
Сумма                     6,329
Среднее значение 9,4 6,3 6,8 90,8 41,7 49,6 60,3 66,4 44,5
2,44 2,01 3,36
1,56 1,42 1,83

Для нахождения параметров уравнения регрессии в данном случае необходимо решить следующую систему нормальных уравнений:

Откуда получаем, что , , . Т.е. получили следующее уравнение множественной регрессии:

.

Оно показывает, что при увеличении только мощности пласта (при неизменном ) на 1 м добыча угля на одного рабочего y, увеличится в среднем на 0,854 т, а при увеличении только уровня механизации работ (при неизменном ) на 1% – в среднем на 0,367 т.

Найдем уравнение множественной регрессии в стандартизованном масштабе:

при этом стандартизованные коэффициенты регрессии будут

,

.

Т.е. уравнение будет выглядеть следующим образом:

.

Так как стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно сказать, что мощность пласта оказывает большее влияние на сменную добычу угля, чем уровень механизации работ.

Сравнивать влияние факторов на результат можно также при помощи средних коэффициентов эластичности (3.11):

.

Вычисляем:

, .

Т.е. увеличение только мощности пласта (от своего среднего значения) или только уровня механизации работ на 1% увеличивает в среднем сменную добычу угля на 1,18% или 0,34% соответственно. Таким образом, подтверждается большее влияние на результат y фактора , чем фактора .

Оценим качество уравнения. Сначала найдем значения парных коэффициентов корреляции:

;

;

.

Значения парных коэффициентов корреляции указывают на достаточно тесную связь сменной добычи угля на одного рабочего y с мощностью пласта и на умеренную связь с уровнем механизации работ . В то же время межфакторная связь не очень сильная (), что говорит о том, что оба фактора являются информативными, т.е. и , и необходимо включить в модель.

Теперь рассчитаем совокупный коэффициент корреляции . Для этого сначала найдем определитель матрицы парных коэффициентов корреляции:

,

и определитель матрицы межфакторной корреляции:

.

Тогда коэффициент множественной корреляции по формуле (3.16):

.

Т.е. можно сказать, что 81,7% (коэффициент детерминации ) вариации результата объясняется вариацией представленных в уравнении признаков, что указывает на весьма тесную связь признаков с результатом.

Примерно тот же результат (различия связаны с ошибками округлений) для коэффициента множественной регрессии получим, если воспользуемся формулами (3.12) и (3.15):

;

.

Скорректированный коэффициент множественной детерминации

указывает на умеренную связь между результатом и признаками. Это связано с малым количеством наблюдений.

Теперь найдем частные коэффициенты корреляции по формулам (3.18а) и (3.19а):

;

.

;

.

Т.е. можно сделать вывод, что фактор оказывает более сильное влияние на результат, чем признак .

Оценим надежность уравнения регрессии в целом и показателя связи с помощью F -критерия Фишера. Фактическое значение F -критерия (3.22)

.

Табличное значение F -критерия при пятипроцентном уровне значимости (, , ): . Так как , то уравнение признается статистически значимым.

Оценим целесообразность включения фактора после фактора и после с помощью частного F -критерия Фишера (3.23а):

;

.

Табличное значение частного F -критерия при пятипроцентном уровне значимости (, , ): . Так как , а , то включение фактора в модель статистически оправдано и коэффициент чистой регрессии статистически значим, а дополнительное включение фактора , после того, как уже введен фактор , нецелесообразно.

Уравнение регрессии, включающее только один значимый аргумент :

.

1-вариант

у х1 х2 х1*х1 х2*х2 х1*х2 х1*у х2*у Ух-расч эпсилон у*у
    3,6   12,9600   32,40 21,60   5,52 0,48  
    3,6   12,9600   43,20 21,60   5,82 0,18  
    3,9   15,2100   54,60 23,40   6,35 -0,35  
    4,1   16,8100   69,70 28,70   8,327 -1,327  
    3,9   15,2100   70,20 27,30   6,75 0,25  
    4,5   20,2500   85,50 31,50   7,51 -0,51  
    5,3   28,0900   100,70 42,40   8,39 -0,39  
    5,3   28,0900   100,70 42,40   8,39 -0,39  
    5,6   31,3600   112,00 50,40   8,82 0,18  
    6,8   46,2400   142,80 68,00   10,24 -0,24  
    6,3   39,6900   132,30 56,70   9,69 -0,69  
    6,4   40,9600   140,80 70,40   9,9 1,1  
        49,0000   168,00 77,00   10,76 0,24  
    7,5   56,2500   187,50 90,00   11,41 0,59  
    7,9   62,4100   221,20 94,80   12,15 -0,15  
    8,2   67,2400   246,00 106,60   12,68 0,32  
        64,0000   240,00 104,00   12,46 0,54  
    8,6   73,9600   266,60 111,80   13,22 -0,22  
    9,5   90,2500   313,50 133,00   14,41 -0,41  
        81,0000   324,00 126,00   14,16 -0,16  
Сумма       851,9400   3051,7 1327,6        
Сред.зн. 9,8 6,25 22,4 42,5970 550,7 152,59 66,38 238,1     103,7
  a=0,66 b1=1,1 b2=0,1 Yx-расч=0,66+1,1*х1+0,1*х2 0,66 1,1 0,1    
Сигма кв 7,66 3,535 48,94                
сигма 2,7676 1,88 6,996                
                         

2-вариант

у х1 х2 х1*х1 х2*х2 х1*х2 х1*у х2*у Ух-расч. эпсилон у*у
    3,5   12,25         5,295 0,705  
    3,6   12,96   43,2 21,6   5,962 0,038  
    3,9   15,21   58,5 27,3   7,003 -0,003  
    4,1   16,81   69,7 28,7   7,697 -0,697  
    4,2   17,64   75,6 29,4   8,044 -1,044  
    4,5   20,25   85,5     8,445 -0,445  
    5,3   28,09   100,7 42,4   8,661 -0,661  
    5,3   28,09     47,7   8,981 0,019  
    5,6   31,36     50,4   9,062 -0,062  
                  9,49 0,51  
    6,3   39,69   132,3     9,571 0,429  
    6,4   40,96   140,8 70,4   9,918 1,082  
                  9,918 1,082  
    7,5   56,25   187,5     11,175 0,825  
    7,9   62,41   221,2 94,8   12,243 -0,243  
    8,2   67,24     106,6   12,964 0,036  
    8,4   70,56   260,4 109,2   13,338 -0,338  
    8,6   73,96   266,6 120,4   13,392 0,608  
    9,5   90,25   332,5     14,915 -0,915  
                  15,37 -0,37  
Сумма   125,8   868,98   3120,5 1378,9        
Сред. зн. 10,1 6,29 22,65 43,449 562,55 156,03 68,945 247,7     109,7
  а=1,15 в1=0,27 в2=0,32 Ухрасч=1,15+0,27*х1+0,32*х2 1,15 0,27 0,32    
сигма кв. 7,69 3,8849 49,528                
сигма 2,77308 1,97101 7,0376                

3-вариант

у х1 х2 х1*х1 х2*х2 х1*х2 х1*у х2*у Ух-расч. эпсилон y*y
    3,7   13,69   33,3 25,9   6,556 0,444  
    3,7   13,69   40,7 25,9   6,816 0,184  
    3,9   15,21   42,9 27,3   6,972 0,028  
    4,1   16,81   61,5 28,7   7,648 -0,648  
    4,2   17,64   71,4 33,6   7,986 0,014  
    4,9   24,01   93,1 39,2   8,792 -0,792  
    5,3   28,09   100,7 42,4   9,104 -1,104  
    5,1   26,01     45,9   9,078 -0,078  
    5,6   31,36         9,468 0,532  
    6,1   37,21   128,1     9,988 0,012  
    6,3   39,69   138,6 69,3   10,27 0,726  
    6,4   40,96   140,8 70,4   10,35 0,648  
    7,2   51,84   165,6 79,2   11,10 -0,106  
    7,5   56,25   187,5     11,6 0,4  
    7,9   62,41   213,3 94,8   12,17 -0,172  
    8,1   65,61     105,3   12,71 0,282  
    8,4   70,56   260,4 109,2   13,08 -0,082  
    8,6   73,96   275,2 111,8   13,36 -0,368  
    9,5   90,25   332,5     14,46 -0,46  
    9,5   90,25     142,5   14,59 0,41  
Сумма       865,5   3084,6 1391,4        
Сред.зн 10,3 6,3 22,25 43,275 552,85 154,23 69,57 247,6     112,4
  a=2,5 b1=0,78 b2=0,13 Yxрасч=2,5+0,78*х1+0,13*х2 2,5 0,78 0,13    
сигма кв 6,31 3,585 57,788                
сигма 2,51197 1,89341 7,6018                
                       
                           

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: