Корреляционно-регрессионный анализ

Задание 6.Определить тесноту парной связи и форму связи с использованием корреляционно – регрессионного анализа между признаками

Корреляционно-регрессионный анализ включает в себя измерение тесноты, направление связи и установление аналитического выражения связи.

Одним из методов корреляционно-регрессионного анализа является метод парной корреляции, рассматривающий влияние вариации факторного признака Х на результативный У. 

Аналитическая связь между ними описывается уравнением:

Среднем есячная зарплата , руб (Xi) Средняя площадь жилых помещени й на чел., м2 (Уi) Хi*Уi Хi2 Уi2 У расч
1 391,1 39779,6 15557801,56 152959,21 1582416576,16 -371023,52
2 425,0 47426,2 20156135,00 180625,00 2249244446,44 -403191,91
3 358,7 39507,8 14171447,86 128665,69 1560866260,84 -340278,51
4 1039,8 104942,4 109119107,52 1081184,04 11012907317,76 -986587,93
5 406,9 31169,3 12682788,17 165567,61 971525262,49 -386016,46
6 341,9 42756,4 14618413,16 116895,61 1828109740,96 -324336,66
7 277,6 12225,3 3393743,28 77061,76 149457960,09 -263321,10
8 449,1 39998,3 17963236,53 201690,81 1599864002,89 -426060,88
9 510,4 55003,4 28073735,36 260508,16 3025374011,56 -484229,68
10 318,6 41894,7 13347651,42 101505,96 1755165888,09 -302226,82
11 537,6 59672,8 32080097,28 289013,76 3560843059,84 -510040,30
12 329,9 57227,2 18879253,28 108834,01 3274952419,84 -312949,62
13 290,4 36157,0 10499992,80 84332,16 1307328649,00 -275467,28

yрасч = a0 + a1 ∙ xi

где, хi - индивидуальное значение факторного признака; а0, а1 - параметры уравнения прямой (уравнения регрессии); урасч - теоретическое значение результирующего фактора.

 

 

 

Таблица 19. Парная связь между субъектами.

                           {         1 433 480,6 = 28 × а0 + а1 × 14 733,9             

1072482685,48 = а0 × 556,9 + а1 × 10828146,93

−1 433 480,6 + а1 × 14 733,9 а0 =  

{                                                                                    28

−1 433 480,6 + а1 × 14 733,9

1072482685,48 =  × 14 733,9 + а1 × 10828146,93

28

14 419,4

55146,9

23128609,86

175896,36 3041180579,61 -397877,96
15 551,5

57539,6

31733089,40

304152,25 3310805568,16 -523230,29
16 608,1

55239,3

33591018,33

369785,61 3051380264,49 -576939,16
17 63,3

4443,7

281286,21

4006,89 19746469,69 -59967,55
18 431,9

15174,6

6553909,74

186537,61 230268485,16 -409739,46
19 116,0

1435,7

166541,20

13456,00 2061234,49 -109975,63
20 181,7

12683,9

2304664,63

33014,89 160881319,21 -172319,67
21 698,1

64330,1

44908842,81

487343,61 4138361766,01 -662341,96
22 347,1

10318,3

3581481,93

120478,41 106467314,89 -329271,04
23 1083,8

103519,1

112194000,58

1174622,44 10716204064,81 1028340,41
24 623,7

64474,9

40212995,13

389001,69 4157012730,01 -591742,31
25 556,9

51520,3

28691655,07

310137,61 2654341312,09 -528354,46
26 1602,9

177409,4

284369527,26

2569288,41 31474095208,36 1520924,78
27 1178,4

102054,9

120261494,16

1388626,56 10415202614,01 1118108,24
28 594,1

50429,5

29960165,95

352954,81 2543134470,25 -563654,28
Σ= 14 733,9  

1 433 480,6

1072482685,48 10828146,93 109899198997,20 13978517,87
                 

а0 = 99,09 а1 = -948,92

Коэффициент корреляции рассчитывается по формуле:

rxy  

   rxy =

 

 
-1500000
-1000000
-500000
0
500000
1000000
1500000
2000000
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
31
33
yi
y
знач

Рисунок 6. Взаимосвязь между Yi и Yзнач.

 

Вывод: Результаты расчётов коэффициента корреляции показали, что связь между групповым и результативным признаками является обратной. Следует пояснить, что теснота между ними сильная (0.85 и 0.95, разница всего 0,1) 

Заключение

 

В первом пункте производились расчёты средних показателей двух субъектов по двум признакам.

Федеральный округ  Средняя численность населения, тыс. чел. Средний розничной млн руб оборот торговли,
Центральный  1155,1 297535,1  
Сибирский 623,1 54816,2  

 

Вторым пунктом была группировка исходных данных. Благодаря произведённым расчётам появилась возможность вычислить среднюю по группе, удельный вес, а так же вывести итоговую таблицу в графической схеме.

 
0
5
10
15
20
25
30
Интервал
 
[63.3
576.5]
 
[576.5
1089.7]
 
[1089.7
1602.9]
Группа
1
2
3
Среднее по группе
Ряд3
72
%
%
21
7
%
7
%
Удельный вес субъектов
1
 [63.3
576.5]
2
 [576.5
1089.7]
3
 [1089.7
1602.9]

3

[1089.7
1602.9]

2
                           279464.3

2

6
                           442935.3

1

20
                           711081.0

Группа

Интервал

Число
субъектов
         Результативный признак

 
T AAAAAAAAAAAAAAAAAAAAAABbQ29udGVudF9UeXBlc10ueG1sUEsBAi0AFAAGAAgAAAAhADj9If/W AAAAlAEAAAsAAAAAAAAAAAAAAAAAOwEAAF9yZWxzLy5yZWxzUEsBAi0AFAAGAAgAAAAhAE5Ua0CH AgAAfgsAAA4AAAAAAAAAAAAAAAAAOgIAAGRycy9lMm9Eb2MueG1sUEsBAi0AFAAGAAgAAAAhAC5s 8ADFAAAApQEAABkAAAAAAAAAAAAAAAAA7QQAAGRycy9fcmVscy9lMm9Eb2MueG1sLnJlbHNQSwEC LQAUAAYACAAAACEA9hQnBeAAAAAKAQAADwAAAAAAAAAAAAAAAADpBQAAZHJzL2Rvd25yZXYueG1s UEsBAi0ACgAAAAAAAAAhABMg5F5jCgAAYwoAABQAAAAAAAAAAAAAAAAA9gYAAGRycy9tZWRpYS9p bWFnZTEucG5nUEsBAi0ACgAAAAAAAAAhACvHOAgkIwAAJCMAABQAAAAAAAAAAAAAAAAAixEAAGRy cy9tZWRpYS9pbWFnZTIucG5nUEsFBgAAAAAHAAcAvgEAAOE0AAAAAA== "> ИТОГ

                                                                                  0   5   10 15  20 25  30

Благодаря полученным данным можно сделать следующие выводы:

1. Наибольшее число субъектов располагаются в первой группе 20 штук.

2. Удельный вес первой группы почти на 20% больше, чем вес второй группы.

3. Третья группа самая маленькая, так как в нее вошли 2 субъекта и удельный вес составляет 19,5%.

Третьим пунктом идёт вариация. С помощью проведённых подсчётов появилась возможность вычислить коэффициент вариации и сделать некоторые выводы.

 
0
,00%
10
,00%
20
,00%
30
,00%
40
,00%
50
,00%
60
,00%
70
,00%
80
,00%
90
,00%
100,00
%
Все регионы
ЦФО
СФО
Коэффициент вариации

• Совокупность по всем регионам неоднородна, поэтому была разумно проведена группировка в предыдущем пункте.

• Совокупность в Центральном ФО чуть выше нормы, однако, неоднородна, при этом совокупность Сибирский ФО почти в три раза больше, чем совокупность Центрального ФО.

• Совокупность второй и третьей группы однородная, в отличии от совокупности первой группы.

Далее следует дисперсия. Она предназначена для выявления взаимосвязи (с использованием дисперсий) между двумя показателями. Произведя расчёты, можно сделать следующие выводы:

1) В результате проделанной работы, мы можем наглядно увидеть, что взаимосвязь признаков очень тесная, так как влияние одного признака на другой равно 84%.

2) Расчеты эмпирического корреляционного отношения показали, что между признаками существует связь. Ее можно назвать сильной, так как она равна 0,92.

 

Пятым пунктом следует анализ тесноты взаимосвязи между показателями. Коэффициент ранговой корреляции Спирмена – это непараметрический метод, который используется с целью статистического изучения связи между явлениями. Произведя расчёты, можно сделать следующие выводы:

1) В Центральном ФО группировочный и результативный признак имеют умеренную взаимосвязь со значением 0.71

2) В Сибирском ФО группировочный и результативный признак имеют сильную взаимосвязь со значением 0.91

Последним пунктом следует корреляционно-регрессионный анализ. Он включает в себя измерение тесноты, направление связи и установление аналитического выражения связи. Благодаря анализу, можно выявить взаимосвязь между признаками в графическом виде.

 
-1500000
-1000000
-500000
0
500000
1000000
1500000
2000000
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
31
33
yi
y
знач

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список литературы

1) https://www.gks.ru. Федеральная служба таможенной статистики

2) Ефимова, М. Р. Практикум по общей теории статистики / М.Р. Ефимова, О.И. Ганченко, Е.В. Петрова. - М.: Финансы и статистика, 2016.

3) Переяслова, И.Г. Статистика / И.Г. Переяслова, Е.Б. Колбачев, О.Г. Переяслова. - Москва: Наука, 2016.

4) Гореева, Н.М. Статистика в схемах и таблицах / - Москва: Эксмо, 2015.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: