Кластерный анализ. 1. Определить наиболее подходящее количество кластеров для разбиения областей на группы по всем пяти признакам

Требуется:

1. Определить наиболее подходящее количество кластеров для разбиения областей на группы по всем пяти признакам.

2. Провести классификацию регионов иерархическим методом

3. Дать графическое представление процесса объединения областей в виде дендрограммы

4. Для каждого из полученных кластеров дать содержательную интерпретацию, определив кластерные профили

1.Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.

Шаг Коэффициенты  
 
  43,430  
  62,260  
  87,850  
  88,850  
  132,115  
  139,910  
  156,987  
  168,525  
  266,345  
  298,305  
  386,649  
  460,167  
  523,984  
  938,968  
  1030,199  
  11889,051  

Оптимальное количество кластеров для нашего случая 3. Так как всего областей мы имеем 17, а резкий скачок коэффициента произошел на 14 шаге.

Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру.

Cluster Membership
Области № кластера
1:Белгород  
2:Брянская  
3:Владимер  
4:Воронежс  
5:Ивановск  
6:Калужска  
7:Костромс  
8:Курская  
9:Липецкая  
10:Московск  
11:Орловска  
12:Рязанска  
13:Смоленск  
14:Тамбовск  
15:Тверская  
16:Тульская  
17:Ярославс  

Самым многочисленным кластером является кластер 1,он включает в себя 11 областей. Самый малочисленный кластер, это кластер 2, в него входят 2 области. А в третий кластер входят 4 области.

На дедрограмме графически представлен процесс объединения кластеров.

Пока не ясно, что означает полученные три кластера, разобраться в этом помогут кластерные профили. Они представляют собой распределенные по кластерным принадлежностям средние значения переменных, которые включены в анализ.

Report
Average Linkage (Between Groups) потреб.цены цены_производителей.пром.продукци реализованная_сх_продукция цены_в_строительстве тариф_на_грузоперевозки
  Mean 113,6250 117,4417 117,1000 115,1083 110,5000
  Mean 112,9750 118,6000 116,6250 110,7000 136,7000
  Mean 112,2000 114,9000 150,0000 111,7000 114,0000
Total Mean 113,3882 117,5647 118,9235 113,8706 116,8706

В первый кластер входят 11 предприятий и характеризуется тем, что средний индекс цен почти одинаков. Второй кластер характеризуется тем, что произошел резкий скачок на реализованную с/х продукцию, и он включает в себя 2 области. В третий кластер входят 4 области и они характеризуется высоким средним значением индекса цен грузоперевозок.


Самостоятельная работа№2

1. Определить оптимальное количество кластеров.

2. Распределить объекты по кластерам.

3. Дать интерпретацию полученным группам.

Вариант 1

1.Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.

Stage Coefficients
  9830,210
  82323,210
  126270,620
  163799,960
  190640,360
  230089,890
  281175,090
  281464,810
  344043,180
  447087,530
  449165,265
  488141,145
  510204,010
  515271,330
  549834,420
  560128,860
  624948,290
  707831,410
  778139,070
  839347,200
  895246,000
  901098,565
  907831,875
  1025181,930
  1062127,495
  1070613,617
  1094470,180
  1241202,920
  1250363,580
  1261139,250
  1316712,250
  1472217,250
  1546283,885
  1551780,405
  1608766,260
  1665552,310
  2043511,427
  2102043,060
  2325271,425
  2586282,540
  2693655,800
  2810398,410
  2938839,440
  3792625,825
  3878973,007
  3943217,058
  4027173,312
  4079041,080
  4348095,000
  4936720,982
  4972544,370
  5206572,817
  5710031,330
  5750614,710
  5999778,558
  6049905,780
  6387523,850
  6828119,630
  8142412,715
  9609286,260
  10083589,890
  10207355,612
  11296332,010
  12033888,162
  12606829,165
  13356336,337
  13482902,513
  13623999,450
  15091128,541
  16492789,490
  18853962,873
  20256065,025
  26079062,393
  26627575,590
  28838695,890
  28986176,487
  34159237,991
  38630769,890
  42520142,521
  50732503,240
  50751409,445
  54404339,739
  55468875,044
  63807188,823
  73475997,450
  80622082,890
  97737378,585
  148359211,876
  178936276,657
  179888925,093
  223362578,253
  266544908,400
  321112131,483
  356560919,319
  386094344,385
  445007867,200
  823664804,058
  829952747,491
  1956921178,046
  2501486811,085
  4252742673,500
  11507808743,037
  44249013078,627
  86200996602,290
  1082555211715,647

Оптимальное количество кластеров для нашего случая 10. Так как всего областей мы имеем 106, а резкий скачок коэффициента произошел на 96 шаге.

Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру

Cluster Membership
Case 10 Clusters
1:Афганистан  
2:Аргентина  
3:Армения  
4:Австралия  
5:Австрия  
6:Азербайджан  
7:Бахрейн  
8:Бангладеш  
9:Барбадос  
10:Беларусь  
11:Бельгия  
12:Боливия  
13:Ботсвана  
14:Бразилия  
15:Болгария  
16:Буркина Фасо  
17:Бурунди  
18:Камбоджа  
19:Камерун  
20:Канада  
21:ЦАР  
22:Чили  
23:Китай  
24:Колумбия  
25:Коста Рика  
26:Хорватия  
27:Куба  
28:Дания  
29:Доминик.респ  
30:Эквадор  
31:Египет  
32:Сальвадор  
33:Эстония  
34:Эфиопия  
35:Финляндия  
36:Франция  
37:Габон  
38:Гамбия  
39:Грузия  
40:Германия  
41:Греция  
42:Гватемала  
43:Гаити  
44:Гондурас  
45:Гонконг  
46:Венгрия  
47:Исландия  
48:Индия  
49:Индонезия  
50:Ирак  
51:Иран  
52:Ирландия  
53:Израиль  
54:Италия  
55:Япония  
56:Иордания  
57:Кения  
58:Кувейт  
59:Латвия  
60:Ливан  
61:Либерия  
62:Ливия  
63:Литва  
64:Малайзия  
65:Мексика  
66:Марокко  
67:Сев.Корея  
68:Голландия  
69:Нов.Зеландия  
70:Никарагуа  
71:Нигерия  
72:Норвегия  
73:Оман  
74:Пакистан  
75:Панама  
76:Парагвай  
77:Перу  
78:Филиппины  
79:Польша  
80:Португалия  
81:Румыния  
82:Россия  
83:Руанда  
84:Южн.Корея  
85:Сауд.Аравия  
86:Сенегал  
87:Сингапур  
88:Сомали  
89:ЮАР  
90:Испания  
91:Швеция  
92:Швейцария  
93:Сирия  
94:Танзания  
95:Тайланд  
96:Турция  
97:ОАЭ  
98:Англия  
99:США  
100:Уганда  
101:Украина  
102:Уругвай  
103:Узбекистан  
104:Венесуэла  
105:Вьетнам  
106:Замбия  

Самый большой кластер, это кластер №1, в него входят 73 страны, во второй 11,самым маленьким кластером является кластер №10, так как в него входит только одна страна.

Пока не ясно, что означает полученные десять кластеров, разобраться в этом помогут кластерные профили. Они представляют собой распределенные по кластерным принадлежностям средние значения переменных, которые включены в анализ.

Report  
Average Linkage (Between Groups) Население Плотность ГН СПЖЖ СПЖМ ДС ВВП ЭГ СКД  
  Mean 8351,49 231,501 57,99 70,01 64,88 42,49 5863,90 3,75 3,727  
N                    
  Mean 35190,00 86,880 58,50 70,10 64,20 38,39 5372,90 3,50 3,240  
N                    
  Mean 126200,00 424,333 41,67 64,33 62,00 70,47 6822,67 3,00 4,233  
N                    
  Mean 152900,00 13,400 74,50 70,50 60,50 46,50 4517,00 4,00 2,250  
N                    
  Mean 1205200,00 124,000 26,00 69,00 67,00 52,00 377,00 3,00 1,800  
N                    
   
  Mean 61054,55 126,636 50,64 71,18 65,73 42,87 5795,09 3,00 3,236  
N                    
  Mean 90366,67 125,000 64,33 71,00 65,33 38,83 7141,67 3,67 3,700  
N                    
  Mean 911600,00 283,000 26,00 59,00 58,00 79,00 275,00 3,00 4,500  
N                    
  Mean 199700,00 102,000 29,00 65,00 61,00 68,00 681,00 3,00 2,800  
N                    
  Mean 260800,00 26,000 75,00 79,00 73,00 8,10 23474,00 1,00 2,100  
N                    
Total Mean 48735,46 201,615 56,58 69,94 64,75 43,25 5861,08 3,58 3,581  
N                    

Зщадание 2

Stage Coefficients  
 
  151119639,343  
  164963250,798  
  165664500,780  
  267744888,076  
  304766389,429  
  444260739,467  
  581539231,976  
  740028933,240  
  902950800,573  
  1556277669,580  
  1634526972,096  
  6011803841,522  
  20952655840,279  
  219695914452,958  

Оптимальное количество кластеров для нашего случая 3. Так как всего областей мы имеем 15, а резкий скачок коэффициента произошел на 12 шаге.

Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру

Cluster Membership
Case 3 Clusters
1:Белгородская  
2:Брянская  
3:Ивановская  
4:Калужская  
5:Костромская  
6:Курская  
7:Липецкая  
8:Орловская  
9:Смоленская  
10:Рязанская  
11:Московская  
12:Тамбовская  
13:Тверская  
14:Тульская  
15:Ярославская  

Самым многочисленным является кластер №1,в него входят 13 областей. Во второй и третий кластеры входят по одной области.

Report
Average Linkage (Between Groups) ОПП ИОК ОРТ ОВПСХ ДКБ ДП КПиО СФР ЧОЗБ СДД ИПЦ ИЦП
  Mean 60876,0615 13512,6231 29585,9462 14297,9077 13033,4315 -539,5226 19677,2712 5619,4325 9,8315 4158,3800 111,6615 115,3846
N                        
Std. Deviation 33901,22485 6257,21155 7463,25924 7078,00500 3077,44408 1342,13327 11933,05329 6971,51612 3,08698 821,27631 3,41310 8,27344
  Mean 183068,0000 24730,0000 32932,0000 17022,0000 24908,8000 3438,3000 20252,0000 71483,9000 4,8000 4263,0000 112,9000 145,3000
N                        
Std. Deviation . . . . . . . . . . . .
  Mean 379973,8000 136000,0000 291734,9000 20008,4000 115863,9000 -5417,5800 178875,0000 50193,7000 36,9130 5884,7000 112,2600 117,3000
N                        
Std. Deviation . . . . . . . . . . . .
Total Mean 90295,3733 22426,2733 47285,6133 14860,2133 20680,4873 -599,5383 30328,7683 12982,0148 11,3015 4280,4427 111,7840 117,5067
N                        
Std. Deviation 91637,21736 32079,16769 67982,40301 6742,53791 26661,38946 2090,46046 42553,49946 20865,39099 7,74903 880,81026 3,17870 10,86426


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: