Требуется:
1. Определить наиболее подходящее количество кластеров для разбиения областей на группы по всем пяти признакам.
2. Провести классификацию регионов иерархическим методом
3. Дать графическое представление процесса объединения областей в виде дендрограммы
4. Для каждого из полученных кластеров дать содержательную интерпретацию, определив кластерные профили
1.Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.
Шаг | Коэффициенты | |
43,430 | ||
62,260 | ||
87,850 | ||
88,850 | ||
132,115 | ||
139,910 | ||
156,987 | ||
168,525 | ||
266,345 | ||
298,305 | ||
386,649 | ||
460,167 | ||
523,984 | ||
938,968 | ||
1030,199 | ||
11889,051 |
Оптимальное количество кластеров для нашего случая 3. Так как всего областей мы имеем 17, а резкий скачок коэффициента произошел на 14 шаге.
Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру.
|
|
Cluster Membership | |
Области | № кластера |
1:Белгород | |
2:Брянская | |
3:Владимер | |
4:Воронежс | |
5:Ивановск | |
6:Калужска | |
7:Костромс | |
8:Курская | |
9:Липецкая | |
10:Московск | |
11:Орловска | |
12:Рязанска | |
13:Смоленск | |
14:Тамбовск | |
15:Тверская | |
16:Тульская | |
17:Ярославс |
Самым многочисленным кластером является кластер 1,он включает в себя 11 областей. Самый малочисленный кластер, это кластер 2, в него входят 2 области. А в третий кластер входят 4 области.
На дедрограмме графически представлен процесс объединения кластеров.
Пока не ясно, что означает полученные три кластера, разобраться в этом помогут кластерные профили. Они представляют собой распределенные по кластерным принадлежностям средние значения переменных, которые включены в анализ.
Report | ||||||
Average Linkage (Between Groups) | потреб.цены | цены_производителей.пром.продукци | реализованная_сх_продукция | цены_в_строительстве | тариф_на_грузоперевозки | |
Mean | 113,6250 | 117,4417 | 117,1000 | 115,1083 | 110,5000 | |
Mean | 112,9750 | 118,6000 | 116,6250 | 110,7000 | 136,7000 | |
Mean | 112,2000 | 114,9000 | 150,0000 | 111,7000 | 114,0000 | |
Total | Mean | 113,3882 | 117,5647 | 118,9235 | 113,8706 | 116,8706 |
В первый кластер входят 11 предприятий и характеризуется тем, что средний индекс цен почти одинаков. Второй кластер характеризуется тем, что произошел резкий скачок на реализованную с/х продукцию, и он включает в себя 2 области. В третий кластер входят 4 области и они характеризуется высоким средним значением индекса цен грузоперевозок.
Самостоятельная работа№2
1. Определить оптимальное количество кластеров.
2. Распределить объекты по кластерам.
|
|
3. Дать интерпретацию полученным группам.
Вариант 1
1.Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.
Stage | Coefficients |
9830,210 | |
82323,210 | |
126270,620 | |
163799,960 | |
190640,360 | |
230089,890 | |
281175,090 | |
281464,810 | |
344043,180 | |
447087,530 | |
449165,265 | |
488141,145 | |
510204,010 | |
515271,330 | |
549834,420 | |
560128,860 | |
624948,290 | |
707831,410 | |
778139,070 | |
839347,200 | |
895246,000 | |
901098,565 | |
907831,875 | |
1025181,930 | |
1062127,495 | |
1070613,617 | |
1094470,180 | |
1241202,920 | |
1250363,580 | |
1261139,250 | |
1316712,250 | |
1472217,250 | |
1546283,885 | |
1551780,405 | |
1608766,260 | |
1665552,310 | |
2043511,427 | |
2102043,060 | |
2325271,425 | |
2586282,540 | |
2693655,800 | |
2810398,410 | |
2938839,440 | |
3792625,825 | |
3878973,007 | |
3943217,058 | |
4027173,312 | |
4079041,080 | |
4348095,000 | |
4936720,982 | |
4972544,370 | |
5206572,817 | |
5710031,330 | |
5750614,710 | |
5999778,558 | |
6049905,780 | |
6387523,850 | |
6828119,630 | |
8142412,715 | |
9609286,260 | |
10083589,890 | |
10207355,612 | |
11296332,010 | |
12033888,162 | |
12606829,165 | |
13356336,337 | |
13482902,513 | |
13623999,450 | |
15091128,541 | |
16492789,490 | |
18853962,873 | |
20256065,025 | |
26079062,393 | |
26627575,590 | |
28838695,890 | |
28986176,487 | |
34159237,991 | |
38630769,890 | |
42520142,521 | |
50732503,240 | |
50751409,445 | |
54404339,739 | |
55468875,044 | |
63807188,823 | |
73475997,450 | |
80622082,890 | |
97737378,585 | |
148359211,876 | |
178936276,657 | |
179888925,093 | |
223362578,253 | |
266544908,400 | |
321112131,483 | |
356560919,319 | |
386094344,385 | |
445007867,200 | |
823664804,058 | |
829952747,491 | |
1956921178,046 | |
2501486811,085 | |
4252742673,500 | |
11507808743,037 | |
44249013078,627 | |
86200996602,290 | |
1082555211715,647 |
Оптимальное количество кластеров для нашего случая 10. Так как всего областей мы имеем 106, а резкий скачок коэффициента произошел на 96 шаге.
Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру
Cluster Membership | |
Case | 10 Clusters |
1:Афганистан | |
2:Аргентина | |
3:Армения | |
4:Австралия | |
5:Австрия | |
6:Азербайджан | |
7:Бахрейн | |
8:Бангладеш | |
9:Барбадос | |
10:Беларусь | |
11:Бельгия | |
12:Боливия | |
13:Ботсвана | |
14:Бразилия | |
15:Болгария | |
16:Буркина Фасо | |
17:Бурунди | |
18:Камбоджа | |
19:Камерун | |
20:Канада | |
21:ЦАР | |
22:Чили | |
23:Китай | |
24:Колумбия | |
25:Коста Рика | |
26:Хорватия | |
27:Куба | |
28:Дания | |
29:Доминик.респ | |
30:Эквадор | |
31:Египет | |
32:Сальвадор | |
33:Эстония | |
34:Эфиопия | |
35:Финляндия | |
36:Франция | |
37:Габон | |
38:Гамбия | |
39:Грузия | |
40:Германия | |
41:Греция | |
42:Гватемала | |
43:Гаити | |
44:Гондурас | |
45:Гонконг | |
46:Венгрия | |
47:Исландия | |
48:Индия | |
49:Индонезия | |
50:Ирак | |
51:Иран | |
52:Ирландия | |
53:Израиль | |
54:Италия | |
55:Япония | |
56:Иордания | |
57:Кения | |
58:Кувейт | |
59:Латвия | |
60:Ливан | |
61:Либерия | |
62:Ливия | |
63:Литва | |
64:Малайзия | |
65:Мексика | |
66:Марокко | |
67:Сев.Корея | |
68:Голландия | |
69:Нов.Зеландия | |
70:Никарагуа | |
71:Нигерия | |
72:Норвегия | |
73:Оман | |
74:Пакистан | |
75:Панама | |
76:Парагвай | |
77:Перу | |
78:Филиппины | |
79:Польша | |
80:Португалия | |
81:Румыния | |
82:Россия | |
83:Руанда | |
84:Южн.Корея | |
85:Сауд.Аравия | |
86:Сенегал | |
87:Сингапур | |
88:Сомали | |
89:ЮАР | |
90:Испания | |
91:Швеция | |
92:Швейцария | |
93:Сирия | |
94:Танзания | |
95:Тайланд | |
96:Турция | |
97:ОАЭ | |
98:Англия | |
99:США | |
100:Уганда | |
101:Украина | |
102:Уругвай | |
103:Узбекистан | |
104:Венесуэла | |
105:Вьетнам | |
106:Замбия |
Самый большой кластер, это кластер №1, в него входят 73 страны, во второй 11,самым маленьким кластером является кластер №10, так как в него входит только одна страна.
|
|
Пока не ясно, что означает полученные десять кластеров, разобраться в этом помогут кластерные профили. Они представляют собой распределенные по кластерным принадлежностям средние значения переменных, которые включены в анализ.
Report | |||||||||||
Average Linkage (Between Groups) | Население | Плотность | ГН | СПЖЖ | СПЖМ | ДС | ВВП | ЭГ | СКД | ||
Mean | 8351,49 | 231,501 | 57,99 | 70,01 | 64,88 | 42,49 | 5863,90 | 3,75 | 3,727 | ||
N | |||||||||||
Mean | 35190,00 | 86,880 | 58,50 | 70,10 | 64,20 | 38,39 | 5372,90 | 3,50 | 3,240 | ||
N | |||||||||||
Mean | 126200,00 | 424,333 | 41,67 | 64,33 | 62,00 | 70,47 | 6822,67 | 3,00 | 4,233 | ||
N | |||||||||||
Mean | 152900,00 | 13,400 | 74,50 | 70,50 | 60,50 | 46,50 | 4517,00 | 4,00 | 2,250 | ||
N | |||||||||||
Mean | 1205200,00 | 124,000 | 26,00 | 69,00 | 67,00 | 52,00 | 377,00 | 3,00 | 1,800 | ||
N | |||||||||||
Mean | 61054,55 | 126,636 | 50,64 | 71,18 | 65,73 | 42,87 | 5795,09 | 3,00 | 3,236 | ||
N | |||||||||||
Mean | 90366,67 | 125,000 | 64,33 | 71,00 | 65,33 | 38,83 | 7141,67 | 3,67 | 3,700 | ||
N | |||||||||||
Mean | 911600,00 | 283,000 | 26,00 | 59,00 | 58,00 | 79,00 | 275,00 | 3,00 | 4,500 | ||
N | |||||||||||
Mean | 199700,00 | 102,000 | 29,00 | 65,00 | 61,00 | 68,00 | 681,00 | 3,00 | 2,800 | ||
N | |||||||||||
Mean | 260800,00 | 26,000 | 75,00 | 79,00 | 73,00 | 8,10 | 23474,00 | 1,00 | 2,100 | ||
N | |||||||||||
Total | Mean | 48735,46 | 201,615 | 56,58 | 69,94 | 64,75 | 43,25 | 5861,08 | 3,58 | 3,581 | |
N |
Зщадание 2
Stage | Coefficients | |
151119639,343 | ||
164963250,798 | ||
165664500,780 | ||
267744888,076 | ||
304766389,429 | ||
444260739,467 | ||
581539231,976 | ||
740028933,240 | ||
902950800,573 | ||
1556277669,580 | ||
1634526972,096 | ||
6011803841,522 | ||
20952655840,279 | ||
219695914452,958 |
Оптимальное количество кластеров для нашего случая 3. Так как всего областей мы имеем 15, а резкий скачок коэффициента произошел на 12 шаге.
|
|
Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру
Cluster Membership | |
Case | 3 Clusters |
1:Белгородская | |
2:Брянская | |
3:Ивановская | |
4:Калужская | |
5:Костромская | |
6:Курская | |
7:Липецкая | |
8:Орловская | |
9:Смоленская | |
10:Рязанская | |
11:Московская | |
12:Тамбовская | |
13:Тверская | |
14:Тульская | |
15:Ярославская |
Самым многочисленным является кластер №1,в него входят 13 областей. Во второй и третий кластеры входят по одной области.
Report | |||||||||||||
Average Linkage (Between Groups) | ОПП | ИОК | ОРТ | ОВПСХ | ДКБ | ДП | КПиО | СФР | ЧОЗБ | СДД | ИПЦ | ИЦП | |
Mean | 60876,0615 | 13512,6231 | 29585,9462 | 14297,9077 | 13033,4315 | -539,5226 | 19677,2712 | 5619,4325 | 9,8315 | 4158,3800 | 111,6615 | 115,3846 | |
N | |||||||||||||
Std. Deviation | 33901,22485 | 6257,21155 | 7463,25924 | 7078,00500 | 3077,44408 | 1342,13327 | 11933,05329 | 6971,51612 | 3,08698 | 821,27631 | 3,41310 | 8,27344 | |
Mean | 183068,0000 | 24730,0000 | 32932,0000 | 17022,0000 | 24908,8000 | 3438,3000 | 20252,0000 | 71483,9000 | 4,8000 | 4263,0000 | 112,9000 | 145,3000 | |
N | |||||||||||||
Std. Deviation | . | . | . | . | . | . | . | . | . | . | . | . | |
Mean | 379973,8000 | 136000,0000 | 291734,9000 | 20008,4000 | 115863,9000 | -5417,5800 | 178875,0000 | 50193,7000 | 36,9130 | 5884,7000 | 112,2600 | 117,3000 | |
N | |||||||||||||
Std. Deviation | . | . | . | . | . | . | . | . | . | . | . | . | |
Total | Mean | 90295,3733 | 22426,2733 | 47285,6133 | 14860,2133 | 20680,4873 | -599,5383 | 30328,7683 | 12982,0148 | 11,3015 | 4280,4427 | 111,7840 | 117,5067 |
N | |||||||||||||
Std. Deviation | 91637,21736 | 32079,16769 | 67982,40301 | 6742,53791 | 26661,38946 | 2090,46046 | 42553,49946 | 20865,39099 | 7,74903 | 880,81026 | 3,17870 | 10,86426 |