Требуется:
1. Определить наиболее подходящее количество кластеров для разбиения областей на группы по всем пяти признакам.
2. Провести классификацию регионов иерархическим методом
3. Дать графическое представление процесса объединения областей в виде дендрограммы
4. Для каждого из полученных кластеров дать содержательную интерпретацию, определив кластерные профили
1.Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.
| Шаг | Коэффициенты | |
| 43,430 | ||
| 62,260 | ||
| 87,850 | ||
| 88,850 | ||
| 132,115 | ||
| 139,910 | ||
| 156,987 | ||
| 168,525 | ||
| 266,345 | ||
| 298,305 | ||
| 386,649 | ||
| 460,167 | ||
| 523,984 | ||
| 938,968 | ||
| 1030,199 | ||
| 11889,051 |
Оптимальное количество кластеров для нашего случая 3. Так как всего областей мы имеем 17, а резкий скачок коэффициента произошел на 14 шаге.
Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру.
| Cluster Membership | |
| Области | № кластера |
| 1:Белгород | |
| 2:Брянская | |
| 3:Владимер | |
| 4:Воронежс | |
| 5:Ивановск | |
| 6:Калужска | |
| 7:Костромс | |
| 8:Курская | |
| 9:Липецкая | |
| 10:Московск | |
| 11:Орловска | |
| 12:Рязанска | |
| 13:Смоленск | |
| 14:Тамбовск | |
| 15:Тверская | |
| 16:Тульская | |
| 17:Ярославс |
Самым многочисленным кластером является кластер 1,он включает в себя 11 областей. Самый малочисленный кластер, это кластер 2, в него входят 2 области. А в третий кластер входят 4 области.

На дедрограмме графически представлен процесс объединения кластеров.
Пока не ясно, что означает полученные три кластера, разобраться в этом помогут кластерные профили. Они представляют собой распределенные по кластерным принадлежностям средние значения переменных, которые включены в анализ.
| Report | ||||||
| Average Linkage (Between Groups) | потреб.цены | цены_производителей.пром.продукци | реализованная_сх_продукция | цены_в_строительстве | тариф_на_грузоперевозки | |
| Mean | 113,6250 | 117,4417 | 117,1000 | 115,1083 | 110,5000 | |
| Mean | 112,9750 | 118,6000 | 116,6250 | 110,7000 | 136,7000 | |
| Mean | 112,2000 | 114,9000 | 150,0000 | 111,7000 | 114,0000 | |
| Total | Mean | 113,3882 | 117,5647 | 118,9235 | 113,8706 | 116,8706 |
В первый кластер входят 11 предприятий и характеризуется тем, что средний индекс цен почти одинаков. Второй кластер характеризуется тем, что произошел резкий скачок на реализованную с/х продукцию, и он включает в себя 2 области. В третий кластер входят 4 области и они характеризуется высоким средним значением индекса цен грузоперевозок.
Самостоятельная работа№2
1. Определить оптимальное количество кластеров.
2. Распределить объекты по кластерам.
3. Дать интерпретацию полученным группам.
Вариант 1
1.Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.
| Stage | Coefficients |
| 9830,210 | |
| 82323,210 | |
| 126270,620 | |
| 163799,960 | |
| 190640,360 | |
| 230089,890 | |
| 281175,090 | |
| 281464,810 | |
| 344043,180 | |
| 447087,530 | |
| 449165,265 | |
| 488141,145 | |
| 510204,010 | |
| 515271,330 | |
| 549834,420 | |
| 560128,860 | |
| 624948,290 | |
| 707831,410 | |
| 778139,070 | |
| 839347,200 | |
| 895246,000 | |
| 901098,565 | |
| 907831,875 | |
| 1025181,930 | |
| 1062127,495 | |
| 1070613,617 | |
| 1094470,180 | |
| 1241202,920 | |
| 1250363,580 | |
| 1261139,250 | |
| 1316712,250 | |
| 1472217,250 | |
| 1546283,885 | |
| 1551780,405 | |
| 1608766,260 | |
| 1665552,310 | |
| 2043511,427 | |
| 2102043,060 | |
| 2325271,425 | |
| 2586282,540 | |
| 2693655,800 | |
| 2810398,410 | |
| 2938839,440 | |
| 3792625,825 | |
| 3878973,007 | |
| 3943217,058 | |
| 4027173,312 | |
| 4079041,080 | |
| 4348095,000 | |
| 4936720,982 | |
| 4972544,370 | |
| 5206572,817 | |
| 5710031,330 | |
| 5750614,710 | |
| 5999778,558 | |
| 6049905,780 | |
| 6387523,850 | |
| 6828119,630 | |
| 8142412,715 | |
| 9609286,260 | |
| 10083589,890 | |
| 10207355,612 | |
| 11296332,010 | |
| 12033888,162 | |
| 12606829,165 | |
| 13356336,337 | |
| 13482902,513 | |
| 13623999,450 | |
| 15091128,541 | |
| 16492789,490 | |
| 18853962,873 | |
| 20256065,025 | |
| 26079062,393 | |
| 26627575,590 | |
| 28838695,890 | |
| 28986176,487 | |
| 34159237,991 | |
| 38630769,890 | |
| 42520142,521 | |
| 50732503,240 | |
| 50751409,445 | |
| 54404339,739 | |
| 55468875,044 | |
| 63807188,823 | |
| 73475997,450 | |
| 80622082,890 | |
| 97737378,585 | |
| 148359211,876 | |
| 178936276,657 | |
| 179888925,093 | |
| 223362578,253 | |
| 266544908,400 | |
| 321112131,483 | |
| 356560919,319 | |
| 386094344,385 | |
| 445007867,200 | |
| 823664804,058 | |
| 829952747,491 | |
| 1956921178,046 | |
| 2501486811,085 | |
| 4252742673,500 | |
| 11507808743,037 | |
| 44249013078,627 | |
| 86200996602,290 | |
| 1082555211715,647 |
Оптимальное количество кластеров для нашего случая 10. Так как всего областей мы имеем 106, а резкий скачок коэффициента произошел на 96 шаге.
Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру
| Cluster Membership | |
| Case | 10 Clusters |
| 1:Афганистан | |
| 2:Аргентина | |
| 3:Армения | |
| 4:Австралия | |
| 5:Австрия | |
| 6:Азербайджан | |
| 7:Бахрейн | |
| 8:Бангладеш | |
| 9:Барбадос | |
| 10:Беларусь | |
| 11:Бельгия | |
| 12:Боливия | |
| 13:Ботсвана | |
| 14:Бразилия | |
| 15:Болгария | |
| 16:Буркина Фасо | |
| 17:Бурунди | |
| 18:Камбоджа | |
| 19:Камерун | |
| 20:Канада | |
| 21:ЦАР | |
| 22:Чили | |
| 23:Китай | |
| 24:Колумбия | |
| 25:Коста Рика | |
| 26:Хорватия | |
| 27:Куба | |
| 28:Дания | |
| 29:Доминик.респ | |
| 30:Эквадор | |
| 31:Египет | |
| 32:Сальвадор | |
| 33:Эстония | |
| 34:Эфиопия | |
| 35:Финляндия | |
| 36:Франция | |
| 37:Габон | |
| 38:Гамбия | |
| 39:Грузия | |
| 40:Германия | |
| 41:Греция | |
| 42:Гватемала | |
| 43:Гаити | |
| 44:Гондурас | |
| 45:Гонконг | |
| 46:Венгрия | |
| 47:Исландия | |
| 48:Индия | |
| 49:Индонезия | |
| 50:Ирак | |
| 51:Иран | |
| 52:Ирландия | |
| 53:Израиль | |
| 54:Италия | |
| 55:Япония | |
| 56:Иордания | |
| 57:Кения | |
| 58:Кувейт | |
| 59:Латвия | |
| 60:Ливан | |
| 61:Либерия | |
| 62:Ливия | |
| 63:Литва | |
| 64:Малайзия | |
| 65:Мексика | |
| 66:Марокко | |
| 67:Сев.Корея | |
| 68:Голландия | |
| 69:Нов.Зеландия | |
| 70:Никарагуа | |
| 71:Нигерия | |
| 72:Норвегия | |
| 73:Оман | |
| 74:Пакистан | |
| 75:Панама | |
| 76:Парагвай | |
| 77:Перу | |
| 78:Филиппины | |
| 79:Польша | |
| 80:Португалия | |
| 81:Румыния | |
| 82:Россия | |
| 83:Руанда | |
| 84:Южн.Корея | |
| 85:Сауд.Аравия | |
| 86:Сенегал | |
| 87:Сингапур | |
| 88:Сомали | |
| 89:ЮАР | |
| 90:Испания | |
| 91:Швеция | |
| 92:Швейцария | |
| 93:Сирия | |
| 94:Танзания | |
| 95:Тайланд | |
| 96:Турция | |
| 97:ОАЭ | |
| 98:Англия | |
| 99:США | |
| 100:Уганда | |
| 101:Украина | |
| 102:Уругвай | |
| 103:Узбекистан | |
| 104:Венесуэла | |
| 105:Вьетнам | |
| 106:Замбия |
Самый большой кластер, это кластер №1, в него входят 73 страны, во второй 11,самым маленьким кластером является кластер №10, так как в него входит только одна страна.
Пока не ясно, что означает полученные десять кластеров, разобраться в этом помогут кластерные профили. Они представляют собой распределенные по кластерным принадлежностям средние значения переменных, которые включены в анализ.
| Report | |||||||||||
| Average Linkage (Between Groups) | Население | Плотность | ГН | СПЖЖ | СПЖМ | ДС | ВВП | ЭГ | СКД | ||
| Mean | 8351,49 | 231,501 | 57,99 | 70,01 | 64,88 | 42,49 | 5863,90 | 3,75 | 3,727 | ||
| N | |||||||||||
| Mean | 35190,00 | 86,880 | 58,50 | 70,10 | 64,20 | 38,39 | 5372,90 | 3,50 | 3,240 | ||
| N | |||||||||||
| Mean | 126200,00 | 424,333 | 41,67 | 64,33 | 62,00 | 70,47 | 6822,67 | 3,00 | 4,233 | ||
| N | |||||||||||
| Mean | 152900,00 | 13,400 | 74,50 | 70,50 | 60,50 | 46,50 | 4517,00 | 4,00 | 2,250 | ||
| N | |||||||||||
| Mean | 1205200,00 | 124,000 | 26,00 | 69,00 | 67,00 | 52,00 | 377,00 | 3,00 | 1,800 | ||
| N | |||||||||||
| Mean | 61054,55 | 126,636 | 50,64 | 71,18 | 65,73 | 42,87 | 5795,09 | 3,00 | 3,236 | ||
| N | |||||||||||
| Mean | 90366,67 | 125,000 | 64,33 | 71,00 | 65,33 | 38,83 | 7141,67 | 3,67 | 3,700 | ||
| N | |||||||||||
| Mean | 911600,00 | 283,000 | 26,00 | 59,00 | 58,00 | 79,00 | 275,00 | 3,00 | 4,500 | ||
| N | |||||||||||
| Mean | 199700,00 | 102,000 | 29,00 | 65,00 | 61,00 | 68,00 | 681,00 | 3,00 | 2,800 | ||
| N | |||||||||||
| Mean | 260800,00 | 26,000 | 75,00 | 79,00 | 73,00 | 8,10 | 23474,00 | 1,00 | 2,100 | ||
| N | |||||||||||
| Total | Mean | 48735,46 | 201,615 | 56,58 | 69,94 | 64,75 | 43,25 | 5861,08 | 3,58 | 3,581 | |
| N |
Зщадание 2
| Stage | Coefficients | |
| 151119639,343 | ||
| 164963250,798 | ||
| 165664500,780 | ||
| 267744888,076 | ||
| 304766389,429 | ||
| 444260739,467 | ||
| 581539231,976 | ||
| 740028933,240 | ||
| 902950800,573 | ||
| 1556277669,580 | ||
| 1634526972,096 | ||
| 6011803841,522 | ||
| 20952655840,279 | ||
| 219695914452,958 |
Оптимальное количество кластеров для нашего случая 3. Так как всего областей мы имеем 15, а резкий скачок коэффициента произошел на 12 шаге.
Теперь организуем для каждого наблюдения ввод информации о принадлежности к кластеру
| Cluster Membership | |
| Case | 3 Clusters |
| 1:Белгородская | |
| 2:Брянская | |
| 3:Ивановская | |
| 4:Калужская | |
| 5:Костромская | |
| 6:Курская | |
| 7:Липецкая | |
| 8:Орловская | |
| 9:Смоленская | |
| 10:Рязанская | |
| 11:Московская | |
| 12:Тамбовская | |
| 13:Тверская | |
| 14:Тульская | |
| 15:Ярославская |
Самым многочисленным является кластер №1,в него входят 13 областей. Во второй и третий кластеры входят по одной области.
| Report | |||||||||||||
| Average Linkage (Between Groups) | ОПП | ИОК | ОРТ | ОВПСХ | ДКБ | ДП | КПиО | СФР | ЧОЗБ | СДД | ИПЦ | ИЦП | |
| Mean | 60876,0615 | 13512,6231 | 29585,9462 | 14297,9077 | 13033,4315 | -539,5226 | 19677,2712 | 5619,4325 | 9,8315 | 4158,3800 | 111,6615 | 115,3846 | |
| N | |||||||||||||
| Std. Deviation | 33901,22485 | 6257,21155 | 7463,25924 | 7078,00500 | 3077,44408 | 1342,13327 | 11933,05329 | 6971,51612 | 3,08698 | 821,27631 | 3,41310 | 8,27344 | |
| Mean | 183068,0000 | 24730,0000 | 32932,0000 | 17022,0000 | 24908,8000 | 3438,3000 | 20252,0000 | 71483,9000 | 4,8000 | 4263,0000 | 112,9000 | 145,3000 | |
| N | |||||||||||||
| Std. Deviation | . | . | . | . | . | . | . | . | . | . | . | . | |
| Mean | 379973,8000 | 136000,0000 | 291734,9000 | 20008,4000 | 115863,9000 | -5417,5800 | 178875,0000 | 50193,7000 | 36,9130 | 5884,7000 | 112,2600 | 117,3000 | |
| N | |||||||||||||
| Std. Deviation | . | . | . | . | . | . | . | . | . | . | . | . | |
| Total | Mean | 90295,3733 | 22426,2733 | 47285,6133 | 14860,2133 | 20680,4873 | -599,5383 | 30328,7683 | 12982,0148 | 11,3015 | 4280,4427 | 111,7840 | 117,5067 |
| N | |||||||||||||
| Std. Deviation | 91637,21736 | 32079,16769 | 67982,40301 | 6742,53791 | 26661,38946 | 2090,46046 | 42553,49946 | 20865,39099 | 7,74903 | 880,81026 | 3,17870 | 10,86426 |






