Дискриминантный анализ является разделом многомерного статистического анализа, который позволяет изучать различия между двумя и более группами объектов по нескольким переменным одновременно. Дискриминантный анализ – это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. Эти процедуры можно разделить на методы интерпретации межгрупповых различий – дискриминации и методы классификации наблюдений по группам.[3]
Цель дискриминантного анализа состоит в том, чтобы на основе некоторой «зависимой переменной» определить линейные классификационные модели, позволяющие «предсказать» поведение новых элементов (или исключенных элементов) на основании измерения ряда независимых факторов, которыми они характеризуются. Дискрминантный анализ используется как метод разведочного анализа.
Рис 4.1. Исходные данные.
Проведем дискриминантный анализ на основе рейтинга регионов России по обеспеченности населения услугами связи и среднедушевому доходу. Исходный массив данных составляет 61 регион России (исходные данные приведены на рис. 4.1), обследованных по следующим пяти признакам:
|
|
X1 – доходы от услуг связи населению в расчете на одного жителя (рублей);
Х2 – число квартирных телефонных аппаратов сети общего пользования на 1000 человек населения (на конец года; штук);
Х3 – средства связи (пользовательское оборудование) для оказания услуг передачи данных и телематических служб на 1000 человек (на конец года;штук);
Х4 – число абонентских терминалов сотовой связи на 1000 человек населения (на конец года; штук);
Х5 – среднедушевые доходы населения (рублей).
Данные показатели в ходе анализа будут являться дискриминантными.
После проведенного кластерного анализа было выделено 4 группы регионов России:
· Кластер 1: Регионы со средним уровнем оказываемых услуг связи и среднедушевого дохода.
· Кластер 2: Регионы с низким уровнем оказываемых услуг связи и среднедушевого дохода.
· Кластер 3: Регионы высоким уровнем оказываемых услуг связи и срднедушевого дохода.
· Кластер 4: Регионы с самым высоким уровнем оказываемых услуг связи и среднедушевым доходом населения.
При этом к первому классу отнесено 18 регионов России, ко второму – 15 регионов, к третьему 19 регионов и к четвертому классу было отнесено 7 регионов России.
В качестве проверки корректности обучающих выборок посмотрим результаты классификационной матрицы (табл. 4.1).
Табл. 4.1.
| Percent | G_1:1 | G_2:2 | G_3:3 | G_4:4 | ||
cases | Correct | p=,29508 | p=,24590 | p=,31148 | p=,14754 | ||
G_1:1 | 100,0000 | 18 | 0 | 0 | 0 | ||
G_2:2 | 100,0000 | 0 | 15 | 0 | 0 | ||
G_3:3 | 100,0000 | 0 | 0 | 19 | 0 | ||
G_4:4 | 88,8889
| 0 | 0 | 1 | 8 | ||
Total | 98,3607 | 18 | 15 | 20 | 8 |
Табл. 4.1. Классификационная матрица.
Как можно заметить из классификационной матрицы почти все объекты были распределены верно по кластерам, но как видно из рис. 4.2. не все объекты попали в в верную группу. Ошибочно распределенные объекты помечены знаком «*».
Рис 4.2.
Рис 4.1. Классификация случаев.
На рисунке классификации случаев (рис 4.2) некорректно отнесённым объектом оказался регион под номером 42. Это Самарская область. Изначально, она была отнесена к самой оснащённой услугами связи группе регионов.
Таким образом, задача получения корректных обучающих выборок состоит в том, чтобы исключить из обучающих выборок те объекты, которые по своим показателям не соответствуют большинству объектов, образующих однородную группу.
Для этого с помощью метрики Махаланобиса определятся расстояние от всех n объектов до центра тяжести каждой группы (вектор средних), определяемых по обучающей выборке. Отнесение экспертом i -го объекта в j -ю группу считается ошибочным, если расстояние Махаланобиса от объекта до центра его группы значительно выше, чем от него до центра других групп, а апостериорная вероятность попадания в свою группу ниже критического значения. В этом случае объект считается некорректно отнесенным и должен быть исключен из выборки.[4]
Процедура исключения объекта из обучающих выборок состоит в том, что в таблице исходных данных (рис 4.1) у объекта, который должен быть исключен из выборки (он помечен "*"), убирается номер принадлежности к этой группе, после чего процесс тестирования повторяется.
В результате дальнейшего анализа, получаем следующие таблицы (табл 4.2.; рис 4.3). Из Табл. 4.2. видно, что дискриминантный анализ выполняется корректно. Такие выводы, я делаю исходя их того факта, что лямбда Уилкса стремится к нулю, а также F-критерий значим.
Табл 4.2
Discriminant Function Analysis Summary (Spreadsheet15.sta) |
| |||||
No. of vars in model: 5; Grouping: обеспеченность услугами связи (4 grps) | ||||||
Wilks' Lambda:,08337 approx. F (15,143)=14,007 p<0,0000 |
| |||||
| Wilks' | Partial | F-remove | p-level | Toler. | 1-Toler. |
| Lambda | Lambda |
|
|
| (R-Sqr.) |
X1 | 0,125544 | 0,664058 | 8,76882 | 0,000084 | 0,845137 | 0,154863 |
X2 | 0,138232 | 0,603108 | 11,40667 | 0,000007 | 0,908463 | 0,091537 |
X3 | 0,113222 | 0,736330 | 6,20683 | 0,001100 | 0,938229 | 0,061771 |
X4 | 0,157078 | 0,530746 | 15,32512 | 0,000000 | 0,975267 | 0,024733 |
X5 | 0,093371 | 0,892876 | 2,07960 | 0,114184 | 0,879408 | 0,120592 |
|
|
|
|
|
|
|
Табл 4.2. Результат дискриминационного анализа.
Рис. 4.3.
Рис. 4.3. Классификация случаев. (после корректировки исходных данных)
Для того, чтобы определить, к какой же в итоге группе отнести оставшиёся регион, воспользуемся классификационными функциями (Рис. 4.4.):
Рис. 4.4
Рис. 4.4. Классификационные функции.
Низкая обеспеченность услугами связи (2):
Y=-4,6266-1,99176*X1-2,46057*X2-1,33796*X3-0,96914*X4-1,22773*X5
Средняя обеспеченность услугами связи (1):
Y=-1,83011-0,36842*X1+0,53239*X2-0,64585*X3-1,18771*X4-0,14687*X5
Высокая обеспеченность услугами связи (3):
Y=-2,15695-0,0259*X1+0,15373*X2-0,50246*X3+1,94243*X4+0,09723*X5
Самая высокая обеспеченность услугами связи (4):
Y=-9,72775+4,42530*X1+2,85678*X2+2,06431*X3-0,42232*X4+2,13654*X5
Подставив, соответствующие значения в эти функции получим, что Самарская область изначально была определена у нас в группу с самым высокой степенью обеспеченностью услугами связи и среднедушевым доходом, тогда как анализ классификационных функций показал, что на самом деле по рассматриваемым показателям ее следует отнести к субъектам РФ с высоким уровнем обеспеченности услугами связи и среднедушевым доходом.
Наши выводы подтверждают таблицы (Приложение 6). Расстояния квадратов Махаланобиса и Апостериорные вероятности классификации.
Расстояние Махалонобиса у рассматриваемого субъекта до третьей группы действительно минимально, а апостериорная вероятность принадлежности объекта к второй группе максимальна.
|
|
Заключение.
Влияние таких факторов, как число квартирных телефонных аппаратов на 1000 человек, число абонентских терминалов сотовой связи, средства связи для оказания услуг передачи данных и телематических служб на 1000 человек в совокупности со среднедушевым доходом населения оказывают различное влияние на доход от услуг связи населению в различных группах регионов России.
Так же было замечено, что в тех регионах, где среднедушевой доход выше, увеличивается и степень обеспеченности населения услугами связи. В особенности средствами мобильной связи.
C помощью методов кластерного и дискриминантного анализа регионы России были разбиты на четыре кластера: с очень высокой степенью обеспеченности услугами связи, с высокой степенью обеспеченности услугами связи, со средней и соответственно низкой степенями обеспеченности услугами связи.
Список литературы:
1. Кошелева В.А.«Анализ методов автоматического извлечения знаний из реляционных баз данных»
2. Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы и основы эконометрики. / Учебное пособие./ Московский государственный университет экономики, статистики и информатики. М.: МЭСИ, 2002г.
3. Буреева Н.Н. Многомерный статистический анализ с использованием ППП “STATISTICA”. Учебно-методический материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». Нижний Новгород, 2007
4. www.gks.ru
Приложение 1.
Табл. 1. Исходные данные.
| X1 | X2 | X3 | X4 | X5 | ||
Белгородская область | 2450,5 | 396,1 | 95,6 | 1211,9 | 12758 | ||
Брянская область | 2675,1 | 356,1 | 63,8 | 1103,6 | 10043 | ||
Владимирская область | 3082,7 | 346,1 | 90,4 | 1343,2 | 9596 | ||
Воронежская область | 3536,3 | 556,1 | 408,1 | 983,1 | 10305 | ||
Ивановская область | 2688,3 | 328 | 32,4 | 1400,9 | 8354 | ||
Калужская область | 3784,4 | 424 | 85,2 | 1420,4 | 11756 | ||
Костромская область | 3061,2 | 436,5 | 34,9 | 1392 | 9413 | ||
Курская область | 2781,4 | 307,1 | 45,8 | 1217,5 | 11411 | ||
Липецкая область | 3270 | 464,2 | 68,5 | 1106,5 | 12274 | ||
Орловская область | 2661 | 390,5
| 47,7 | 1186 | 9815 | ||
Рязанская область | 2960,3 | 366,4 | 70,2 | 1400,5 | 11311 | ||
Смоленская область | 3489,6 | 484 | 47,8 | 1532,2 | 11523 | ||
Тамбовская область | 2530,3 | 428 | 58,9 | 1209,6 | 11253 | ||
Тверская область | 4991,7 | 353,4 | 51,4 | 1483,4 | 10856 | ||
Тульская область | 3150,4 | 414,7 | 104,1 | 1237,3 | 11389 | ||
Ярославская область | 3408,7 | 445 | 111,2 | 1448 | 12587 | ||
Республика Карелия | 2667,1 | 463,4 | 73,4 | 1462,1 | 12229 | ||
Республика Коми | 4276,3 | 516,1 | 86,5 | 1495,4 | 18636 | ||
Архангельская область | 2784,6 | 428,5 | 82,2 | 1476,2 | 14824 | ||
Вологодская область | 2000,9 | 402,5 | 76,5 | 1523,1 | 12194 | ||
Калининградская область | 4252 | 340,1 | 66 | 1581,2 | 12922 | ||
Мурманская область | 3315,4 | 451,7 | 91,4 | 1790,1 | 18773 | ||
Новгородская область | 2495,5 | 456,9 | 66,2 | 1546,6 | 11646 | ||
Псковская область | 2557,5 | 434,9 | 29,8 | 1404,7 | 10291 | ||
Республика Адыгея | 1258,8 | 304,2 | 26,1 | 707,4 | 7986 | ||
Кабардино-Балкарская Республика | 2561,9 | 301 | 27,8 | 956,7 | 8589 | ||
Республика Калмыкия | 1769,8 | 360,8 | 6,3 | 1255 | 5651 | ||
Карачаево-Черкесская Республика | 2661,4 | 323,6 | 13,1 | 1203,1 | 8676 | ||
Республика Северная Осетия - Алания | 3786,9 | 427,7 | 27,6 | 1027,6 | 9838 | ||
Астраханская область | 3642 | 387,8 | 100,7 | 1490,1 | 11120 | ||
Волгоградская область | 2744,6 | 385,4 | 424,3 | 1296,8 | 10866 | ||
Ростовская область | 3306 | 356,6 | 247,2 | 1100,2 | 12161 | ||
Республика Башкортостан | 3035,1 | 403,5 | 341,2 | 1283 | 14253 | ||
Республика Марий Эл | 2304,6 | 361,4 | 33,8 | 1313,5 | 7843 | ||
Республика Мордовия | 2862,5 | 482,8 | 47,8 | 1287,7 | 8384 | ||
Удмуртская Республика | 2681,3 | 378 | 165,7 | 1161 | 9581 | ||
Чувашская Республика | 2142,8 | 358,6 | 80,4 | 1299,8 | 8594 | ||
Пермский край | 3298,9 | 394,6 | 172,1 | 1335,2 | 16119 | ||
Кировская область | 2763,6 | 395,7 | 64,8 | 1152,5 | 10112 | ||
Оренбургская область | 2283,8 | 416,9 | 118,8 | 1215,5 | 10184 | ||
Пензенская область | 2991,7 | 398,8 | 89,7 | 1267,6 | 10173 | ||
Самарская область | 4097,9 | 424,4 | 250,6 | 1570,3 | 15805 | ||
Саратовская область | 3170,8 | 416,3 | 186,5 | 1317,1 | 9062 | ||
Ульяновская область | 3777,9 | 409,1 | 64,8 | 1361,4 | 9756 | ||
Курганская область | 2623,6 | 397,1 | 55,7 | 1180,6 | 11161 | ||
Челябинская область | 3278,9 | 369,7 | 258,8 | 1522,1 | 14161 | ||
Республика Алтай | 1488,7 | 346,9 | 20,7 | 1006,2 | 10173 | ||
Республика Бурятия | 2805,5 | 323,6 | 35 | 1244 | 11299 | ||
Республика Хакасия | 3986,4 | 331,8 | 97,7 | 1408,6 | 10764 | ||
Алтайский край | 2882,4 | 447,9 | 289,2 | 1125,1 | 9749 | ||
Забайкальский край | 3553,4 | 272,5 | 25,5 | 1018,9 | 10972 | ||
Красноярский край | 4186,1 | 376,6 | 466,4 | 1385,9 | 15605 | ||
Иркутская область | 3591,5 | 299,9 | 105 | 1505,7 | 12882 | ||
Кемеровская область | 3249,6 | 308,8 | 439,9 | 1235 | 14439 | ||
Новосибирская область | 4921,5 | 448,1 | 729,9 | 1337,9 | 12838 | ||
Томская область | 4172,6 | 538,6 | 222,6 | 1232,2 | 13482 | ||
Республика Саха (Якутия) | 5396,1 | 454,2 | 61,4 | 957,2 | 18741 | ||
Камчатский край | 6735 | 531,2 | 43,5 | 1421,1 | 19063 | ||
Приморский край | 5236,5 | 407,5 | 258 | 1531 | 12808 | ||
Хабаровский край | 5334,7 | 393,6 | 137,8 | 1315,6 | 15705 | ||
Амурская область | 3809,1 | 290,6 | 49,9 | 1295,9 | 11936 | ||
Сахалинская область | 7182,2 | 459,7 | 29,8 | 1329,9 | 24552 |
Приложение 2
Рис 1. График распределения показателей по регионам X1 и X2.
Рис 2. График распределения показателей по регионам X1 и X3.
Рис 3. График распределения показателей по регионам X1 и X2.
Приложение 3
Табл. 1 Стандартизированный данные
| X1 | X2 | X3 | X4 | X5 |
Белгородская область | -0,813135 | 0,004700974 | -0,23073167 | -0,45344367 | 0,29237491 |
Брянская область | -0,591355 | -0,65074913 | -0,46275516 | -1,02263269 | -0,57138775 |
Владимирская область | -0,188871 | -0,81461165 | -0,26867262 | 0,236625756 | -0,71359839 |
Воронежская область | 0,2590349 | 2,626501386 | 2,04937333 | -1,65594088 | -0,48803385 |
Ивановская область | -0,57832 | -1,11120283 | -0,69186011 | 0,539877894 | -1,10873402 |
Калужская область | 0,5040206 | 0,461877421 | -0,30661357 | 0,642363452 | -0,026406 |
Костромская область | -0,210101 | 0,666705578 | -0,67361927 | 0,493102435 | -0,77181886 |
Курская область | -0,486389 | -1,4536755 | -0,59408921 | -0,42401192 | -0,1361659 |
Липецкая область | -0,003922 | 1,120604774 | -0,42846238 | -1,00739125 | 0,13839291 |
Орловская область | -0,605278 | -0,08706204 | -0,58022617 | -0,58956551 | -0,64392472 |
Рязанская область | -0,309735 | -0,48197073 | -0,41605861 | 0,537775627 | -0,16798036 |
Смоленская область | 0,2129211 | 1,445052575 | -0,57949654 | 1,229947319 | -0,1005337 |
Тамбовская область | -0,734337 | 0,527422431 | -0,49850721 | -0,46553171 | -0,18643275 |
Тверская область | 1,6961655 | -0,69499201 | -0,55322973 | 0,97347064 | -0,31273617 |
Тульская область | -0,122021 | 0,309485272 | -0,16871282 | -0,31994966 | -0,14316508 |
Ярославская область | 0,1330367 | 0,805988725 | -0,11690883 | 0,787419935 | 0,23797218 |
Республика Карелия | -0,599254 | 1,107495772 | -0,39271033 | 0,861524877 | 0,1240764 |
Республика Коми | 0,9897458 | 1,971051283 | -0,29712833 | 1,036538676 | 2,16242901 |
Архангельская область | -0,483229 | 0,535615557 | -0,32850258 | 0,935629819 | 0,9496617 |
Вологодская область | -1,257091 | 0,109572991 | -0,37009169 | 1,182120725 | 0,11294134 |
Калининградская область | 0,9657509 | -0,91292917 | -0,44670322 | 1,487475131 | 0,34455063 |
Мурманская область | 0,0409078 | 0,915776617 | -0,26137629 | 2,58538452 | 2,20601482 |
Новгородская область | -0,7687 | 1,00098513 | -0,44524395 | 1,305628962 | -0,06140191 |
Псковская область | -0,707478 | 0,640487574 | -0,71083058 | 0,559849439 | -0,49248788 |
Республика Адыгея | -1,989876 | -1,50119564 | -0,73782703 | -3,104929 | -1,22581124 |
Кабардино-Балкарская Республика | -0,703134 | -1,55363165 | -0,72542326 | -1,79469056 | -1,03397003 |
Республика Калмыкия | -1,485291 | -0,57373374 | -0,88229448 | -0,22692431 | -1,96867894 |
Карачаево-Черкесская Республика | -0,604883 | -1,18330234 | -0,8326794 | -0,49969356 | -1,00629145 |
Республика Северная Осетия - Алания | 0,5064892 | 0,522506555 | -0,72688252 | -1,42206358 | -0,63660739 |
Астраханская область | 0,3634081 | -0,13130492 | -0,19352036 | 1,008683627 | -0,22874598 |
Волгоградская область | -0,522727 | -0,17063193 | 2,16757397 | -0,00723732 | -0,30955472 |
Ростовская область | 0,0316258 | -0,642556 | 0,87539286 | -1,04050197 | 0,10244257 |
Республика Башкортостан | -0,235874 | 0,125959243 | 1,56124845 | -0,07976556 | 0,76800112 |
Республика Марий Эл | -0,957204 | -0,56390199 | -0,68164524 | 0,080532367 | -1,27130592 |
Республика Мордовия | -0,406307 | 1,425389072 | -0,57949654 | -0,05506391 | -1,09918968 |
Удмуртская Республика | -0,585232 | -0,2918902 | 0,28074148 | -0,72095725 | -0,71837056 |
Чувашская Республика | -1,116973 | -0,6097835 | -0,34163598 | 0,008529693 | -1,03237931 |
Пермский край | 0,024615 | -0,0198784 | 0,32743803 | 0,194580399 | 1,36165899 |
Кировская область | -0,503966 | -0,00185353 | -0,45545882 | -0,76563045 | -0,54943577 |
Оренбургская область | -0,977743 | 0,345535028 | -0,06145668 | -0,43452326 | -0,52652935 |
Пензенская область | -0,278729 | 0,048943856 | -0,27378006 | -0,16070287 | -0,53002894 |
Самарская область | 0,8135852 | 0,468431922 | 0,90020041 | 1,430188332 | 1,26176158 |
Саратовская область | -0,101877 | 0,335703276 | 0,43250527 | 0,099452778 | -0,88348762 |
Ульяновская область | 0,4976022 | 0,217722258 | -0,45545882 | 0,332278943 | -0,66269525 |
Курганская область | -0,642208 | 0,021087227 | -0,52185548 | -0,61794613 | -0,21570206 |
Челябинская область | 0,004866 | -0,42789609 | 0,96003036 | 1,176865055 | 0,73873182 |
Республика Алтай | -1,762862 | -0,80150265 | -0,77722724 | -1,53453491 | -0,53002894 |
Республика Бурятия | -0,462591 | -1,18330234 | -0,67288964 | -0,28473667 | -0,1717981 |
Республика Хакасия | 0,7034849 | -1,04893507 | -0,21540937 | 0,580346551 | -0,34200547 |
Алтайский край | -0,386657 | 0,853508857 | 1,18183898 | -0,90963579 | -0,66492226 |
Забайкальский край | 0,2759203 | -2,02063984 | -0,74220483 | -1,46778791 | -0,27583139 |
Красноярский край | 0,9006781 | -0,31483095 | 2,47474972 | 0,46104285 | 1,19813266 |
Иркутская область | 0,313542 | -1,57165652 | -0,16214612 | 1,090672073 | 0,33182484 |
Кемеровская область | -0,024066 | -1,42581888 | 2,28139681 | -0,3320377 | 0,82717602 |
Новосибирская область | 1,6268467 | 0,856786108 | 4,39733426 | 0,208770707 | 0,31782648 |
Томская область | 0,8873476 | 2,339741966 | 0,695903 | -0,34675357 | 0,52271162 |
Республика Саха (Якутия) | 2,0954892 | 0,956742249 | -0,48026637 | -1,79206273 | 2,1958342 |
Приморский край | 1,9378926 | 0,191504253 | 0,95419329 | 1,223640515 | 0,30828214 |
Хабаровский край | 2,0348599 | -0,03626466 | 0,0771737 | 0,091569274 | 1,22994712 |
Амурская область | 0,5284105 | -1,72404867 | -0,56417423 | -0,01196742 | 0,03086003 |
Сахалинская область | 3,8591686 | 1,046866638 | -0,71083058 | 0,16672535 | 4,04457261 |
Приложение 4.
Рис 1. Евклидова метрика. Метод ближнего соседа.
Рис 1. Евклидова метрика. Метод дальнего соседа.
Приложение 5
Табл. 1 Члены кластера №1 с соответствующими расстояниями.
Табл. 2 Члены кластера №2 с соответствующими расстояниями
Табл. 3 Члены кластера № 3 с соответствующими расстояниями.
Табл. 4 Члены кластера №4 с соответствующими расстояниями.
Приложение 6
1 кластер:
X1=-0,5248-0,3774*X4
Табл 1.
| Y(X1 расчитанное) | X2 | X3 | X4 | X5 |
Белгородская область | -0,3537 | 0,004701 | -0,23073 | -0,45344 | 0,292375 |
Воронежская область | 0,1002 | 2,626501 | 2,049373 | -1,65594 | -0,48803 |
Липецкая область | -0,1446 | 1,120605 | -0,42846 | -1,00739 | 0,138393 |
Тамбовская область | -0,3491 | 0,527422 | -0,49851 | -0,46553 | -0,18643 |
Тульская область | -0,4041 | 0,309485 | -0,16871 | -0,31995 | -0,14317 |
Республика Северная Осетия - Алания | 0,0119 | 0,522507 | -0,72688 | -1,42206 | -0,63661 |
Волгоградская область | -0,5221 | -0,17063 | 2,167574 | -0,00724 | -0,30955 |
Ростовская область | -0,1321 | -0,64256 | 0,875393 | -1,0405 | 0,102443 |
Республика Башкортостан | -0,4947 | 0,125959 | 1,561248 | -0,07977 | 0,768001 |
Республика Мордовия | -0,5040 | 1,425389 | -0,5795 | -0,05506 | -1,09919 |
Удмуртская Республика | -0,2527 | -0,29189 | 0,280741 | -0,72096 | -0,71837 |
Кировская область | -0,2359 | -0,00185 | -0,45546 | -0,76563 | -0,54944 |
Оренбургская область | -0,3608 | 0,345535 | -0,06146 | -0,43452 | -0,52653 |
Пензенская область | -0,4642 | 0,048944 | -0,27378 | -0,1607 | -0,53003 |
Саратовская область | -0,5623 | 0,335703 | 0,432505 | 0,099453 | -0,88349 |
Курганская область | -0,2916 | 0,021087 | -0,52186 | -0,61795 | -0,2157 |
Алтайский край | -0,1815 | 0,853509 | 1,181839 | -0,90964 | -0,66492 |
Кемеровская область | -0,3995 | -1,42582 | 2,281397 | -0,33204 | 0,827176 |
сумма | Y=-5,5407 |
|
| -10,3489 |
|
|
|
| -0,57494 |
| |
|
|
| Э4= | -0,03916 |
|
2 кластер:
X1=0,1144+0,3002*X4+0,8074*X5
Табл 2.
| Y (X1 рассчитанное) | X2 | X3 | X4 | X5 |
Брянская область | -0,65393 | -0,65075 | -0,46276 | -1,02263 | -0,57139 |
Владимирская область | -0,39072 | -0,81461 | -0,26867 | 0,236626 | -0,7136 |
Ивановская область | -0,61872 | -1,1112 | -0,69186 | 0,539878 | -1,10873 |
Курская область | -0,12283 | -1,45368 | -0,59409 | -0,42401 | -0,13617 |
Орловская область | -0,58249 | -0,08706 | -0,58023 | -0,58957 | -0,64392 |
Республика Адыгея | -1,80742 | -1,5012 | -0,73783 | -3,10493 | -1,22581 |
Кабардино-Балкарская Республика | -1,25919 | -1,55363 | -0,72542 | -1,79469 | -1,03397 |
Республика Калмыкия | -1,54323 | -0,57373 | -0,88229 | -0,22692 | -1,96868 |
Карачаево-Черкесская Республика | -0,84809 | -1,1833 | -0,83268 | -0,49969 | -1,00629 |
Республика Марий Эл | -0,88788 | -0,5639 | -0,68165 | 0,080532 | -1,27131 |
Чувашская Республика | -0,71658 | -0,60978 | -0,34164 | 0,00853 | -1,03238 |
Республика Алтай | -0,77421 | -0,8015 | -0,77723 | -1,53453 | -0,53003 |
Республика Бурятия | -0,10979 | -1,1833 | -0,67289 | -0,28474 | -0,1718 |
Забайкальский край | -0,54894 | -2,02064 | -0,7422 | -1,46779 | -0,27583 |
Амурская область | 0,135724 | -1,72405 | -0,56417 | -0,01197 | 0,03086 |
сумма | Y=-10,7283 |
|
| -10,0959 | -11,659 |
|
|
|
| -0,63099 | -0,72869 |
|
|
| Э4 и Э5 соответственно: | 0,017657 | 0,05484 |
3 Кластер:
X1=0,1155-0,4086*X2
Табл 3.
| Y (X1 рассчитанное) | X2 | X3 | X4 | X5 |
Калужская область | -0,0732231 | 0,4618774 | -0,3066136 | 0,6423635 | -0,026406 |
Костромская область | -0,1569159 | 0,6667056 | -0,6736193 | 0,4931024 | -0,7718189 |
Рязанская область | 0,3124332 | -0,4819707 | -0,4160586 | 0,5377756 | -0,1679804 |
Смоленская область | -0,4749485 | 1,4450526 | -0,5794965 | 1,2299473 | -0,1005337 |
Тверская область | 0,3994737 | -0,694992 | -0,5532297 | 0,9734706 | -0,3127362 |
Ярославская область | -0,213827 | 0,8059887 | -0,1169088 | 0,7874199 | 0,2379722 |
Республика Карелия | -0,3370228 | 1,1074958 | -0,3927103 | 0,8615249 | 0,1240764 |
Архангельская область | -0,1033525 | 0,5356156 | -0,3285026 | 0,9356298 | 0,9496617 |
Вологодская область | 0,0707285 | 0,109573 | -0,3700917 | 1,1821207 | 0,1129413 |
Калининградская область | 0,4885229 | -0,9129292 | -0,4467032 | 1,4874751 | 0,3445506 |
Мурманская область | -0,2586863 | 0,9157766 | -0,2613763 | 2,5853845 | 2,2060148 |
Новгородская область | -0,2935025 | 1,0009851 | -0,445244 | 1,305629 | -0,0614019 |
Псковская область | -0,1462032 | 0,6404876 | -0,7108306 | 0,5598494 | -0,4924879 |
Астраханская область | 0,1691512 | -0,1313049 | -0,1935204 | 1,0086836 | -0,228746 |
Пермский край | 0,1236223 | -0,0198784 | 0,327438 | 0,1945804 | 1,361659 |
Ульяновская область | 0,0265387 | 0,2177223 | -0,4554588 | 0,3322789 | -0,6626953 |
Челябинская область | 0,2903383 | -0,4278961 | 0,9600304 | 1,1768651 | 0,7387318 |
Республика Хакасия | 0,5440949 | -1,0489351 | -0,2154094 | 0,5803466 | -0,3420055 |
Иркутская область | 0,7576789 | -1,5716565 | -0,1621461 | 1,0906721 | 0,3318248 |
сумма | Y=1,1249007 | 2,6177173 |
|
|
|
|
| 0,1377746 |
|
|
|
|
| Э2=-0,0500441 |
|
|
|
4 Кластер:
X1=1,7055-0,6151*X2+0,5564*X5
Табл 4.
| Y (X1 рассчитанное) | X2 | X3 | X4 | X5 |
Республика Коми | 1,696282 | 1,971051 | -0,29713 | 1,036539 | 2,162429 |
Новосибирская область | 1,35533 | 0,856786 | 4,397334 | 0,208771 | 0,317826 |
Томская область | 0,557161 | 2,339742 | 0,695903 | -0,34675 | 0,522712 |
Республика Саха (Якутия) | 2,33877 | 0,956742 | -0,48027 | -1,79206 | 2,195834 |
Приморский край | 1,759234 | 0,191504 | 0,954193 | 1,223641 | 0,308282 |
Хабаровский край | 2,412149 | -0,03626 | 0,077174 | 0,091569 | 1,229947 |
Сахалинская область | 3,311973 | 1,046867 | -0,71083 | 0,166725 | 4,044573 |
сумма: | Y=13,4309 | 7,326428 |
|
| 10,7816 |
|
| 1,046633 |
| 1,540229 | |
|
| Э2=-0,04793 |
| Э5= | 0,063807 |
Приложение 7.
Рис. 1. Квадрат Мааланобисных расстояний
Рис. 2 Апостерирорные вероятности.
[1] Кошелева В.А.«Анализ методов автоматического извлечения знаний из реляционных баз данных»
[2] Дубров А.М., Мхитарян В.С., Трошин Л.И. Многомерные статистические методы и основы эконометрики. / Учебное пособие./ Московский государственный университет экономики, статистики и информатики. М.: МЭСИ, 2002г.
[3] Буреева Н.Н. Многомерный статистический анализ с использованием ППП “STATISTICA”. Учебно-методический материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». Нижний Новгород, 2007
[4] Буреева Н.Н. Многомерный статистический анализ с использованием ППП “STATISTICA”. Учебно-методический материал по программе повышения квалификации «Применение программных средств в научных исследованиях и преподавании математики и механики». Нижний Новгород, 2007