Многомерные группировки

Если задача правильного выбора признака в качестве основания группировки представляется сложной, то еще более сложной является задача составления группировки по нескольким признакам. Комби­нация двух признаков позволяет сохранить обозримость таблицы, но комбинация трех или четырех признаков дает совершенно неудовлет­ворительный результат: ведь даже при выделении трех категорий по каждому группировочному признаку мы получим 9 или 12 подгрупп. Равномерность распределения единиц по группам в принципе невоз­можна. Вот и получаются группы, в которые входят 1-2 наблюдения. Сохранить сложность описания групп и вместе с тем преодолеть недо­статки комбинационной группировки позволяют методы многомерных устойчивых группировок (многомерной классификации).

Для проведения многомерной классификации необходимо:

- сформулировать цель классификации;

- выделить комплекс признаков классификации;

 

59)определить меру сходства объектов;

59) выбрать программу классификации;

59)рассчитать варианты классификации;

59)оценить результаты.

Исходные данные для задачи многомерной классификации могут быть представлены в виде матрицы «объект-признак». Стро­ками ее являются значения признаков, характеризующих соответ­ствующий объект, а столбцами - значение каждого признака для рассматриваемой совокупности объектов.

Выделяют несколько типов мер сходства:

59)коэффициент подобия;

59)коэффициент связи;

59) многомерные средние;

59) показатели расстояния.

Простейшим вариантом многомерной классификации являет­ся группировка на основе многомерных оценок.

Многомерной характеристикой называется совокупность зна­чений нескольких признаков для одной единицы совокупности. Поскольку нельзя рассчитать эту величину по абсолютным зна­чениям разных признаков (разнокачественных, выраженных в разных единицах измерения), то многомерная характеристика вычисляется из относительных величин, как правило, из отноше­ний абсолютных значений признаков для единицы совокупности к средним значениям этих признаков.

Чем больше величина коэффициентов подобия и связи, тем «ближе» объекты друг к другу, и наоборот, чем меньше расстоя­ние между объектами, тем сильнее («ближе») их связь. Методы многомерной классификации, основанные на показателях рассто­яния, положены в основу кластеров. В многомерном пространстве признаков определяется евклидово расстояние, которое служит мерой близости кластеров. Для альтернативных признаков исполь­зуют хеминговое расстояние.

Для выполнения многомерных классификаций могут приме­няться такие методы экономико-статистического исследования, как: метод дендритов, метод шаров, метод корреляционных плеяд, метод, использующий многомерные средние.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: