Если задача правильного выбора признака в качестве основания группировки представляется сложной, то еще более сложной является задача составления группировки по нескольким признакам. Комбинация двух признаков позволяет сохранить обозримость таблицы, но комбинация трех или четырех признаков дает совершенно неудовлетворительный результат: ведь даже при выделении трех категорий по каждому группировочному признаку мы получим 9 или 12 подгрупп. Равномерность распределения единиц по группам в принципе невозможна. Вот и получаются группы, в которые входят 1-2 наблюдения. Сохранить сложность описания групп и вместе с тем преодолеть недостатки комбинационной группировки позволяют методы многомерных устойчивых группировок (многомерной классификации).
Для проведения многомерной классификации необходимо:
- сформулировать цель классификации;
- выделить комплекс признаков классификации;
59)определить меру сходства объектов;
59) выбрать программу классификации;
|
|
59)рассчитать варианты классификации;
59)оценить результаты.
Исходные данные для задачи многомерной классификации могут быть представлены в виде матрицы «объект-признак». Строками ее являются значения признаков, характеризующих соответствующий объект, а столбцами - значение каждого признака для рассматриваемой совокупности объектов.
Выделяют несколько типов мер сходства:
59)коэффициент подобия;
59)коэффициент связи;
59) многомерные средние;
59) показатели расстояния.
Простейшим вариантом многомерной классификации является группировка на основе многомерных оценок.
Многомерной характеристикой называется совокупность значений нескольких признаков для одной единицы совокупности. Поскольку нельзя рассчитать эту величину по абсолютным значениям разных признаков (разнокачественных, выраженных в разных единицах измерения), то многомерная характеристика вычисляется из относительных величин, как правило, из отношений абсолютных значений признаков для единицы совокупности к средним значениям этих признаков.
Чем больше величина коэффициентов подобия и связи, тем «ближе» объекты друг к другу, и наоборот, чем меньше расстояние между объектами, тем сильнее («ближе») их связь. Методы многомерной классификации, основанные на показателях расстояния, положены в основу кластеров. В многомерном пространстве признаков определяется евклидово расстояние, которое служит мерой близости кластеров. Для альтернативных признаков используют хеминговое расстояние.
Для выполнения многомерных классификаций могут применяться такие методы экономико-статистического исследования, как: метод дендритов, метод шаров, метод корреляционных плеяд, метод, использующий многомерные средние.