Методы объединения кластеров

На первом шаге, когда каждый объект представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. В более широком смысле под объектами можно понимать не только исходные предметы исследования, представленные в матрице "свойство-объект" (термин-документ), но и отдельные группы таких точек, объединенные тем или иным алгоритмом в кластер.

В этом случае возникает вопрос о том, каким образом понимать расстояние между такими скоплениями точек (кластерами) и как его вычислять. Эта процедура осложняется тем, что в отличие от точек кластеры занимают определенный объем многомерного пространства и состоят из многих точек.

Таким образом, оказывается необходимо правило объединения или мера близости для двух кластеров. Правила объединения используются, в основном, в иерархических методах и от выбора правила объединения зависит большая часть характеристик получаемых кластеров.

Так, если кластеры не имеют заранее установленной тенденции принимать примерно равные размеры (Рисунок 4 слева) и форму (Рисунок 4 справа), то динамическое определение этих параметров становится основным камнем преткновения большинства методов, как иерархических, так и, в особенности, разделяющих. Большая часть этих проблем решается выбором адекватного метода объединения кластеров.

Рисунок 4 – Виды возможных кластеров


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: