Сети Кохонена. Постановка задачи кластеризации. Алгоритм кластеризации

Постановка задачи кластеризации

Дано: n- номер объекта m- номер признака

Каждый объект характеризуется вектором:

Найти: ядра кластеров количества K

C={C1, C1,…, Cl, Ck}

Т.е построить некую функцию L(p), которая позволяет определить номер кластера по номеру объекта. Причем, построение должно вестись на основе следующего критерия: минимизация всех внутриклассовых расстояний.

(1)

Где первая сумма- это сумма по всем объектам, а вторая - по всем кластерам.

Алгоритм кластеризации:

1. Задается количество кластеров и начальные значения ядер кластеров.

Способы начального задания значений: случайными числами, одинаковыми числами, по некоторым эвристическим правилам, которые основаны на предварительном анализе данных(на основе главных компонент)

2. Фиксируются постоянно ядра кластеров

Ищется разбиение l(p) объектов на кластеры, исходя из критерия.

3. Фиксируются постоянно разбиения

Преобразование алгоритма кластеризации с целью реализации в нейросетевом базисе. Структура сети Кохонена.

1.Определим количество входов и выходов в нейросети

Количество входов = количеству признаков одного объекта;

Входным вектором будет являться ;

Количество выходов это количество кластеров (К);

2.Преобразуем основной критерий:

С учетом знака “-” критерий D будет максимизироваться:

Псевдокод алгоритма:

Цикл 1: для p=1,n

Цикл 2: для l=1,k


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: