Сети Кохонена. Постановка задачи кластеризации. Алгоритм кластеризации

Постановка задачи кластеризации

Дано: n- номер объекта m- номер признака

Каждый объект характеризуется вектором:

Найти: ядра кластеров количества K

C={C¹, C¹,…, C^l, C^k}

Т.е построить некую функцию L(p), которая позволяет определить номер кластера по номеру объекта. Причем, построение должно вестись на основе следующего критерия: минимизация всех внутриклассовых расстояний.

(1)

Где первая сумма- это сумма по всем объектам, а вторая - по всем кластерам.

Алгоритм кластеризации:

1. Задается количество кластеров и начальные значения ядер кластеров.

Способы начального задания значений: случайными числами, одинаковыми числами, по некоторым эвристическим правилам, которые основаны на предварительном анализе данных(на основе главных компонент)

2. Фиксируются постоянно ядра кластеров

Ищется разбиение l(p) объектов на кластеры, исходя из критерия.

3. Фиксируются постоянно разбиения

Преобразование алгоритма кластеризации с целью реализации в нейросетевом базисе. Структура сети Кохонена.

1.Определим количество входов и выходов в нейросети

Количество входов = количеству признаков одного объекта;

Входным вектором будет являться ;

Количество выходов это количество кластеров (К);

2.Преобразуем основной критерий:

С учетом знака “-” критерий D будет максимизироваться:

Псевдокод алгоритма:

Цикл 1: для p=1,n

Цикл 2: для l=1,k

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

Лексическое и грамматическое значение слова

Расчет нормальной концентрации

Соучастие в преступлении: понятие и признаки. Виды соучастников и формы соучастия

НЭП: ПРИЧИНЫ, СУЩНОСТЬ И ПРОТИВОРЕЧИЯ

Среднее квадратическое отклонение

Основные теории происхождения государства

Самый сильный аргумент, почему эволюция человека не могла быть