Для накапливания экспериментальных данных по применению гибридной метрики при кластеризации в различных условиях был разработан специальный модуль по автоматизации вычислений. Чтобы его активировать, необходимо в меню выбрать пункт «Автоматизация вычислений», затем подпункт «Настройка и запуск» (рисунок 3.6).
Данный модуль обладает следующими возможностями:
· перебор параметров кластеризации в заданном пользователем диапазоне;
· выполнение кластеризации k-means с использованием метрик Евклида, Манхэттена, Чебышева и оригинальной гибридной метрики;
· расчет для каждой из метрик суммы квадратов ошибок;
· расчет количества итераций для каждой из метрик, понадобившихся для проведения кластеризации;
· расчет количества различий в принадлежности объектов к кластерам при любых сочетаниях метрик.
· экспорт полученных данных в формат Excel.

Рисунок 3.6 – Пункт меню для автоматизации вычислительных экспериментов
Планирование и запуск вычислительных экспериментов
Форма автоматизации вычислений состоит из следующих частей (рисунок 3.7):
· группа элементов управления «настройки автоматизации вычислений», предназначенных для задания условий кластеризации с изменяющимися параметрами (левая верхняя часть формы);
· группа элементов управления «настройки автоматизации вычислений», предназначенных для задания места хранения результатов вычислительных экспериментов (правая верхняя часть формы);
· таблица «результаты вычислений» предназначенная для отображения результатов вычислительных экспериментов.

Рисунок 3.7 – Внешний вид формы для автоматизации вычислительных экспериментов
Для запуска вычислительных экспериментов по применению различных метрик сначала необходимо задать диапазон изменения характеристик алгоритма k-means, а также шаг изменения характеристик, а именно:
· минимальное и максимальное количество записей в исходной выборке данных, а также шаг их изменения;
· минимальное и максимальное количество атрибутов записей, а также шаг их изменения;
· минимальное и максимальное количество кластеров, а также шаг их изменения.
Эти параметры задаются с помощью группы элементов управления «настройки автоматизации вычислений». Для их подтверждения необходимо нажать на кнопку «Принять настройки». После этого установленные значения параметров отобразятся в первых четырех столбцах в таблицы «Результаты вычислений».
После планирования экспериментов возможен запуск процесса вычислений. Для этого необходимо нажать на кнопку «Запуск вычислений». В процессе выполнения вычислительных экспериментов будет происходить постепенное заполнение таблицы «Результаты вычислений» полученными значениями (рисунок 3.8).

Рисунок 3.8 – Планирование эксперимента
После выполнения вычислительных экспериментов, полученные данные можно сохранить в формате Excel. Для этого предусмотрена группа элементов управления «Сохранение результатов». В формате Excel протокол вычислительных экспериментов выглядит следящим образом (рисунок 3.9).

Рисунок 3.9 – Сохранение рассчитанных данных в формате Excel






