Отчет по лабораторной работе должен содержать:
1. Название и цель работы.
2. Исходные данные варианта задания.
3. Результаты компонентного анализа:
1) сводная характеристика для всех компонент с указанием собственных значений;
2) график для собственных значений главных компонент;
3) запись главных компонент c характеристикой весов признаков;
4) выбор значащих компонент и определение названия для них;
5) анализ структуры данных (на примере трехмерной диаграммы рассеивания - 3D Scatterplot): выделение групп объектов; формирование правил отнесения объектов к кластерам.
4. Результаты кластерного анализа:
1) дендрограмма (общий вид) с выделенными штрихом наиболее очевидными группировками;
2) сводка кластерного анализа с населенностью кластеров;
3) координаты центроидов и анализ кластеров по ним;
4) вид диаграмм рассеивания (2D и 3D) и анализ кластеров с их помощью;
5) анализ структуры данных (на примере трехмерной диаграммы рассеивания - 3D Scatterplot): выделение групп объектов; формирование правил отнесения объектов к кластерам.
5. Выводы (результаты сравнения и правила отнесения объектов к выделенным группам)
Контрольные вопросы
1. Основные виды закономерностей, извлекаемых с помощью методов Data Mining.
2.Основное назначение методов визуализации данных. Задачи, решаемые линейными методами снижения размерности.
3. Основные этапы выполнения метода главных компонент..
4. Выбор значащих главных компонент и названия для них.
5. Метод главных компонент. Достоинства и недостатки.
6. Постановка задачи для кластерного анализа.
7. Меры сходства между объектами и между кластерами.
8. Обобщенный алгоритм кластеризации.
Список литературы
1. Барсегян А.А., Куприянов М.С., Степаненко В.С., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. – СПб.: БХВ-Петербург, 2004. – 336 с.
2. Дюк В., Самойленко А. Data Mining: учебный курс.-.СПб: Питер,2001. – 368с.
3. Романов В.П. Интеллектуальные информационные системы в экономике: Учебное пособие / Под ред. д.э.н., проф. Н.П.Тихомирова. – М.: Издательство «Экзамен», 2003. – 496 с.
4. Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы: Учебник. - М.:Финансы и статистика, 2004.-.424с.
5. Дубров А.М. Компонентный анализ и эффективность в экономике: Учеб. пособие. – М.: Финансы и статистика, 2002. – 352 с.
6. Корнеев В.В., Гарре А.Ф., Васюткин С.В., Райх В.В. Базы данных. Интеллектуальная обработка информации. – М.:Издатель Молгачева С.В., Изд-во Нолидж, 2001. – 496 с.
7. Калинина В. Н., Соловьев В. И. Введение в многомерный статистический анализ: Учебное пособие / ГУУ. – М., 2003. – 66 с.