Задачи Data Mining. Оценивание. Анализ связей. Визуализация. Подведение итогов

Задачи (tasks) Data Mining называют также закономерностями (regularity) или техниками (techniques).

Наиболее распространенные задачи Data Mining:

· классификация,

· кластеризация,

· ассоциация,

· прогнозирование

· визуализация

· анализ и обнаружение отклонений,

· оценивание,

· анализ связей, подведение итогов.

Оценивание (Estimation)

Задача оценивания сводится к предсказанию непрерывных значений признака.

Анализ связей (Link Analysis)

задача нахождения зависимостей в наборе данных.

Визуализация (Visualization, Graph Mining)

В результате визуализации создается графический образ анализируемых данных.

Для решения задачи визуализации используются графические методы, показывающие наличие закономерностей в данных.

Пример методов визуализации – представление данных в 2-D и 3-D измерениях.

Подведение итогов (Summarization)

задача, цель которой – описание конкретных групп объектов из анализируемого набора данных.

Классификация задач Data Mining. Дескриптивные и прогнозирующие задачи. Описательные задачи. Прогнозирующие задачи.

Классификация задач Data Mining

Задачи Data Mining подразделяются на следующие группы:

· обучение с учителем (задачи классификации, оценки, прогнозирования);

· обучение без учителя (задача кластеризации);

· другие (в категорию входят задачи, не включенные в предыдущие две стратегии).

Задачи Data Mining, в зависимости от используемых моделей, могут быть дескриптивными и прогнозирующими.

В соответствии с этой классификацией, задачи Data Mining представлены группами описательных и прогнозирующих задач.

Описательные (descriptive) задачи

В результате решения описательных (descriptive) задач аналитик получает шаблоны, описывающие данные, которые поддаются интерпретации.

Эти задачи описывают общую концепцию анализируемых данных, определяют информативные, итоговые, отличительные особенности данных.

Концепция описательных задач подразумевает характеристику и сравнение наборов данных.

Характеристика набора данных обеспечивает краткое и сжатое описание некоторого набора данных.

Сравнение обеспечивает сравнительное описание двух или более наборов данных.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: