Технология Data Mining

По данным компании Gartner, неструктурированные документы составляют более 80% корпоративных данных, а количество внешних источников (интернет-ресурсов, блогов, форумов, СМИ) исчисляется миллионами. В них содержится гигантское количество данных, которые могут обеспечить компании существенное конкурентное преимущество. Основной вопрос — эффективность и скорость извлечения и анализа ценной информации.

Data Mining - "добыча" или "раскопка данных". Data Mining предназначены для решения задач интеллектуального анализа данных, что позволяет повысить эффективность принятия решений.

Data Mining - это процесс обнаружения в сырых данных:

1) ранее неизвестных и нетривиальных

2) практически полезных и доступных интерпретации знаний,

3) необходимых для принятия решений в различных сферах человеческой деятельности.

На рис. 28 представлены уровни знаний, извлекаемых из данных.

Рис. 28 Уровни знаний, извлекаемых из данных

Data Mining – это технология анализа информации с целью нахождения в уже накопленных предприятием данных ранее неизвестных, но практически полезных знаний, необходимых для принятия решений в различных областях человеческой деятельности.

Это процесс нахождения скрытых закономерностей в существующих данных.

Знания должны описывать новые связи между свойствами, предсказывать значения одних признаков на основе других.

Интеллектуальный анализ данных или «добыча данных» (Data Mining) позволяет проводить глубокие исследования данных, включающие:

· выявление скрытых зависимостей между данными

· выявление устойчивых бизнес-групп

· прогнозирование поведения бизнес-показателей

· оценку влияния решений на бизнес компании

· поиск аномалий и пр.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: