Аналитические информационные системы

В настоящее время информационные системы можно разделить на два класса:

1) системы оперативной обработки данных (OLTP – OnLine Transaction Processing);

2) системы аналитической обработки данных.

OLTP-системы создаются для обеспечения повседневной деятельности компании, и используют данные, хранящиеся в оперативной БД. Принцип работы – поиск информации по регламентированным запросам. Они используют реляционные СУБД, которые автоматизируют выпуск отчетов, позволяют перевести их хранение в электронный вид и распространять по корпоративной сети между сотрудниками.

Системы аналитической обработки данных используют хранилища данных. Для них характерна массовая и длительная обработка запросов. Они делятся на 2 группы:

1) статической аналитической обработки данных. Это системы поддержки принятия решений (DSS – Decision Support System);

2) аналитической оперативной обработки данных (OLAP – OnLine Analytical Processing).

DSS-системы используют данные о деятельности компании за несколько лет. Данные носят статический характер, т.е. при хранении не изменяются. В DSS-системах обеспечивается выдача отчетов в соответствии с заранее сформулированными требованиями. В них предъявляются существенно менее жесткие требования ко времени выполнения запроса, чем в OLTP-системах (в диапазоне от нескольких минут до нескольких часов и даже суток).

OLAP-системы являются дальнейшим развитием OLTP- и DSS-систем и позволяют аналитику динамически формировать вопросы, которые требуются для решаемой им аналитической задачи. Эти системы служат для анализа деятельности компании или ее подразделений и прогнозирования их будущего состояния не только на основе накопленных данных о деятельности компании в прошлом, но также и внешних источников данных.

Если OLTP-системы отвечают на вопросы типа «Сколько было продано товара?», то OLAP-системы могут дать ответы на сложные вопросы «Как надо увеличить расходы на маркетинг, чтобы прибыль выросла на определенное количество процентов?».

В OLAP-системе пользователь может осуществлять гибкий просмотр информации, получать произвольные срезы данных и выполнять аналитические операции агрегирования и детализации, сравнения во времени и т. д.

К недостаткам OLAP-систем следует отнести их сложность при разработке и внедрении.

Для более глубокого анализа данных применяется также технология Data Mining – новая технология интеллектуального анализа данных с целью выявления скрытых закономерностей в виде значимых особенностей, зависимостей и тенденций.

Другими словами, Data Mining – это исследование и обнаружение с помощью средств искусственного интеллекта в данных таких закономерностей, которые:

1) ранее не были известны;

2) нетривиальны;

3) практически полезны;

4) доступны для интерпретации человеком и необходимы для принятия решений в различных сферах деятельности.

Результаты поиска отражают неочевидные, неожиданные закономерности, так называемые скрытые знания.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: