Системы оперативной аналитической обработки данных

OLAP (On-Line Analytical Processing)

OLAP ориентирована главным образом на нерегламентированные интерактивные запросы и часто используется в хранилищах данных.

В основе OLAP лежит понятие гиперкуба, или многомерного куба данных, в ячейках которого хранятся анализируемые (числовые) данные. Измерения представляют собой совокупности значений других данных.


В зависимости от ответа на вопрос, существует ли гиперкуб как отдельная физическая структура или лишь как виртуальная модель данных, различают системы MOLAP (Multidimensional OLAP) и ROLAP (Relational OLAP).


Инструменты добычи данных (Data Mining)

Предназначены для создания гипотез на основе существующих данных.

Извлечение новой информации из данных, содержащихся в хранилище данных, путем выявления взаимозависимости данных (корреляция, классификация и др.) и поиска скрытых закономерностей в данных.

Добыча данных предполагает использование статистических, оптимизационных и других специальных математических алгоритмов, и имеет целью получение дедуктивным путем новой информации, которая может оказаться полезной при принятии решений в предметной области.


Методы интеллектуального анализа данных (ИАД)

Два подхода:

- пользователь сам выдвигает гипотезы относительно зависимостей между данными, система выполняет проверку достоверности гипотез.

- зависимости между данными ищутся автоматически.

Процессы ИАД подразделяются на три группы:

· поиск зависимостей (discovery),

· прогнозирование (predictive modelling)

· анализ аномалий (forensic analysis).


В ИАД используются следующие методы:

· Нахождение ассоциаций, которые возникают как привязка значений к какому-нибудь одному событию.

· Нахождение последовательностей, т.е. последовательных во времени событий.

· Нахождение скрытых закономерностей по наборам данных в виде причинно-следственных связей между значениями определенных параметров исследуемого объекта (ситуации, процесса).

· Оценка важности (влияния) параметров на события и ситуации.

· Классифицирование (распознавание). Объекты при этом должны быть описаны значениями числовых признаков (симптомов, показателей, параметров). Нужно найти критерии, по которым можно было бы относить объект к той или иной классификационной категории.

· Выявление кластеров. Кластеризация напоминает классификацию, с тем отличием, что критерии классификации не заданы. Кластеризация при исследовании данных позволяет обнаруживать данные, сгруппированные по каким-нибудь признакам, так что объекты одной группы "похожи" друг на друга, а объекты различных групп – "не похожи"..

· Составление прогнозов событий и ситуаций


Средства генерации отчетов (Reporting tools)

Предназначены для представления данных в виде таблиц и диаграмм. Этот класс средств позволяет управленцам контролировать происходящие процессы, имея некоторое количество фиксированных взглядов на показатели этих процессов

Новая технология — визуально-интуитивное извлечение полезной информации (ВИ-технология).

Попытка преодолеть традиционную иерархическую систему принятия решений, при которой информация по конкретному вопросу в максимальном объеме находится у основания «пирамиды» и по мере подъема вверх сжимается, превращаясь в несколько заготовленных специалистами альтернатив.

Инструмент, позволяющий работать с гигантскими объемами информации и доводить ее без потерь до первых лиц, принимающих управленческие решения.


Примером практической реализации такой технологии является компьютерная программа MineSet, разработанная компанией Silicon Graphics Ink. и применяемая в настоящее время в Министерстве экономического развития и торговли РФ.

Во-первых, информация во всем ее многообразии становится доступной лицам, принимающим решения

Во-вторых — это возможность воспользоваться аналитическими средствами, заложенными в ВИ-технологии. При принятии решений крайне важны средства моделирования, позволяющие проигрывать разные сценарии и следить за тем, как ведут себя одни показатели при изменении других

В третьих, при использовании данной технологии в системе управления появляется возможность группового анализа, мозгового штурма, занимающего не более часа, вместо длительного изучения каждым членом группы многотомных исследований



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: