Способы аналитической обработки данных
Архитектура OLAP-приложений
Многомерность в OLAP-приложениях может быть разделена на три уровня:
1. Многомерное представление данных - средства конечного пользователя, обеспечивающие многомерную визуализацию и манипулирование данными; слой многомерного представления абстрагирован от физической структуры данных и воспринимает данные как многомерные.
2. Многомерная обработка - средство (язык) формулирования многомерных запросов (традиционный реляционный язык SQL здесь оказывается непригодным) и процессор, умеющий обработать и выполнить такой запрос.
3. Многомерное хранение - средства физической организации данных, обеспечивающие эффективное выполнение многомерных запросов.
Первые два уровня в обязательном порядке присутствуют во всех OLAP-средствах. Третий уровень не обязателен (данные для многомерного представления могут извлекаться и из обычных реляционных структур; многомерные запросы транслируются в SQL-запросы для СУБД.).
|
|
Конкретные OLAP-продукты, как правило, представляют собой либо средство многомерного представления данных, OLAP-клиент (например, PivotTables в MS Excel), либо многомерную серверную СУБД или OLAP-сервер (например, Oracle Express Server или Microsoft OLAP Services).
Информационно-аналитические системы или системы поддержки принятия решений (СППР) бывают:
· Статические.
Иногда называются Информационными системами руководителя (ИСР), или Executive Information Systems (EIS). Просты в применении, но ограничены в функциональности. Содержат предопределенные множества запросов. Достаточны для повседневного обзора, но неспособны ответить на все вопросы к имеющимся данным, которые могут возникнуть при принятии решений. Каждый новый запрос, непредусмотренный при проектировании такой системы, должен быть сначала формально описан, закодирован программистом и только затем выполнен. Время ожидания в таком случае может составлять часы и дни, что не всегда приемлемо. Внешняя простота статических СППР, за которую активно борется большинство заказчиков информационно-аналитических систем, оборачивается катастрофической потерей гибкости.
· Динамические.
Ориентированы на обработку нерегламентированных (adhoc) запросов к данным. Работа аналитиков с этими системами заключается в интерактивной последовательности формирования запросов и изучения их результатов.
Характеристика | Статический анализ | Динамический анализ |
Типы вопросов | Сколько? Как? Когда? | Почему? Что будет если? |
Время отклика | Не регламентируется | Секунды |
Типичные операции | Регламентированный отчет, диаграмма | Последовательность интерактивных отчетов, диаграмм, экранных форм. Динамическое изменение уровней агрегации и срезов данных. |
Уровень аналитических требований | Средний | Высокий |
Тип экранных форм | В основном определенный заранее, регламентированный | Определяемый пользователем |
Уровень агрегации данных | Детализированные и суммарные | В основном суммарные |
Возраст данных | Исторические и текущие и прогнозируемые | Исторические, текущие и прогнозируемые |
Типы запросов | В основном предсказуемые | Непредсказуемые, от случаю к случаю |
Назначение | Регламентированная аналитическая обработка | Многопроходный анализ, моделирование и построение прогнозов |
|
|