Организации данных в кубах
Метки, иерархии и уровни
Значения, "откладываемые" вдоль измерений, называются членами или метками (members). Метки используются как для "разрезания" куба, так и для ограничения (фильтрации) выбираемых данных. Значения меток отображаются в двумерном представлении куба как заголовки строк и столбцов.
Метки могут объединяться в иерархии, состоящие из одного или нескольких уровней (levels). Например, метки измерения "Магазин" (Store) естественно объединяются в иерархию с уровнями:
Весь мир
Страна
Регион
Область
Город
Магазин
В соответствии с уровнями иерархии вычисляются агрегатные значения, например, объем продаж для России (уровень "Страна") или для Тверской области (уровень "Область"). В одном измерении можно реализовать более одной иерархии - скажем, для времени: {Год, Квартал, Месяц, День} и {Год, Неделя, День}.
Иерархии в измерениях необходимы для возможности агрегации и детализации значений показателей.
Существуют типы иерархий:
|
|
· сбалансированная
· несбалансированная
· неровная
Сбалансированная – по высоте, число уровней неизменно, каждая ветвь иерархического дерева содержит объекты каждого из уровней.
Несбалансированная – число уровней может быть изменено, и каждая ветвь иерархического дерева может содержать объекты, принадлежащие не всем уровням, только нескольким первым. Как правило, это объекты одного типа. Например, несбалансированная иерархия типа «начальник-подчиненный», тип всех объектов – «сотрудник».
Неровная – число уровней постоянно, но некоторые ветви могут содержать объекты, принадлежащие не всем уровням. Например, географическая иерархия с уровнями «Страны», «Штаты», «Города» (есть страны без штатов, т.е. есть объекты, логические «родители» которых не находятся на непосредственно вышестоящем уровне).
Используются варианты организации данных:
· гиперкубическая
· поликубическая
Поликубическая – может быть несколько гиперкубов с различной размерностью и с различными измерениями в качестве их граней.
Например:
· двумерный гиперкуб – для показателя «рабочее время менеджера»
· трехмерный – для «объема продаж»
В случае гиперкубической модели предполагается, что все показатели должны определяться одинаковым набором измерений.
Формирование «Среза»
Подмножество гиперкуба, получившееся в результате фиксации значения одного или более измерений, называется срезом (slice).
Например, если взять один член измерения модели – «Волга», то получим подмножество (двумерную таблицу), содержащую информацию об истории продажи различными менеджерами в различные годы.
Операция «Вращение» (rotate)
Это представление (визуализация) информации. Обычно применяется при двумерном представлении данных. Применяется для удобства пользователя.