Операции манипулирования измерениями

Организации данных в кубах

Метки, иерархии и уровни

Значения, "откладываемые" вдоль измерений, называются членами или метками (members). Метки используются как для "разрезания" куба, так и для ограничения (фильтрации) выбираемых данных. Значения меток отображаются в двумерном представлении куба как заголовки строк и столбцов.

Метки могут объединяться в иерархии, состоящие из одного или нескольких уровней (levels). Например, метки измерения "Магазин" (Store) естественно объединяются в иерархию с уровнями:

Весь мир

Страна

Регион

Область

Город

Магазин

В соответствии с уровнями иерархии вычисляются агрегатные значения, например, объем продаж для России (уровень "Страна") или для Тверской области (уровень "Область"). В одном измерении можно реализовать более одной иерархии - скажем, для времени: {Год, Квартал, Месяц, День} и {Год, Неделя, День}.

Иерархии в измерениях необходимы для возможности агрегации и детализации значений показателей.

Существуют типы иерархий:

· сбалансированная

· несбалансированная

· неровная

Сбалансированная – по высоте, число уровней неизменно, каждая ветвь иерархического дерева содержит объекты каждого из уровней.

Несбалансированная – число уровней может быть изменено, и каждая ветвь иерархического дерева может содержать объекты, принадлежащие не всем уровням, только нескольким первым. Как правило, это объекты одного типа. Например, несбалансированная иерархия типа «начальник-подчиненный», тип всех объектов – «сотрудник».

Неровная – число уровней постоянно, но некоторые ветви могут содержать объекты, принадлежащие не всем уровням. Например, географическая иерархия с уровнями «Страны», «Штаты», «Города» (есть страны без штатов, т.е. есть объекты, логические «родители» которых не находятся на непосредственно вышестоящем уровне).

Используются варианты организации данных:

· гиперкубическая

· поликубическая

Поликубическая – может быть несколько гиперкубов с различной размерностью и с различными измерениями в качестве их граней.

Например:

· двумерный гиперкуб – для показателя «рабочее время менеджера»

· трехмерный – для «объема продаж»

В случае гиперкубической модели предполагается, что все показатели должны определяться одинаковым набором измерений.

Формирование «Среза»

Подмножество гиперкуба, получившееся в результате фиксации значения одного или более измерений, называется срезом (slice).

Например, если взять один член измерения модели – «Волга», то получим подмножество (двумерную таблицу), содержащую информацию об истории продажи различными менеджерами в различные годы.

Операция «Вращение» (rotate)

Это представление (визуализация) информации. Обычно применяется при двумерном представлении данных. Применяется для удобства пользователя.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: