Подсистема метаинформации (репозиторий)

Репозиторий представляет собой описание структуры инфор­мационного хранилища: состава показателей, иерархий агрега­ции измерении, форматов данных, используемых функций, фи­зического размещения на сервере, прав доступа пользователей, частоты обновления.

Важнейшей функцией репозитория является представление схем отображения структуры данных файлов-источников на структуре данных ИХ, в соответствии с которой осуществляется периодическая загрузка MOLAP-хранилища или непосредствен­ная реализация запросов «на лету» в ROLAP-хранилищах.

В репозитории задается также схема отображения структуры ИХ на схемах представлений данных пользователей или витри­нах данных. Через репозиторий осуществляется интерпретация запросов к ИХ на проведение оперативного анализа данных.

Отображение данных между источниками данных и ИХ, ИХ и представлением данных осуществляется либо через механизм межуровневого взаимодействия, либо через процедуры преобра­зования данных.

Подсистема преобразования данных (загрузки хранилища)

Подсистема загрузки ИХ создается только для MOLAP-систем. Для ROLAP-систем в процессе выполнения запросов осуще­ствляется преобразование данных из файлов-источников. В том и другом случае требуется выполнение следующих основных фун­кций:

- сбор данных (Data Acquisition);

- очистка данных (Data Cleaning);

- агрегирование данных (Data Consolidation).

Сбор данных предполагает передачу данных из источников в ИХ в соответствии со схемой отображения, представленной в репозиторий.

В процессе очистки данных осуществляются проверка непро­тиворечивости (целостности), исключение дублирования данных., отбраковка шумовых (случайных) данных, восстановление отсут­ствующих данных, приведение данных к единому формату.

В случае необходимости агрегирования данных осуществля­ется суммирование итогов по заданным в репозиторий призна­кам агрегации.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: