Хранилища данных (ХД)

ХД – база данных особой направленности.

Под ХД понимается предметно-ориентированная интегрированная инвариантная по времени неразделимая совокупность Д, предназначенная для поддержки принятия управленческих решений.

Основные признаки:

1) Предметно-ориентированный характер;

2) Единая кодировка предметной области (все Д должны удовлетворять базовым правилам, а также не должно быть неоднозначности форматов);

3) Неразрушаемость (Д после вставки в ХД не изменяются);

4) Независимость во времени;

ХД ОС (оперативные системы)
Используется руководством Используются операторами и низшим звеном
Имеет стратегическое значение Имеет тактическое значение
Используется для интерактивного анализа Для обработки транзакций и типовых действий
Предметно-ориентированная система Ориентирована на текущие задачи, на приложения
Для сохранения исторических данных Хранятся только текущие данные
Выполняет непредсказуемые запросы Служат для выполненияформализованных запросов

 

Область применения ХД:

1) Анализ рисков;

2) Финансовый анализ;

3) Анализ случаев мошенничества;

4) Маркетинг взаимоотношений;

5) Управление активами;

6) Анализ поведения клиентов.

Архитектура ХД

Моделирование Д

Моделирование Д - процесс концептуализации идентификации и организации Д, описывающих деятельность предприятия.

При моделировании выделяют 2 класса систем:

1) OLTP (оперативная система обработки транзакций) – высокая скорость обновления информации сохранение целостности;

2) СППР (системы поддержки принятия решений) – повышение скорости выполнения запросов.

Пример:

OLTP-модель


 

 


 

Методы разработки модели Д:

1) Разработка с помощью реконструкции (имеющаяся модель модифицируется)

Условия:

       а) модель относительно нова;

       б) разработчики хорошо знакомы с …

 

Å Разработка осуществляется быстро;

Вероятность натолкнуться на системные ограничения, заложенные в старой модели Д.

 

2) Разработка по шаблону (если организация невелика и предметная область прозрачна).

3) Разработка полностью под заказ:

· модель Д существующей системы не вызывает доверия;

· не существует шаблонов предметной области;

· предметная область относительно невелика или не требуется ее полная реализация.

Существует 3 стратегии уровней детализации:

1. Максимальная детализация за минимальный промежуток времени;

2. Минимальная детализация за максимальный промежуток времени;

Особенности физического моделирования:

1) Уменьшение объема Д;

2) Создание индексов;

3) Создание итоговых таблиц.



Метаданные (МД)

Метаданные – это данные о данных (например, комментарий, текстовая документация).

Метаданные хранилищ данных (МД ХД) – карта расположения данных в хранилище.

МД ХД позволяют отслеживать следующую информацию:

1) Преобразование данных;

2) Адекватность даты и диапазоны для полей данных (т.е. ограничения целостности);

3) Отображение файлов и полей системы источника данных;

4) Определение типа системы источника данных;

5) Отслеживание истории извлечения данных.

Репозиторий МД – база МД.

Существует 2 классификации МД.

I. Для мелких предприятий - классификация МД в зависимости от характера использования:

1) Проектные МД – МД, относящиеся к проектам существующих БД и файловых систем.

Практически не изменяются в процессе.

2) Активные рабочие МД – используются для:

¾ управления хранилищем;

¾ контроля за хранилищем в период эксплуатации;

¾ управления безопасностью и доступом к данным.

3) Пассивные рабочие МД – необходимы для пользователей (а не для разработчиков) для:

¾ понимания смысла тех или иных данных;

¾ понимания связей между сущностями;

¾ получения информации о первичном источнике данных и об ответственном за данный источник;

¾ получения информации о некоторых деталях работы хранилища.

II. Для сложных систем и крупных предприятий – шестимерная модель метаданных:

1) МД, описывающие действия над данными

¾ данные об источнике информации;

¾ данные о преобразованиях для помещения данных в хранилище.

2) Местоположение ресурсов системы в хранилище данных

¾ данные, которые описывают структуру размещения ресурсов (серверов и др. железных составляющих).

3) МД, описывающие сущности

¾ данные, которые описывают сущности, поля.

4) МД, описывающие взаимодействия людей с ХД

¾ данные, которые описывают роли и права доступа (отвечают за настройки безопасности)

5) МД, описывающие развитие хранения данных

¾ временные ограничения, соглашения по поводу самого ХД.

6) МД, описывающие временные аспекты функционирования хранилища

Справочник пользователя информации должен содержать описание таблиц и столбцов ХД (текстовая форма - простая).

Описание должно включать следующее:

1) Метод вычисления;

2) Диапазон значений;

3) Значения по умолчанию;

4) Подразделение или лицо, ответственное за данные;

5) Связь с другими полями данных;

6) Система-источник;

7) Время последней загрузки.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: