ХД – база данных особой направленности.
Под ХД понимается предметно-ориентированная интегрированная инвариантная по времени неразделимая совокупность Д, предназначенная для поддержки принятия управленческих решений.
Основные признаки:
1) Предметно-ориентированный характер;
2) Единая кодировка предметной области (все Д должны удовлетворять базовым правилам, а также не должно быть неоднозначности форматов);
3) Неразрушаемость (Д после вставки в ХД не изменяются);
4) Независимость во времени;
ХД | ОС (оперативные системы) |
Используется руководством | Используются операторами и низшим звеном |
Имеет стратегическое значение | Имеет тактическое значение |
Используется для интерактивного анализа | Для обработки транзакций и типовых действий |
Предметно-ориентированная система | Ориентирована на текущие задачи, на приложения |
Для сохранения исторических данных | Хранятся только текущие данные |
Выполняет непредсказуемые запросы | Служат для выполненияформализованных запросов |
Область применения ХД:
1) Анализ рисков;
2) Финансовый анализ;
3) Анализ случаев мошенничества;
4) Маркетинг взаимоотношений;
5) Управление активами;
6) Анализ поведения клиентов.
Архитектура ХД
Моделирование Д
Моделирование Д - процесс концептуализации идентификации и организации Д, описывающих деятельность предприятия.
При моделировании выделяют 2 класса систем:
1) OLTP (оперативная система обработки транзакций) – высокая скорость обновления информации сохранение целостности;
2) СППР (системы поддержки принятия решений) – повышение скорости выполнения запросов.
Пример:
OLTP-модель
Методы разработки модели Д:
1) Разработка с помощью реконструкции (имеющаяся модель модифицируется)
Условия:
а) модель относительно нова;
б) разработчики хорошо знакомы с …
Å Разработка осуществляется быстро;
Вероятность натолкнуться на системные ограничения, заложенные в старой модели Д.
2) Разработка по шаблону (если организация невелика и предметная область прозрачна).
3) Разработка полностью под заказ:
· модель Д существующей системы не вызывает доверия;
· не существует шаблонов предметной области;
· предметная область относительно невелика или не требуется ее полная реализация.
Существует 3 стратегии уровней детализации:
1. Максимальная детализация за минимальный промежуток времени;
2. Минимальная детализация за максимальный промежуток времени;
Особенности физического моделирования:
1) Уменьшение объема Д;
2) Создание индексов;
3) Создание итоговых таблиц.
Метаданные (МД)
Метаданные – это данные о данных (например, комментарий, текстовая документация).
Метаданные хранилищ данных (МД ХД) – карта расположения данных в хранилище.
МД ХД позволяют отслеживать следующую информацию:
1) Преобразование данных;
2) Адекватность даты и диапазоны для полей данных (т.е. ограничения целостности);
3) Отображение файлов и полей системы источника данных;
4) Определение типа системы источника данных;
5) Отслеживание истории извлечения данных.
Репозиторий МД – база МД.
Существует 2 классификации МД.
I. Для мелких предприятий - классификация МД в зависимости от характера использования:
1) Проектные МД – МД, относящиеся к проектам существующих БД и файловых систем.
Практически не изменяются в процессе.
2) Активные рабочие МД – используются для:
¾ управления хранилищем;
¾ контроля за хранилищем в период эксплуатации;
¾ управления безопасностью и доступом к данным.
3) Пассивные рабочие МД – необходимы для пользователей (а не для разработчиков) для:
¾ понимания смысла тех или иных данных;
¾ понимания связей между сущностями;
¾ получения информации о первичном источнике данных и об ответственном за данный источник;
¾ получения информации о некоторых деталях работы хранилища.
II. Для сложных систем и крупных предприятий – шестимерная модель метаданных:
1) МД, описывающие действия над данными
¾ данные об источнике информации;
¾ данные о преобразованиях для помещения данных в хранилище.
2) Местоположение ресурсов системы в хранилище данных
¾ данные, которые описывают структуру размещения ресурсов (серверов и др. железных составляющих).
3) МД, описывающие сущности
¾ данные, которые описывают сущности, поля.
4) МД, описывающие взаимодействия людей с ХД
¾ данные, которые описывают роли и права доступа (отвечают за настройки безопасности)
5) МД, описывающие развитие хранения данных
¾ временные ограничения, соглашения по поводу самого ХД.
6) МД, описывающие временные аспекты функционирования хранилища
Справочник пользователя информации должен содержать описание таблиц и столбцов ХД (текстовая форма - простая).
Описание должно включать следующее:
1) Метод вычисления;
2) Диапазон значений;
3) Значения по умолчанию;
4) Подразделение или лицо, ответственное за данные;
5) Связь с другими полями данных;
6) Система-источник;
7) Время последней загрузки.