Хранилище данных
Хранилище данных - это предметно-ориентированная, интегрированная, содержащая исторические данные, неразрушимая совокупность данных, предназначенная для поддержки принятия управленческих решений.
Данные из различных источников помещаются в хранилище, а их описания – в репозиторий метаданных.
|
|
|
|
запросы
требования информация
OLTP-системы – данные из оперативных систем не подходят для анализа, т.к. являются разрозненными, имеют различные форматы, отражают только текущее время.
Облегченный вариант ХД – это витрины данных (Data Mart), т.е. это тематическое подмножество ХД.
Корпоративная информационно-аналитическая система может использовать:
1. ХД – общекорпоративное
2. витрины данных – на уровне подразделений
|
|
3. аналитические системы на рабочих местах
В основе концепции ХД лежит идея разделения данных для оперативной обработки и для анализа.
Основные свойства ХД:
1. Предметная ориентация. ХД объединяет информацию из разных ОИД (оперативных источников данных), т.е. информацию, отражающую разные точки зрения на эту предметную область. Хранятся только нужные для анализа данные.
2. Интеграция – единый формат данных.
3. Поддержка хронологии – хронология изменения показателей предметной области. Поэтому данные в ХД соответствуют последовательным интервалам времени.
4. Неизменяемость – данные не удаляются (как устаревшие) и не модифицируются.