Хранилище данных (DW ‑ Data Warehouse) ‑ специальным образом администрируемая база данных.
Основные идеи DW:
1. Интеграция разъединенных детализированных данных. В процессе интеграции должно выполняться согласование данных и, возможно, их агрегация.
2. Разделение наборов данных и приложений, используемых для оперативной обработки и применяемых для решения задач анализа.
Общая структурная схема DW
Специфические свойства DW:
· предметная ориентация;
· интегрированность данных;
· инвариантность во времени;
· неразрушаемость – стабильность информации;
· минимизация избыточности информации.
В самом простом варианте для DW используется та модель данных, которая лежит в основе транзакционной системы, т.е. реляционная модель.
При этом самой сложной задачей становится выполнение нерегламентированных, заранее не предусмотренных запросов (ad-hoc запросы от лат. ad hoc «для этого» ‑ для специальной цели)
Для DW было предложено использовать схемы данных, получившие названия "звезда" и "снежинка". Суть технологии проектирования этих схем заключается в выделении из общего объема информации собственно анализируемых данных (или фактов) и вспомогательных данных (называемых измерениями).