Кратко охарактеризуем основные компоненты технологий хранилищ данных на
примере описания хранилища данных для предприятия.
Оперативные данные могут собираться из различных источников:
иерархические и сетевые базы данных первого поколения, хранящие корпоративные данные;
реляционные базы данных, хранящие оперативные данные различных подразделений;
закрытые сервера;
внешние системы (Интернет, базы данных поставщиков и т. д.).
Поступившие оперативные данные очищаются, интегрируются и складываются в реляционное хранилище. Такие данные доступны для анализа при помощи средств построения отчетов. Затем данные (полностью или частично) подготавливаются с использованием средств переноса и трансформации данных для OLAP-анализа, который реализуется применением средств доступа и анализа данных. Назначение систем класса OLAP (Online Analytical Processing - оперативная аналитическая обработка) — предоставить пользователям гибкий, интуитивно понятный и простой доступ к данным.
Важнейшим элементом хранилища являются так называемые метаданные.
Метаданные описывают структуру, размещение, трансформацию данных, используемых любыми процессами хранилища.
Метаданные могут быть востребованы для различных целей, например: извлечения и загрузки данных; обслуживания хранилища и запросов.
Метаданные для различных процессов могут иметь различную структуру, т. е. для одного и того же элемента данных может существовать несколько вариантов метаданных.