Одно из направлений интеграции информационных технологий связано с использованием хранилищ данных. Дадим общую характеристику технологий хранилищ данных.
Хранилище данных (Data warehouse) — это предметно-ориентированное, интегрированное, привязанное ко времени и неизменяемое собрание данных для поддержки процесса принятия управляющих решений.
Как следует из определения, технологии организации данных в хранилище отличаются следующими свойствами:
данные в хранилище организованы вокруг существенных аспектов прикладной деятельности организации, например, товар, покупатель, продажа и т.д. (свойство предметно - ориентированности);
информация в хранилище должна интегрироваться в целостную структуру, обеспечивающую возможности анализа данных (свойство интегрированности);
хранилище можно рассматривать как набор моментальных снимков состояния данных так, что атрибут времени всегда явно присутствует в структурах данных хранилища (свойство привязки ко времени);
|
|
данные, попав однажды в хранилище, никогда не изменяются, а только пополняются новыми данными из оперативных систем, где данные постоянно меняются (свойство неизменяемости).
Хранилища обладают общими характеристиками.
Одна из них – структурированность данных. Хранилища данных являются структурированными, содержат базовые данные, которые образуют единый источник для обработки данных во всех системах поддержки принятия решений.
Элементарные данные, присутствующие в хранилище, могут быть представлены в различной форме. Хранилища данных исключительно велики, поскольку в них содержатся интегрированные и детализированные данные.
Наряду с общими для всех хранилищ данных характеристиками, разные типы хранилищ могут иметь свои индивидуальные особенности. Например, в финансовых хранилищах данных проявляются недостатки, связанные с тем, что сведения из финансовых хранилищ не совпадают с данными существующей финансовой среды.