double arrow

Информационные хранилища. Использование баз данных на предприятии не дает желаемого результата от автоматизации деятельности предприятия

Использование баз данных на предприятии не дает желаемого результата от автоматизации деятельности предприятия. Причина проста: реализованные функции значительно отличаются от функций ведения бизнеса, так как данные, собранные в базах, не адекватны информации, которая нужна лицам, принимающим решения. Решением данной проблемы стала реализация технологии информационных хранилищ.

Информационное хранилище (data warehouse) – это автоматизированная система, которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию как единую. Оно обеспечивает инструментарий для преобразования больших объемов детализированных данных в форму, которая удобна для стратегического планирования и реорганизации бизнеса и необходима специалисту, ответственному за принятие решений. При этом происходит «слияние» различных сведений в требуемую предметно-ориентиро­ванную форму с использованием различных методов анализа.

Особенность новой технологии в том, что она предлагает среду накопления данных, которая не только надежна, но по сравнению с распределеннымиСУБД оптимальна с точки зрения доступа к данным и манипулирования ими.

Для данных информационного хранилища характерны:

 предметная ориентация – данные организованы в соответствии со способом их применения;

 интегрированность – данные согласуются в соответствии с определенной системой наименований, хотя могут принадлежать различным источникам, и их формы представления могут не совпадать;

 упорядоченность во времени – данные согласуются во времени для использования в сравнениях, идентификациях трендов и прогнозах;

 неизменяемость и целостность – данные не обновляются и не изменяются, а только перезагружаются и считываются, поддерживая концепцию «одного правдивого источника».

Использование метабазы для описания и управления данными, операции суммирования для уменьшения объема данных увеличивают скорость доступа к данным, позволяя руководителю быстро получить обзор ситуации или в деталях рассмотреть нужный предмет. При этом обеспечивается секретность данных, предназначенных различным уровням руководителей.

Для преобразования данных из хранилища в предметно-ориенти­рованную форму требуются языки запросов нового поколения. Язык SQL не обеспечивает выборку требуемых данных из хранилища. Для уменьшения размера информационного хранилища до минимума при сохранении максимального количества информации применяются эффективные методы сжатия данных.

В информационных хранилищах используются статистические технологии, генерирующие «информацию об информации»; процедуры суммирования; методы обработки электронных документов, аудио-, видеоинформации, графов и географических карт.

Информационная метабаза содержит метаданные, которые описывают, как устроены данные, частоту изменения, откуда приходят существенные части данных (разрешаются ссылки на распределенные базы данных на разных платформах), как они могут быть использованы, кто может ими пользоваться.

Для управленческого персонала метабаза предлагает предметно-ориентированный подход, показывая, какая информация имеется в наличии, как она получена, как может быть использована. Для работы приложений метабаза поддерживает интеллектуальный выбор информации, относящейся только к задаче.

Для руководителей предприятия данные доступны посредством SQL-запросов, создания интерактивных отчетов на экране, использования более развитых систем поддержки принятия решений, многомерного просмотра данных посредством гипертекстовой технологии.

При организации хранения данных обычно используются выделенные серверы или кластеры серверов (группа накопителей, видеоустройств с общим контроллером). Для доступа к серверам и их взаимосвязи требуются технологии, удовлетворяющие следующим условиям:

1. Малая задержка. Хранилища данных порождают два типа трафика. Первый содержит запросы пользователя, второй – ответы. Для формирования ответа требуется время. Но так как число пользователей велико, время ответа становится неопределенным. Для обычных данных такая задержка не существенна, а для мультимедийных – существенна.

2. Высокая пропускная способность. Так как данные могут находиться в разных базах, требуется синхронизация при формировании ответа, тем более, что рассмотренные базы могут находиться на значительных расстояниях друг от друга. Поэтому для обеспечения сбалансированной нагрузки требуется скорость не менее 100 Мбит/с.

3. Надежность. При работе с кластерами серверов интенсивный обмен данными требует, чтобы вероятность потери пакета была очень мала.

4. Возможность работы на больших расстояниях. Если серверы кластера удалены друг от друга, то требуется технология, обеспечивающая передачу со скоростью 100 Мбит/с на расстоянии не менее 1 км.

Всем этим требованиям удовлетворяет АТМ-технология, хотя распространены и по многим показателям дают хорошие результаты технологии Fast Ethernet, Fibre Channel и др.

Примером информационного хранилища может служить Oracle VLM, разработанная фирмами Oracle и Digital. Платформой является Digital Unix для 64-разрядной архитектуры DigitalAXP, преодолевшей на аппаратном уровне четырехгигабайтовый барьер адресного пространства оперативной памяти. Платформы Digital AlphaServer 8200 и AlphaSeiver 8400 уже сейчас позволяют адресоваться к оперативной памяти емкостью 14 Гбайт, планируется расширить эту границу за 50 Гбайт. Вторая базовая операционная система фирмы Digital Open – VMS 7.0.

В информационном хранилище Oracle VLM увеличился объем кэш-памяти (быстродействующей памяти) для обмена с сервером базы данных, что сократило время обращения к диску с миллисекунд до микросекунд. Например, «маленькая» база данных объемом 5 Гбайт целиком загружается в кэш-память. Поскольку кэш-память базы данных является частью системной области памяти SGA, Oracle VLM фактически снимает ограничения на ее размер и оперирует с «большой» системной областью памяти LSGA.

Увеличился максимальный размер обрабатываемого блока базы данных до 32 Кбайт. Обычно он равнялся 2 Кбайтам, а максимальный – 8 Кбайтам. Обрабатываемый блок базы данных содержит управляющую часть (заголовок) и собственно данные. Если данные графика (аудио-, видеоданные, изображения) не помещаются в блок целиком, строится цепочка блоков.

Использование информационных хранилищ дает существенный выигрыш по производительности в системах принятия решений, в системах обработки большого числа транзакций с большим объемом обновления данных.

Технологию VLM можно рассматривать как альтернативу использованию SMP (мультипроцессорных систем), получая выигрыш в производительности.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: