Развитие систем управления базами данных

Данные в хранилище только загружаются и считываются.

Загрузка данных в Хранилище. В процессе загрузки данных в Хранилище выполняется сбор данных, их преобразование (очистка, интегрирование), агрегирование. В Хранилище также хранится информация об источниках данных. Понятие и назначение агрегирования были описаны выше, поэтому подробнее рассмотрим первые три понятия.

Для выполнения функций сбора, преобразования и загрузки данных в Хранилище применяются специальные ETL - комплексы программ (Extraction, Transformation, Loading). Эти комплексы извлекают информацию из оперативных баз данных различных типов, преобразуют ее в формат, поддерживаемый Хранилищем и загружают в Хранилище (этот процесс подробно был описан в предыдущей главе).

В процессе извлечения данных выполняется их чтение из баз данных оперативно меняющейся информации. Перед помещением данных в Хранилище, они должны быть очищены. Это один из этапов трансформации данных. Основная задача очистки - отсев неточных данных.

Корпоративные данные большинства компаний, как правило, хранятся в базах данных, управляемых серверными СУБД.

Системы управления базами данных можно классифицировать различными способами - по принципу организации данных (реляционные, иерархические, сетевые…), по способу доступа (однопользовательские и многопользовательские), по архитектуре (настольные и серверные), по функциональным возможностям и по возможностям, связанным с масштабируемостью.

Требования к современным СУБД:

масштабируемость - отсутствие существенного снижения скорости выполнения пользовательских запросов при пропорциональном росте количества запросов и аппаратных ресурсов используемых данной СУБД (таких как объем оперативной памяти, количество процессоров и серверов);

доступность - возможность всегда выполнить запрос;

надежность - минимальная вероятность сбоев, наличие средств восстановления данных после сбоев, инструментов резервного копирования и дублирования данных (в последнее время производители СУБД нередко предлагают инструменты, позволяющие осуществлять подобные операции, не прерывая работу пользователей);

управляемость - простота администрирования, наличие средств автоматического конфигурирования (типичный современный набор средств администрирования включает средства создания баз данных и их объектов, инструменты описания правил репликации данных между различными серверами, утилиты управления пользователями, группами и их правами, средства мониторинга событий, средства просмотра планов выполнения запросов, утилиты миграции из других СУБД);

наличие средств защиты данных от потери и несанкционированного доступа;

поддержка доступа к данным с помощью Web-служб;

поддержка стандартных механизмов доступа к данным (таких как ODBC, JDBC, OLE DB, ADO.NET), позволяющая создавать приложения для СУБД с помощью различных средств разработки.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: