Реляционные базы данных

Большие массивы данных об объектах и явлениях реального мира вместе с программно-аппаратными средствами для их обработки называют информационными системами (ИС).

Информационная система — это совокупность базы данных и всего комплекса аппаратно-программных средств для ее хранения, изменения и поиска информации, для взаимодействия с пользователем.

Информационные системы можно условно разделить на фактографические и документальные.

В фактографических информационных системах регистрируются факты – конкретные значения данных (атрибутов) об объектах реального мира. Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей, названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате. Информация, с которой работает фактографическая информационная система, имеет четкую структуру, позволяющую машине отличать одно данное от другого, - например, фамилию от человека от должности. Поэтому фактографическая система способна давать однозначные ответы на поставленные вопросы, например: «Сколько учеников в классе?».

Документальные информационные системы обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос. Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги, рефераты и т.д.) и графических объектов, снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, - выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям. Например: «Выдать список всех статей по теме: «Исследования вегетососудистой дистонии у детей 13-15 лет». Принципиальной особенностью документальной системы является ее способность, с одной стороны, выдавать ненужные пользователю документы (например, выдается список статей, которые косвенно соответствуют данной теме). Документальная система должна уметь по контексту определять смыл того или иного термина (например, различать «лук» – растение и «лук» - оружие).

Существует особый тип информационных систем – экспертные системы.

Указанная классификация информационных систем в известной мере устарела, так как современные фактографические системы часто работают с неструктурированными блоками информации (текстами, графикой, звуком, видео), снабженными структурированными описателями. Рассмотрим условный пример: пусть объектом обработки фактографической информационной системой является некий список эстрадных певцов, причем для каждого певца имеются следующие данные:

· Сценическое имя;

· Дата рождения в формате ДД.ММ.ГГГГ;

· Пол (М или Ж);

· Биография (произвольный текст);

· Фонограмма с лучшим шлягером певца.

Располагая структурированными описателями (имя, дата, пол), система может выдать строгие ответы на вопросы:

А) о любом певце персонально;

Б) о распределении певцов по возрасту и полу (в любых сочетаниях).

Данные в той или иной форме дублируются в биографии, например: «…родился», «…появился на свет» и т.д., если удалить из списка структурированные описатели, система превратится в документальную и (если не принять мер) утратит способность находить и классифицировать артистов. Компьютер не знает, что, например, Саша – мужчина, а Нано – женщина, что «родится» и «появиться на свет» - синонимы и т.д.

Данные – информация, структурированная внешним образом.

База данных (БД) – совокупность данных на машинном носителе информации;

Принципы организации данных:

• Полнота и непротиворечивость информации;

• Минимальная избыточность;

• Независимость (минимальная зависимость) от особенностей программной и аппаратной реализации;

Система управления базами данных (СУБД) – комплекс программно-аппаратных средств, предназначенных для совместного ведения и использования БД.

Уровни представления данных:

Внешний – визуальное представление данных, с которым работает конечный пользователь

связь уровней: языки управления базами данных (ЯУБД, SQL)

Концептуальный (логический) – уровень математической модели, условное представление данных как системы объектов и связей между ними;

связь уровней: программно-аппаратные средства СУБД

Физический (внутренний) – уровень программно-аппаратной реализации хранения данных.

Модели представления данных:

Модель - это математический или физический аналог исследуемой системы. Существуют 3 основных модели представления данных.

1) Иерархическая

Иерархическая модель данных представляется в виде дерева, где узлами являются элементы данных, а связями узлов показываются связи между объектами.

Иерархия начинается с корневого узла. Каждый узел имеет только одного «предка» и N «потомков».

(+) простота и однозначность представления, легкость адресации

(-) существенная зависимость от программно-аппаратных средств

использование: программирование, математическое моделирование

Пример реализации модели – дерево папок Windows, каталог ресурсов Интернет

2) Сетевая

В сетевой модели возможно существование любых взаимосвязей между объектами. Если изобразить эту модель графически, получится набор узлов на плоскости, связанных линиями со стрелками.

(+) теоретически возможны сколь угодно сложные связи между объектами;

(-) сложность реализации, существенная зависимость от программно-аппаратных средств

использование: автоматизированные системы управления, экспертные системы

Пример реализации – служба WWW поддержки Web-страниц – документы, произвольно связанные ссылками.

3) Реляционная – представление данных в виде системы взаимосвязанных таблиц;

Каждый объект системы описывается в виде таблицы с набором свойств (атрибутов), а взаимосвязь между объектами – связями между таблицами.

(+) простота; относительная независимость от программных и аппаратных средств;

(-) существенная зависимость скорости обработки от объема БД

Использование: все существующие СУБД

Знакомство с работой информационных систем рассмотрим на примере систем управления базами данных (СУБД).

Основа информационной системы, объект ее обработкибаза данных.

База данных – совокупность определенным образом организованной информации о конкретных объектах реального мира, в какой-либо предметной области или разделе предметной области, предназначенная для длительного хранения во внешней памяти ЭВМ и постоянного применения. Для хранения БД может использоваться как один компьютер, так и множество взаимосвязанных компьютеров Например, база данных поликлиники. Синоним термина «база данных» - банк данных. Если различные части одной базы данных хранятся на множестве компьютеров, объединенных между собой сетью, то такая БД называется распределенной базой данных.

Итак, целью информационной системы является обработка данных об объектах реального мира, с учетом связей между объектами. В теории баз данных данные часто называют атрибутами, а объекты – сущностями.

Объект, атрибут и связь – фундаментальные понятия информационных систем.

Объект (сущность) – это нечто с уществующее и различимое, т.е. объектом можно назвать то «нечто», для которого существуют название и способ отличать один подобный объект от другого. Например, каждая школа – это объект. Объектами являются также город, дом, класс в школе и т.д. Когда мы видим цветок на лугу, то можем считать его объектом, если укажем способ отличать один цветок от другого. В противном случае мы не воспринимаем бабочку как объект.

Объектами могут быть не только материальные предметы, но и более абстрактные понятия, отражающие реальный мир. Например, события, произведения искусства: книги (как произведения), кинофильмы и проч.

Группа всех подобных объектов образует набор объектов. Например, классы в школе, книги в библиотеке, товары на складе и т.п. Конкретный Объект в такой группе – экземпляр объекта.

информационная система оперирует наборами объектов, организованных применительно к данной предметной области, используя при этом конкретные значения атрибутов (данных) о тех или иных объектах.

Атрибут (или данное) – это некоторый показатель, который характеризует некий объект и принимает для конкретного экземпляра объекта некоторое числовое, текстовое или иное значение. Например, номер подъезда в доме - это данное, которое принимает числовое значение (1. 2 и т.д.)

*****

Разработчик ИС (а иногда и пользователь) формирует набор объектов произвольно, исходя из смысла задачи и выбранного способа классификации данных.

***

При выборе данного необходимо приписать ему и сообщить системе точное название (имя), с помощью которого в дальнейшем можно манипулировать значениями данных. Например, «Фамилия», «Цена» и т.п. Кроме того, разработчик определяет и сообщает ИС тип данного – текстовое, числовое и т.п., а также формат данного (например, формат даты).

!!! Не следует смешивать «Имя данного» и «Значение данного». Имя данного в системе только одно.

Можно доказать, что любую структуру данных можно преобразовать в простую двумерную таблицу, которая является наиболее удобным представлением для пользователя и для машины. Базы данных, которые состоят из двумерных таблиц, называются реляционными.

Системы управления базами данных (СУБД) являются едва ли не самым распространенным видом программного обеспечения. В основе программ такого рода лежит концепция модели данных, то есть некоторой абстракции представления данных.

В большинстве случаев предполагается, что данные представлены в виде файлов, состоящих из записей. Структура всех записей в файлах одинакова, а количество записей в файле является переменным. Элементы данных, из которых состоит каждая запись, называются полями. Поскольку во всех записях имеются одни и те же поля (с разными значениями), полям удобно давать уникальные имена. Многие практически важные случаи хорошо укладываются в такое представление данных.

Например, в отделе кадров информация о сотрудниках имеют такую природу. Сотрудников принимают на работу и увольняют, но форма личного листа по учету кадров остается неизменной для каждого сотрудника. Товарно-материальные ценности приходят и уходят, но форма инвентарной карточки остается неизменной. Число примеров без труда можно множить.

СУБД является адекватным средством во всех случаях, когда исходную информацию можно представить в виде таблицы постоянной структуры, но неопределенной длины или в виде картотеки, содержащей неопределенное количество карточек постоянной структуры.

Большинство СУБД поддерживают, кроме того, механизм связей между различными файлами, входящих в базу. Связь может установиться неявным образом, например, по совпадению значений полей в различных файлах. Такие СУБД называются реляционными.

Каждая БД хранится на диске в виде файла с расширением. mdb.

Основными возможностями Microsoft Access являются следующие операции:

1 Проектирование базовых объектов с разными типами данных.

2 Установление связей между таблицами с поддержкой целостности данных, каскадного обновления полей и каскадного удаления записей.

3 Ввод, хранение, просмотр, сортировка, модификация и выборка данных из таблиц с использованием различных средств контроля информации, индексирования таблиц и т.д.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: