Кортеж, отношение

Схема отношения, схема базы данных

Домен

Понятие домена более специфично для баз данных, хотя и имеет некоторые аналогии с подтипами в некоторых языках программирования. В самом общем виде домен определяется заданием некоторого базового типа данных, к которому относятся элементы домена, и произвольного логического выражения, применяемого к элементу типа данных. Если вычисление этого логического выражения дает результат "истина", то элемент данных является элементом домена.

Наиболее правильной интуитивной трактовкой понятия домена является понимание домена как допустимого потенциального множества значений данного типа. Например, домен "Имена" в нашем примере определен на базовом типе строк символов, но в число его значений могут входить только те строки, которые могут изображать имя (в частности, такие строки не могут начинаться с мягкого знака).

Следует отметить также семантическую нагрузку понятия домена: данные считаются сравнимыми только в том случае, когда они относятся к одному домену. В нашем примере значения доменов "Номера пропусков" и "Номера групп" относятся к типу целых чисел, но не являются сравнимыми. Заметим, что в большинстве реляционных СУБД понятие домена не используется, хотя в Oracle V.7 оно уже поддерживается.

Схема отношения - это именованное множество пар {имя атрибута, имя домена (или типа, если понятие домена не поддерживается)}. Степень или "арность" схемы отношения - мощность этого множества. Степень отношения СОТРУДНИКИ равна четырем, то есть оно является 4-арным. Если все атрибуты одного отношения определены на разных доменах, осмысленно использовать для именования атрибутов имена соответствующих доменов (не забывая, конечно, о том, что это является всего лишь удобным способом именования и не устраняет различия между понятиями домена и атрибута).

Схема БД (в структурном смысле) - это набор именованных схем отношений.

Кортеж, соответствующий данной схеме отношения, - это множество пар {имя атрибута, значение}, которое содержит одно вхождение каждого имени атрибута, принадлежащего схеме отношения. "Значение" является допустимым значением домена данного атрибута (или типа данных, если понятие домена не поддерживается). Тем самым, степень или "арность" кортежа, т.е. число элементов в нем, совпадает с "арностью" соответствующей схемы отношения. Попросту говоря, кортеж - это набор именованных значений заданного типа.

Отношение - это множество кортежей, соответствующих одной схеме отношения. Иногда, чтобы не путаться, говорят "отношение-схема" и "отношение-экземпляр", иногда схему отношения называют заголовком отношения, а отношение как набор кортежей - телом отношения. На самом деле, понятие схемы отношения ближе всего к понятию структурного типа данных в языках программирования. Было бы вполне логично разрешать отдельно определять схему отношения, а затем одно или несколько отношений с данной схемой.

Однако в реляционных базах данных это не принято. Имя схемы отношения в таких базах данных всегда совпадает с именем соответствующего отношения-экземпляра. В классических реляционных базах данных после определения схемы базы данных изменяются только отношения-экземпляры. В них могут появляться новые и удаляться или модифицироваться существующие кортежи. Однако во многих реализациях допускается и изменение схемы базы данных: определение новых и изменение существующих схем отношения. Это принято называть эволюцией схемы базы данных.

Обычным житейским представлением отношения является таблица, заголовком которой является схема отношения, а строками - кортежи отношения-экземпляра; в этом случае имена атрибутов именуют столбцы этой таблицы. Поэтому иногда говорят "столбец таблицы", имея в виду "атрибут отношения". Когда мы перейдем к рассмотрению практических вопросов организации реляционных баз данных и средств управления, мы будем использовать эту житейскую терминологию. Этой терминологии придерживаются в большинстве коммерческих реляционных СУБД.

Реляционная база данных - это набор отношений, имена которых совпадают с именами схем отношений в схеме БД.

Как видно, основные структурные понятия реляционной модели данных (если не считать понятия домена) имеют очень простую интуитивную интерпретацию, хотя в теории реляционных БД все они определяются абсолютно формально и точно.

Атрибут – использование домена внутри отношения. На одном и том же домене могут быть определены несколько атрибутов; но каждый атрибут определен на одном домене

Первичный ключ – уникальной идентификатор

Важно понимать разницу между доменом и столбцами (или атрибутами), которые образуются из этого домена. Атрибут представляет использование домена внутри отношения.

Суть любого кортежа отношения COMPONENT состоит в том, что основная (MAJOR) деталь включает некоторую другую (MINOR) деталь в указанном количестве. Двумя различными доменами являются Р# (номер детали) и QUANTITY (количество). Этот пример иллюстрирует еще одно общее соглашение, касающееся образования имен различных атрибутов путем добавления уточняющих префиксов к имени общего домена. Эти префиксы указывают на различные роли данного домена при каждом вхождении в отношение.

COMPONENT MAJOR - Р# MINOR - Р# QUANTITY
  Р1 Р2  
  Р1 Р4  
  Р5 Р3  
  Р3 Р6  
  Р6 Р1  
  Р5 Р6  
  Р2 Р4  

Рис. Отношение COMPONENT.

Отличие отношения от таблицы: в отношение определены типы атрибутов, а в таблице нет. В отношении нет повторяющихся строк. Таблицы в БД являются переменными- отношений т.е. их значения это значения отношений (различные значения отношений в разное время).

Отношение реляционной БД может быть описано в терминах теории множеств.

Пусть дана совокупность множеств доменов D1, D2, …, DN. Декартовым произведением этих множеств (D1* D2*, …, *DN) является множество всех возможных упорядоченных кортежей (d1, d2, …, dn) таких что d1  D1 и dn  Dn.

Пример декартовых произведений двух множеств S и Q.


Отношение является подмножеством декартового произведения доменов на которых определены атрибуты.

Свойства отношений:


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: