Нормализация, функциональные и многозначные зависимости

Нормализация – разбиение таблиц на два и более, обладающих лучшими свойствами при включении, изменении и удалении данных. Окончательная цель получение такого проекта БД, в котором каждый факт появляется лишь в одном месте, то есть, исключена избыточность и противоречивость информации. Каждая таблица реляционной БД удовлетворяет условию, по которому на пересечении каждой строки и столбца всегда находится единственное атомарное значение. любая таблица, удовлетворяющая этому условию,- нормализованная

Теория нормализации основывается на наличии функциональной и многозначной зависимости между полями таблицы.

Поле В таблицы функционально зависит от поля А той же таблицы только в том случае, когда в любой заданный момент времени для каждого из различных значений поля А обязательно существует только одно из различных значений поля В. Отметим, что здесь допускается, что поля А и В могут быть составными.

Поле В находится в полной функциональной зависимости от составного поля А, если оно функционально зависит от А и не зависит функционально от любого подмножества поля А.

Поле А многозначно зависит от поля В той же таблицы, если для каждого значения поля А существует хорошо определенное множество соответствующих значений В.

 

69. Нормальные формы.

Таблица находится в первой нормальной форме (1НФ) тогда и только тогда, когда ни одна из ее строк не содержит в любом своем поле более одного значения и ни одно из ее ключевых полей не пусто.

Таблица находится во второй нормальной форме (2НФ), если она удовлетворяет определению 1НФ и все ее поля, не входящие в первичный ключ, связаны полной функциональной зависимостью с первичным ключом.

Таблица находится в третьей нормальной форме или форме Бойса-Кодда (3НФ или НФБК), если и только если любая функциональная зависимость между его полями сводится к полной функциональной зависимости от возможного ключа.

Таблица находится в пятой нормальной форме (5НФ) тогда и только тогда, когда в каждой ее полной декомпозиции все проекции содержат возможный ключ. Таблица, не имеющая ни одной полной декомпозиции, также находится в 5НФ.

Четвертая нормальная форма (4НФ) является частным случаем 5НФ, когда полная декомпозиция должна быть соединением ровно двух проекций. Весьма не просто подобрать реальную таблицу, которая находилась бы в 4НФ, но не была бы в 5НФ.

 

70. Процедура нормализации.

Нормализация – процесс последовательной замены таблицы ее полными декомпозициями до тех пор пока все они не будут находиться в 5НФ.

Шаг 1. Определение первичного ключа таблицы

Шаг 2. Выявление полей, функционально зависящих от части

Шаг 3. Формирование новых таблиц

Шаг 4. Корректировка исходной таблицы

 

71. Назначение, возможности ERWin.

CASE-технологии (Computer Aided Software/System Engineering)

Одними из самых популярных программных продуктов, обеспечивающих полный цикл анализа, проектирования и кодогенерации, являются автоматизированные инструменты серии Platinumtechnology (LogicWorks):

  • BPWin (функциональное моделирование),
  • ERWin (информационное моделирование),
  • ModelMart (синхронизация моделей ERWin и BPWin),
  • ParadigmPlus (поддержка UML - языка объектного проектирования (UnifyModelingLanguage)),
  • RPTWin (генератор отчетов для создания презентаций моделей).

IDEF1X, ICAM (Integrated Computed Aided Manufacturing)

Современный инструмент моделирования баз данных должен удовлетворять ряду требований:

· позволять разработчику сконцентрироваться на самом моделировании, а не на проблемах с графическим отображением диаграммы. Инструмент должен автоматически размещать сущности на диаграмме, иметь развитые и простые в управлении средства визуализации и создания представлений модели.

· инструмент должен проверять диаграмму на согласованность, автоматически определяя и разрешая несоответствия. Однако инструмент должен быть настраиваемым и при желании предоставлять разработчику некоторую свободу в действиях и право самому разрешать несоответствия или отступления от методологии.

· инструмент моделирования должен поддерживать как логическое, так и физическое моделирование.

· современный инструмент должен автоматически генерировать базу данных на СУБД назначения.

 

Рис. 23.

Возможности ERwin:

Обычно разработка модели базы данных состоит из двух этапов: составление логической модели и создание на ее основе физической модели. ERwin полностью поддерживает такой процесс, он имеет два представления модели: логическое (logical) и физическое (physical). Разработчик может строить логическую модель базы данных, не задумываясь над деталями физической реализации, т.е. уделяя основное внимание требованиям к информации и бизнес-процессам, которые будет поддерживать будущая база данных. ERwin имеет удобный пользовательский интерфейс, позволяющий представить базу данных в самых различных аспектах: "хранимое представление" (storeddisplay) и "предметная область" (subjectarea).

ERwin поддерживает автоматическую генерацию спроектированной и определенной на физическом уровне структуры данных (Microsoft SQL Server, Oracle, Sybase, DB2, INFORMIX, RedBrick, Teradata, PROGRESS, MicrosoftAccess, FoxPro, Clipper и др.).

ERwin имеет средство, выполняющее задачу, обратную генерации, что называется "обратная разработка" (reverseengineering). Т.е. ERwin может присоединиться к СУБД, получить всю информацию о структуре базы данных и отобразить ее в графическом интерфейсе, сохранив все сущности, связи, атрибуты и прочие свойства.

Начиная с версии 3.5 ERwin, поддерживает многомерное моделирование, которое используется при построении хранилищ данных. Производительность OLAP-приложений определяется, в основном, качеством дизайна хранилища данных, поэтому критически важно при разработке хранилища иметь инструмент, который бы поддерживал распространенные технологии. ERwin поддерживает две технологии моделирования хранилищ данных: звезда (star) и снежинка (snowflake).

 

72. Интерфейс ERWin. Уровни отображения модели.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: