Нормализация данных

Далее на фазе 4 могут быть решены вопросы нормализации данных (полностью или частично). Нормализация – это процесс проверки (а при необходимости и преобразования) составных частей модели данных реляционной структуры с целью сокращения объема памяти для хранения информации и устранения аномалий в организации хранения данных и манипулировании данными. В результате нормализации должна быть создана структура данных, при которой информация о каждом факте хранится только в одном месте. Процесс нормализации базируется на семантике и сводится к последовательному приведению структуры данных к нормальным формам, т.е. некоторым формальным требованиям к организации данных. Теория нормализации данных разработана применительно к этапу даталогического проектирования. Однако многие современные методики проектирования концептуальных схем данных (в частности IDEF1X) позволяют решить некоторые проблемы нормализации еще на этапе инфологического проектирования. При проектировании информационных систем решение о том, на каком этапе проектирования проводить нормализацию данных, принимает рабочая группа проекта.

В настоящее время известно шесть нормальных форм данных. В связи с тем, что методология стандарта IDEF1X поддерживает нормализацию структур данных до четвертого уровня, кратко рассмотрим некоторые формальные правила, позволяющие привести полноатрибутную модель к четвертому нормальному уровню. Более подробно основы теории нормализации данных приведены в следующей главе.

Процесс нормализации концептуальной схемы проводится на фазе 4 инфологического проектирования и заключается в последовательном приведении каждой сущности полноатрибутной модели к четвертому нормальному уровню. В результате этих преобразований составные части полноатрибутной модели могут претерпеть достаточно существенные изменения.

Для приведения сущности к первой нормальной форме необходимо устранить в ней все составные атрибуты, а также атрибуты, имеющие множественные значения. То есть необходимо, чтобы сущность состояла только из атомарных атрибутов. Для этого следует:

· разбить составные атрибуты на атомарные;

· все атрибуты, имеющие множественные значения, поместить в новые сущности;

· установить идентифицирующую определенную связь от старой сущности к каждой новой сущности.

Для приведения сущности ко второй нормальной форме необходимо устранить в ней атрибуты, зависящие только от части первичного ключа. То есть каждый атрибут сущности должен зависеть от всего первичного ключа. Для этого следует:

· выделить атрибуты, которые зависят только от части первичного ключа, и поместить их в новую сущность;

· установить идентифицирующую определенную связь от старой сущности к новой.

Для приведения сущности к третьей нормальной форме необходимо устранить в ней атрибуты, зависящие от атрибутов, не входящих в состав первичного ключа. То есть каждый атрибут сущности должен зависеть только от первичного ключа. Для этого необходимо:

· выделить атрибуты с одной и той же зависимостью не от первичного ключа и поместить их в новую сущность;

· установить необязательную не идентифицирующую определенную связь от новой сущности к старой.

Для приведения сущности к четвертой нормальной форме необходимо устранить в ней многозначные зависимости. Для этого необходимо:

· выделить атрибуты с многозначной зависимостью и перенести их в разные сущности;

· связь между новыми сущностями не устанавливается (ссылочная целостность в этом случае поддерживается при помощи триггеров).

Построением нормализованной полноатрибутной модели заканчивается этап инфологического проектирования базы данных реляционного типа.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: