Понятие модели данных, базы данных и СУБД

 

По определению модель данных понимают как интеллектуальное средство, позволяющее реализовывать интерпретацию данных и таким образом способствовать получению информации. Данные по сути отражают свойства объектов реального мира. Данные, представляющие одно и тоже свойство различных объектов объединяются в так называемые именованные категории.

Совокупность именованных категорий, их свойств и связей между ними образуют схему данных. Управление Базами Данных на ЭВМ осуществляется с помощью СУБД, которые поддерживают язык определенных данных, язык определения ограничения целостности, и обеспечивает выполнение операций над данными с помощью языка манипулирования данными.

Для того, чтобы данные хранились в соответствии с конкретной схемой, необходимо подвергнуть их структуризации.

Основной способ структуризации данных – абстракция. Абстракция представляет собой совокупность деталей конкретного предмета, явления или понятия, которое может быть соответствующем образом рассмотрено и именовано, как целое. Существует два способа абстракции: обобщение и агрегация. Обобщение позволяет соотносить множество знаков или типов с одним типом. Агрегация – абстракция посредством которой объект конструируется из других конструируется из других базовых объектов. Операция, обратная агрегации называется декомпозицией.

Агрегация и обобщение применяются взаимозаменяющем образом и выражают соответственно структурные и классификационные аспекты типизации. На основе этих операций и определяется множество структур данных.

3.2 Модель данных ‘‘Сущность - Связь’’

 

 Любая предметная область представляет собой совокупность некоторых объектов реального мира, которые взаимодействуют между собой. В терминах ER – модели объекты реального мира называются сущностями. Для отражения в модели взаимодействия сущностей между собой используются связи.

Однородные сущности, т. е. сущности, обладающие одинаковыми характеристиками, объединяются в множества сущностей. Характеристики сущностей являются атрибутами. Атрибут определяется, как отображение из множества сущностей в множество значений.

Связи между элементами одних множеств сущностей, обладающие одинаковой семантикой (смыслом), объединяются в множество связей. Связи могут строиться и на элементах одного множества сущностей. Характеристики связей определяются атрибутами связей, которые есть отображение из множества связей в множество значений. Семантическое значение сущности в связи называют ее ролью. Естественно, что роли соответствующих сущностей в элементах одного множества связей совпадают.

Таким образом, схема базы данных в ER – модели представляет собой множество множеств сущностей с определенным для каждого из них конечного непустого множества атрибутов и множество множеств связей, для каждого из которых определено конечное множество атрибутов, а также упорядоченный набор множеств сущностей, на которых строятся связи и для каждой из которых может быть определена роль.

Графическое изображение схемы данных называется ER-диаграммой. Пример ER-диаграммы приведен на рисунке 1.

Рис. 1. Пример ER-диаграммы

 

В пособии также рассмотрены ограничения целостности, поддерживаемые в модели и операции над данными (язык манипулирования данными – CABLE).

Отмечены основные достоинства и недостатки ER – модели.

 

Достоинства

А) Естественность. Структуры в ER – модели сравнительно неплохо соответствуют структурам реального мира по сравнению со структурами в других моделях.

Б) Возможность явного определения ограничений на существование.

В) Хранение явной информации о связях, что позволяет избежать неоднозначности в вопросе существования связи, что характерно для многих других моделей.

 

Недостатки:

А) Трудность практической реализации.

В) Неприспособленность для распределенных БД.

 

Реляционная модель

 

Автор реляционной модели (relation model) – Кодд. В настоящее время это самая распространенная модель данных, которую поддерживает подавляющее большинство СУБД, в частности и Access. Реляционная модель удобна для реализации в СУБД, но не удобна для представления предметной области, поэтому удобно сначала построить ER – диаграмму предметной области, а затем воспользоваться правилами трансформации схемы из ER – модели в реляционную.

 Ограничения целостности в модели поддерживаются с помощью так называемых триггеров целостности, которые задаются с помощью ЯООЦ. Синтаксис ЯООЦ зависит от конкретной реализации модели. Рассмотрены основные типы ограничений целостности.

Навигационные операции реализуются с помощью навигационных языков. Навигационные операции обеспечивают навигацию по БД, то есть последовательный просмотр кортежей.

     Также рассматриваются спецификационные операции. Если навигационные языки предполагают движение по БД, и на каждом шаге рассматривается отдельный кортеж, то спецификационные производятся над отношениями, а любые действия над отношениями реализуются с помощью операций реляционной алгебры.

Операции реляционной алгебры:

1) теоретико- множественные;

2) декартово произведение;

3) проекции;

4)  селекции;

5) деления;

6) соединения;

Также в пособие рассмотрено реляционное исчисление на кортежах, реляционное исчисление на доменах (и в частности табличный язык QBE), языки манипулирования данными основанное на отображениях (и в частности SQL). Даны понятия о КИС (корпоративных информационных системах), распределенной БД и о клиент-серверных системах.

Распределенные базы данных – это такие базы данных, которые распределены в пространстве. Особенностью распределенных БД является то, что они обслуживают крупные учреждения, разные отделы которых могут базироваться на больших расстояниях друг от друга, при этом часть информации регулярно используется всеми отделами, а часть информации регулярно требуется только для работы одного отдела, а другие же подразделения используют эту информацию крайне редко. Поэтому следует наиболее эффективно расположить информацию в пространстве.

Распределенные базы данных часто построены по принципам клиент-серверной технологии. Суть в том, что программный продукт в качестве логических компонентов имеет сервер и несколько клиентов. Клиент работает с пользователем, а на сервере хранится информация.

Достоинства и недостатки реляционной модели

Достоинства:

1)высокая приспособленность к реализации в СУБД;  

2)возможность создания распределенных БД;                                       

Недостатки:

1)неадекватное представление предметной области;

 2)невозможность явного определения ограничений на существование;

3)трудности при написание запросов.

 

Сетевая модель

 

Основные структурные единицы данных в сетевой модели – запись и набор. Сетевую схему удобно представлять с помощью сетевой диаграммы.

Приведен пример сетевой схемы БД ВУЗ (рисунок 2):

схемы рис.2 пример сетевой.

В сетевой модели поддерживаются следующие ограничения целостности.

1) значение атрибутов;

2) ключи;

3)ограничение по типу связи;

4)ограничения по типу членства в наборе.

Типы членства в наборе: FIXED(фиксированное), MANDATOR (обязательное), OPTIONAL(необязательное).

 

Операции в сетевой модели

1)Навигационные операции- они обеспечивают проход по записям одного типа и проход по записям другого, которые являются членами набора, владельцем которого является данная запись.

2)Спецификационные операции сводятся к селекции по записям и наборам.

Достоинства и недостатки сетевой модели.

Достоинства:

1) Хранение информации о функциональных связях в явном виде.

2) Возможность реализации повторяющихся наборов данных.

Недостатки:

1)Невозможность хранения в явном виде информации о нефункциональных связях.

2)Трудность практической реализации в СУБД.

3)Неприспособленность для создания распределенных БД.

 

3.5. Этапы проектирования информационных систем.

Рассмотрены семь этапов проектирования информационных систем:

1)Анализ потребностей, то есть определение механических процессов, для автоматизации которых и создается эта система.

2)Этап выделения предметной области. Здесь целесообразно построение деловой модели.

3)Формальное описание предметной области. Здесь удобным средством является ER-модель. По завершение этого этапа мы имеем схему базы данных для обслуживания Информационной системы.

4)На этом этапе следует выбрать конкретную СУБД, с помощью которой будет реализована схема базы данных, затем происходит выбор и следует трансформировать схему в модель данных. Далее следует преступать к реализации схемы.

5)Создание адекватного агрегатного состояния данных (то есть загрузка самих данных в базу).

6)На шестом этапе происходит реализация функциональности.

7)На этом этапе нужно провести обучение обслуживающего персонала работе с Информационными системами.

 Процесс непосредственного использования в теории должен проходить без участия разработчика, однако на практике в системе постоянно обнаруживаются ошибки, которые необходимо исправлять, кроме того часто приходится реализовывать новую функциональность, что к тому же может привести к необходимости модификации схемы данных.  

 

Файловые системы.

 

Историческим шагом явился переход к использованию централизованных систем управления файлами. Система управления файлами берет на себя распределение внешней памяти, отображение имен файлов в соответствующие адреса во внешней памяти и обеспечение доступа к данным. Основными устройствами внешней памяти является магнитные диски с подвижными головками именно они служат для хранения файлов. Возможность обмениваться с магнитными дисками порциями меньше объема блока в настоящее время не используется в файловых системах. В некоторых файловых системах базовый уровень доступен пользователю, но более часто прикрывается некоторым более высоким уровнем, стандартным для пользователей.

Все современные файловые системы поддерживают многоуровневое именование файлов за счет поддержания во внешней памяти дополнительных файлов со специальной структурой – каталогов.

Поскольку файловые системы являются общим хранилищем файлов принадлежащих, вообще говоря, разным пользователям, системы управления файлами должны обеспечить авторизацию доступа к файлам. Поэтому в большинстве современных систем управления файлами применяется подход к защите файлов, впервые реализованных в операционной системе UNIX.

Файлы применяются для хранения данных. Такие файлы обычно образуются и модифицируются с помощью различных текстовых редакторов. Файлы с текстами программ используются как входные тексты компиляторов, которые в свою очередь формируют файлы, содержащие объектные модули.

Одним словом, файловые системы обеспечивают хранение слабо структурированной информации, оставляя дальнейшую структуризацию прикладным программам.



Заключение

Мы закончили разработку электронного учебного пособия по курсу “Основы искусственного интеллекта”. Некоторые разделы данного пособия уже апробированы в определенных группах. Можно сделать вывод, что данное методическое пособие облегчает работу преподавателям и является лучшим “помощником” студентам в самостоятельной подготовке к занятию или зачету. Вообще говоря, внедрение электронного учебного пособия предполагает совершенствование процесса преподавания, повышение его эффективности и качества, сокращение времени на изучение учебного материала, тиражирование передовых педагогических технологий. 

Следует заметить, что к данному пособию необходимо добавить и разработать лишь те главы, которые не вошли в пособие, т.е. расширить это пособие. Чтобы пособие было полным, интересным и занимающим, в него следует включить средства мультимедиа, контролирующие устройства, тесты, задания для проверки усвоения материала и т.д. 




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: