Большие массивы данных об объектах и явлениях реального мира вместе с программно-аппаратными средствами для их обработки называют информационными системами (ИС).
Информационная система — это совокупность базы данных и всего комплекса аппаратно-программных средств для ее хранения, изменения и поиска информации, для взаимодействия с пользователем.
Информационные системы можно условно разделить на фактографические и документальные.
В фактографических информационных системах регистрируются факты – конкретные значения данных (атрибутов) об объектах реального мира. Основная идея таких систем заключается в том, что все сведения об объектах (фамилии людей, названия предметов, числа, даты) сообщаются компьютеру в каком-то заранее обусловленном формате. Информация, с которой работает фактографическая информационная система, имеет четкую структуру, позволяющую машине отличать одно данное от другого, - например, фамилию от человека от должности. Поэтому фактографическая система способна давать однозначные ответы на поставленные вопросы, например: «Сколько учеников в классе?».
|
|
Документальные информационные системы обслуживают принципиально иной класс задач, которые не предполагают однозначного ответа на поставленный вопрос. Базу данных таких систем образует совокупность неструктурированных текстовых документов (статьи, книги, рефераты и т.д.) и графических объектов, снабженная тем или иным формализованным аппаратом поиска. Цель системы, как правило, - выдать в ответ на запрос пользователя список документов или объектов, в какой-то мере удовлетворяющих сформулированным в запросе условиям. Например: «Выдать список всех статей по теме: «Исследования вегетососудистой дистонии у детей 13-15 лет». Принципиальной особенностью документальной системы является ее способность, с одной стороны, выдавать ненужные пользователю документы (например, выдается список статей, которые косвенно соответствуют данной теме). Документальная система должна уметь по контексту определять смыл того или иного термина (например, различать «лук» – растение и «лук» - оружие).
Существует особый тип информационных систем – экспертные системы.
Указанная классификация информационных систем в известной мере устарела, так как современные фактографические системы часто работают с неструктурированными блоками информации (текстами, графикой, звуком, видео), снабженными структурированными описателями. Рассмотрим условный пример: пусть объектом обработки фактографической информационной системой является некий список эстрадных певцов, причем для каждого певца имеются следующие данные:
|
|
· Сценическое имя;
· Дата рождения в формате ДД.ММ.ГГГГ;
· Пол (М или Ж);
· Биография (произвольный текст);
· Фонограмма с лучшим шлягером певца.
Располагая структурированными описателями (имя, дата, пол), система может выдать строгие ответы на вопросы:
А) о любом певце персонально;
Б) о распределении певцов по возрасту и полу (в любых сочетаниях).
Данные в той или иной форме дублируются в биографии, например: «…родился», «…появился на свет» и т.д., если удалить из списка структурированные описатели, система превратится в документальную и (если не принять мер) утратит способность находить и классифицировать артистов. Компьютер не знает, что, например, Саша – мужчина, а Нано – женщина, что «родится» и «появиться на свет» - синонимы и т.д.
Данные – информация, структурированная внешним образом.
База данных (БД) – совокупность данных на машинном носителе информации;
Принципы организации данных:
• Полнота и непротиворечивость информации;
• Минимальная избыточность;
• Независимость (минимальная зависимость) от особенностей программной и аппаратной реализации;
Система управления базами данных (СУБД) – комплекс программно-аппаратных средств, предназначенных для совместного ведения и использования БД.
Уровни представления данных:
Внешний – визуальное представление данных, с которым работает конечный пользователь
связь уровней: языки управления базами данных (ЯУБД, SQL)
Концептуальный (логический) – уровень математической модели, условное представление данных как системы объектов и связей между ними;
связь уровней: программно-аппаратные средства СУБД
Физический (внутренний) – уровень программно-аппаратной реализации хранения данных.
Модели представления данных:
Модель - это математический или физический аналог исследуемой системы. Существуют 3 основных модели представления данных.
1) Иерархическая
Иерархическая модель данных представляется в виде дерева, где узлами являются элементы данных, а связями узлов показываются связи между объектами.
Иерархия начинается с корневого узла. Каждый узел имеет только одного «предка» и N «потомков».
(+) простота и однозначность представления, легкость адресации
(-) существенная зависимость от программно-аппаратных средств
использование: программирование, математическое моделирование
Пример реализации модели – дерево папок Windows, каталог ресурсов Интернет
2) Сетевая
В сетевой модели возможно существование любых взаимосвязей между объектами. Если изобразить эту модель графически, получится набор узлов на плоскости, связанных линиями со стрелками.
(+) теоретически возможны сколь угодно сложные связи между объектами;
(-) сложность реализации, существенная зависимость от программно-аппаратных средств
использование: автоматизированные системы управления, экспертные системы
Пример реализации – служба WWW поддержки Web-страниц – документы, произвольно связанные ссылками.
3) Реляционная – представление данных в виде системы взаимосвязанных таблиц;
Каждый объект системы описывается в виде таблицы с набором свойств (атрибутов), а взаимосвязь между объектами – связями между таблицами.
(+) простота; относительная независимость от программных и аппаратных средств;
(-) существенная зависимость скорости обработки от объема БД
Использование: все существующие СУБД
Знакомство с работой информационных систем рассмотрим на примере систем управления базами данных (СУБД).
Основа информационной системы, объект ее обработки – база данных.
База данных – совокупность определенным образом организованной информации о конкретных объектах реального мира, в какой-либо предметной области или разделе предметной области, предназначенная для длительного хранения во внешней памяти ЭВМ и постоянного применения. Для хранения БД может использоваться как один компьютер, так и множество взаимосвязанных компьютеров Например, база данных поликлиники. Синоним термина «база данных» - банк данных. Если различные части одной базы данных хранятся на множестве компьютеров, объединенных между собой сетью, то такая БД называется распределенной базой данных.
|
|
Итак, целью информационной системы является обработка данных об объектах реального мира, с учетом связей между объектами. В теории баз данных данные часто называют атрибутами, а объекты – сущностями.
Объект, атрибут и связь – фундаментальные понятия информационных систем.
Объект (сущность) – это нечто с уществующее и различимое, т.е. объектом можно назвать то «нечто», для которого существуют название и способ отличать один подобный объект от другого. Например, каждая школа – это объект. Объектами являются также город, дом, класс в школе и т.д. Когда мы видим цветок на лугу, то можем считать его объектом, если укажем способ отличать один цветок от другого. В противном случае мы не воспринимаем бабочку как объект.
Объектами могут быть не только материальные предметы, но и более абстрактные понятия, отражающие реальный мир. Например, события, произведения искусства: книги (как произведения), кинофильмы и проч.
Группа всех подобных объектов образует набор объектов. Например, классы в школе, книги в библиотеке, товары на складе и т.п. Конкретный Объект в такой группе – экземпляр объекта.
информационная система оперирует наборами объектов, организованных применительно к данной предметной области, используя при этом конкретные значения атрибутов (данных) о тех или иных объектах.
Атрибут (или данное) – это некоторый показатель, который характеризует некий объект и принимает для конкретного экземпляра объекта некоторое числовое, текстовое или иное значение. Например, номер подъезда в доме - это данное, которое принимает числовое значение (1. 2 и т.д.)
|
|
*****
Разработчик ИС (а иногда и пользователь) формирует набор объектов произвольно, исходя из смысла задачи и выбранного способа классификации данных.
***
При выборе данного необходимо приписать ему и сообщить системе точное название (имя), с помощью которого в дальнейшем можно манипулировать значениями данных. Например, «Фамилия», «Цена» и т.п. Кроме того, разработчик определяет и сообщает ИС тип данного – текстовое, числовое и т.п., а также формат данного (например, формат даты).
!!! Не следует смешивать «Имя данного» и «Значение данного». Имя данного в системе только одно.
Можно доказать, что любую структуру данных можно преобразовать в простую двумерную таблицу, которая является наиболее удобным представлением для пользователя и для машины. Базы данных, которые состоят из двумерных таблиц, называются реляционными.
Системы управления базами данных (СУБД) являются едва ли не самым распространенным видом программного обеспечения. В основе программ такого рода лежит концепция модели данных, то есть некоторой абстракции представления данных.
В большинстве случаев предполагается, что данные представлены в виде файлов, состоящих из записей. Структура всех записей в файлах одинакова, а количество записей в файле является переменным. Элементы данных, из которых состоит каждая запись, называются полями. Поскольку во всех записях имеются одни и те же поля (с разными значениями), полям удобно давать уникальные имена. Многие практически важные случаи хорошо укладываются в такое представление данных.
Например, в отделе кадров информация о сотрудниках имеют такую природу. Сотрудников принимают на работу и увольняют, но форма личного листа по учету кадров остается неизменной для каждого сотрудника. Товарно-материальные ценности приходят и уходят, но форма инвентарной карточки остается неизменной. Число примеров без труда можно множить.
СУБД является адекватным средством во всех случаях, когда исходную информацию можно представить в виде таблицы постоянной структуры, но неопределенной длины или в виде картотеки, содержащей неопределенное количество карточек постоянной структуры.
Большинство СУБД поддерживают, кроме того, механизм связей между различными файлами, входящих в базу. Связь может установиться неявным образом, например, по совпадению значений полей в различных файлах. Такие СУБД называются реляционными.
Каждая БД хранится на диске в виде файла с расширением. mdb.
Основными возможностями Microsoft Access являются следующие операции:
1 Проектирование базовых объектов с разными типами данных.
2 Установление связей между таблицами с поддержкой целостности данных, каскадного обновления полей и каскадного удаления записей.
3 Ввод, хранение, просмотр, сортировка, модификация и выборка данных из таблиц с использованием различных средств контроля информации, индексирования таблиц и т.д.