Информационно-поисковая система – это система, где хранится информация, из которой по требованию пользователя выдается нужная информация, поиск которой осуществляется либо вручную, либо автоматически (определение записать в тетрадь).
Информационно-поисковая система состоит из двух частей:
База данных - большая, специально организованная совокупность данных;
СУБД - программа, позволяющая оперировать этими данными (записать в тетрадь).
Сама по себе БД содержит только информацию – «Информационный склад» –и не может обслуживать запросы пользователя на поиск и обработку информации. Обслуживание пользователя осуществляет СИСТЕМА УПРАВЛЕНИЯ БАЗОЙ ДАННЫХ
. СУБД – Это ПО, которое позволяет создавать БД, обновлять и дополнять информацию, обеспечивать гибкий доступ к информации.
СУБД создает на экране компьютера определенную среду для работы пользователя (интерфейс), и имеет определенные режимы работы и систему команд. Именно на основе СУБД создаются и функционируют информационно-поисковые системы(WWW).
БД классифицируются: по характеру хранимой информации, по способу хранения данных, по структуре организации данных
1.по характеру хранимой информации
а)фактографические (краткая информация в одном формате: картотека)
б)документальная (всевозможные документы – тексты, графика, видео, звук и т. д.: архив)
2.по способу хранения данных
а)централизованные (вся информация хранится на одном компьютере – на сервере)
б)распределенные (информация хранится в локальной или глобальной сети)
3.по структуре организации данных
а)реляционная – табличная (используется наиболее часто и является универсальным)
б)иерархическая
в)сетевая.
1. Иерархические. Существует строгая подчиненность элементов: один главный, остальные подчиненные. Например, система каталогов на диске.
2. Сетевая БД более гибкая: нет явно выраженного главного элемента и в ней существует возможность установления горизонтальных связей. Например, организация информации в Интернете (WWW).
3. Реляционная СУБД. Реляционной (от английского “relation”- отношение) называется БД, которая содержит информацию, организованную в виде прямоугольной таблицы.
Задание. На доске приведена некоторая совокупность данных. Какую полезную для вас информацию вы можете извлечь из нее?
1, 3, 5; ТУ-154; Тюмень; 4, 7; Москва; 8-40; АН-24; Ижевск; 16-20; ТУ-134;320; 308; 3107; 17-35; 1, 3, 5, 7.
– В этой совокупности данных, конечно, можно понять, что речь идет о вылетах самолетов, но в какой день, в какое время и т. д. узнать невозможно. Если же эти данные структурировать, то получим полную информацию о вылетах самолетов.
Рассматриваем таблицу №1
Таблица №1.
Аэропорт назначения | Номер рейса | Тип самолета | Дни отправления | Время Отправления |
Москва | 320 | ТУ-154 | 1,3,5 | 16-20 |
Ижевск | 308 | АН-24 | 4,7 | 17-35 |
Тюмень | 3107 | Ту-134 | 1,3,5,7 | 8-40 |
Реляционная модель данных
Итак, целью информационной системы является обработка данных об объектах реального мира, с учетом связей между объектами. В теории БД данные часто называют атрибутами, а объекты — сущностями. Объект, атрибут и связь — фундаментальные понятия И.С.
Объект (или сущность) — это нечто существующее и различимое, то есть объектом можно назвать то «нечто», для которого существуют название и способ отличать один подобный объект от другого. Например, каждая школа — это объект. Объектами являются также человек, класс в школе, фирма, сплав, химическое соединение и т. д. Объектами могут быть не только материальные предметы, но и более абстрактные понятия, отражающие реальный мир. Например, события, регионы, произведения искусства; книги (не как полиграфическая продукция, а как произведения), театральные постановки, кинофильмы; правовые нормы, философские теории и проч.
Атрибут (или данное) — это некоторый показатель, который характеризует некий объект и принимает для конкретного экземпляра объекта некоторое числовое, текстовое или иное значение. Информационная система оперирует наборами объектов, спроектированными применительно к данной предметной области, используя при этом конкретные значения атрибутов (данных) тех или иных объектах. Например, возьмем в качестве набора объектов классы в школе. Число учеников в классе — это данное, которое принимает числовое значение (у одного класса 28, у другого— 32). Название класса — это данное, принимающее текстовое значение (у одного — 10А, у другого — 9Б и т. д.).
Развитие реляционных баз данных началось в конце 60-х годов, когда появились первые работы, в которых обсуждались; возможности использования при проектировании баз данных привычных и естественных способов представления данных — так называемых табличных даталогических моделей.
Основоположником теории реляционных баз данных считается сотрудник фирмы IBM доктор Э. Кодд, опубликовавший 6 (июня 1970 г. статью A Relational Model of Data for Large-Shared Data Banks (Реляционная модель данных для больших коллективных банков данных). В этой статье впервые был использован термин «реляционная модель данных. Теория реляционных баз данных, разработанная в 70-х годах в США доктором Э. Коддом, имеет под собой мощную математическую основу, описывающую правила эффективной организации данных. Разработанная Э. Коддом теоретическая база стала основой для разработки теории проектирования баз данных.
Э. Кодд, будучи математиком по образованию, предложил использовать для обработки данных аппарат теории множеств (объединение, пересечение, разность, декартово произведение). Он доказал, что любой набор данных можно представить в виде двумерных таблиц особого вида, известных в математике как «отношения».
Реляционной считается такая база данных, в которой все данные представлены для пользователя в виде прямоугольных таблиц значений данных, и все операции над базой данных сводятся к манипуляциям с таблицами.
Таблица состоит из столбцов (полей) и строк (записей); имеет имя, уникальное внутри базы данных. Таблица отражает тип объекта реального мира (сущность), а каждая ее строка— конкретный объект. Каждый столбец таблицы — это совокупность значений конкретного атрибута объекта.