Проектирование документальных баз данных

По характеру обрабатываемой информации ИС делятся на документальные и фактографические. В документальных системах основной единицей хранения информации является документ, содержание которого представлено текстовой (слабоструктурированной) информацией. Основу документальных ИС составляют документальные или текстовые базы данных.

Пакеты прикладных программ для работы с текстовыми базами данных (БД) отличаются друг от друга по мощности и гибкости поиска, но в общем они поддерживают те же функции, которые были разработаны в течение последних 20 лет на больших коммерческих БД. Использование тех или иных функций определялось природой документальных БД или теми целями, которые преследовались при использовании той или иной коммерческой БД.

Текстовые БД делятся на три главных типа: библиографические, полнотекстовые и реферативные. В свою очередь, эти типы БД могут включать в себя или обращаться к широкому кругу таких материалов, как журнальные статьи, книги, аудиовизуальные материалы, корреспонденция, заметки, просто записанная информация. В то время как сферы применения информации и ее состав широко варьируются, существуют общие для всех документальных БД характеристики, которые позволяют отделить их от других типов БД.

Большая часть информации в документальных БД состоит из буквенных характеристик. Такие поля, как «автор», «реферат», «ссылка» содержат в основном слова, а не цифры. Даже те поля, которые включают цифры (например, номера страниц), воспринимают цифровую информацию как символьную, а не как цифры, используемые при вычислениях. Использование текстовой информации отличает такие базы данных от большинства БД, применяемых в различных информационных службах. Хотя некоторые вычислительные функции также необходимы в программном обеспечении, созданном для документальных БД, мощность информационно-поискового программного обеспечения определяется способностью оперировать строками символов и предлагаемыми специальными поисковыми функциями, работающими с грамматическими структурами.

Текстовые БД обычно более объемны и занимают больше места, чем БД других типов. БД, которые обращаются к определенному текстовому массиву литературы или обеспечивают доступ к полным текстам документов, имеют тенденцию расти, из-за того, что новые записи добавляются в массив, а старые продолжают играть важную роль для исследователей.

Анализ особенностей документальных баз данных


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: