В отличие от фактографических информационных систем, единичным элементом данных в документальных [информационных системах] является неструктурированный на более мелкие элементы документ. В качестве неструктурированных документов в подавляющем большинстве случаев выступают, прежде всего, текстовые документы, представленные в виде текстовых файлов, хотя к классу неструктурированных документированных данных могут также относиться звуковые и графические файлы.
Основной задачей документальных информационных систем является накопление и предоставление пользователю документов, содержание, тематика, реквизиты и т. п. которых адекватны его информационным потребностям. Поэтому можно дать следующее определение документальной информационной системы — единое хранилище документов с инструментарием поиска и отбора необходимых документов. Поисковый характер документальных информационных систем исторически определил еще одно их название — информационно-поисковые системы (ИПС), хотя этот термин не совсем полно отражает специфику документальных ИС.
|
|
Соответствие найденных документов информационным потребностям пользователя называется пертинентностью.
В силу теоретических и практических сложностей с формализацией смыслового содержания документов пертинентность относится скорее к качественным понятиям, хотя, как будет рассмотрено ниже, может выражаться определенными количественными показателями.
В зависимости от особенностей реализации хранилища документов и механизмов поиска документальные ИПС можно разделить на две группы:
· системы на основе индексирования;
· семантически-навигационные системы.
В семантически-навигационных системах документы, помещаемые в хранилище (в базу) документов, оснащаются специальными навигационными конструкциями, соответствующими смысловым связям (отсылкам) между различными документами или отдельными фрагментами одного документа. Такие конструкции реализуют некоторую семантическую* (смысловую) сеть в базе документов. Способ и механизм выражения информационных потребностей в подобных системах заключаются в явной навигации пользователя по смысловым отсылкам между документами. В настоящее время такой подход реализуется в гипертекстовых ИПС.
В системах на основе индексирования исходные документы помещаются в базу без какого-либо дополнительного преобразования, но при этом смысловое содержание каждого документа отображается в некоторое поисковое пространство. Процесс отображения документа в поисковое пространство называется индексированием и заключается в присвоении каждому документу некоторого индекса-координаты в поисковом пространстве. Формализованное представление (описание) индекса документа называется поисковым образом документа (ПОД). Пользователь выражает свои информационные потребности средствами и языком поискового пространства, формируя поисковый образ запроса (ПОЗ) к базе документов. Система на основе определенных критериев и способов ищет документы, поисковые образы которых соответствуют или близки поисковым образам запроса пользователя, и выдает соответствующие документы. Соответствие найденных документов запросу пользователя называется релевантностью. Схематично общий принцип устройства и функционирования документальных ИПС на основе индексирования иллюстрируется на рис.
|
|
Рис. Общий принцип устройства и функционирования документальных ИПС на основе индексирования
Особенностью документальных ИПС является также то, что в их функции, как правило, включаются и задачи информационного оповещения пользователей по всем новым поступающим в систему документам, соответствующим заранее определенным информационным потребностям пользователя.
Принцип решения задач информационного оповещения в документальных ИПС на основе индексирования аналогичен принципу решения задач поиска документов по запросам и основан на отображении в поисковое пространство информационных потребностей пользователя в виде так называемых поисковых профилей пользователей (ППП). Информационно-поисковая система по мере поступления и индексирования новых документов сравнивает их образы с поисковыми профилями пользователей и принимает решение о соответствующем оповещении.
Поисковое пространство, отображающее поисковые образы документов и реализующее механизмы информационного поиска документов так же, как и в СУБД фактографических систем, строится на основе языков документальных баз данных, называемых информационно-поисковыми языками (ИПЯ).
Информационно-поисковый язык представляет собой некоторую формализованную семантическую систему, предназначенную для выражения содержания документа и запросов по поиску необходимых документов. По аналогии с языками баз данных фактографических систем ИПЯ можно разделить на структурную и манипуляционную составляющие.
Структурная составляющая ИПЯ (поискового пространства) документальных ИПС на основе индексирования реализуется индексными указателями в форме информационно-поисковых каталогов, тезаурусов и генеральных указателей.
Информационно-поисковые каталоги являются традиционными технологиями организации информационного поиска в документальных фондах библиотек, архивов и представляют собой классификационную систему знаний по определенной предметной области. Смысловое содержание документа в информационно-поисковых каталогах отображается тем или иным классом каталога, а индексирование документов заключается в присвоении каждому документу специального кода (индекса) соответствующего по содержанию класса (классов) каталога и создания на этой основе специального индексного указателя.
Тезаурус представляет собой специальным образом организованную совокупность основных лексических единиц (понятий) предметной области (словарь терминов) и описание парадигматических отношений между ними. Парадигматические отношения выражаются семантическими отношениями между элементами словаря, не зависящими от любого контекста. Независимость от контекста означает обобщенность (абстрагированность) смысловых отношений, например отношения «род-вид», «предмет-целое», «субъект-объект-средство-место-время действия». Так же, как и в информационно-поисковых каталогах, в системах на основе тезаурусов в информационно-поисковое пространство отображается не весь текст документа, а только лишь выраженное средствами тезауруса смысловое содержание документа.
|
|
Генеральный указатель (конкорданс) (глобальный словарь-индекс) в общем виде представляет собой перечисление всех слов (словоформ), имеющихся в документах хранилища, с указанием (отсылками) координатного местонахождения каждого слова (№ документа — № абзаца — № предложения — № слова). Индексирование нового документа в таких системах производится через дополнение координатных отсылок тех словоформ генерального указателя, которые присутствуют в новом документе. Так как поисковое пространство в таких системах отражает полностью весь текст документа (все слова документа), а не только его смысловое содержание, то такие системы получили название полнотекстовых ИПС.
В специальной литературе такие системы иногда называют системами без лексического контроля, т. е. без учета возможной синонимичности отдельных групп словоформ, объединения отдельных групп словоформ в общие смысловые группы, семантических отношении между словоформами.
ЛАБОРАТОРНАЯ РАБОТА №2
Тема: «РАБОТА В СПРАВОЧНО-ПРАВОВОЙ СИСТЕМЕ «КОНСУЛЬТАНТ-ПЛЮС»
Цель работы: Ознакомление со структурой СПС «Консультант-Плюс», изучение основных разделов меню, получение навыков поиска правовых документов.
Описание входа в систему
- Стартовое окно в системе Консультант-Плюс
или
- Для поиска документов по известным реквизитам войдите в Карточку поиска (по всем разделам). Для поиска документов следует ввести известные реквизиты в соответствующие поля:
- Для поиска информации по практическому вопросу откройте Правовой навигатор. Правовой навигатор позволяет найти информацию по практическому вопросу с использованием перечня возможных ситуаций.
- Для быстрого поиска документов используют окно Быстрого поиска:
- В Стартовом окне также находятся:
- Список последних просмотров документов;
- Переход к списку кодексов;
|
|
- Переход к новостям и обзорам законодательства;
- Поиск книг и публикаций в бухгалтерской и юридической прессе;
- Словарь терминов;
- Переход к справочной информации;
- Переход к документам последних наполнений;
- Переход к новостям Консультант-Плюс.
Представление текста в системе Консультант-Плюс
Информационная строка содержит информацию об особенностях применения этого документа. Располагается под названием текста документа в верхней части экрана.
Получить дополнительную информацию:
- Позволяет к документу в целом большой значок [ i], расположенный в начале документа и на Правой панели.
- Ко всей статье (главе, разделу) позволяет яркий значок [ i], расположенный слева от заголовка статьи (главы, раздела).
- К отдельному абзацу статьи позволяет светлый значок [ i], расположенный слева от абзаца.
Примечания в тексте (отделены сплошными чертами). Для получения справки нужно щелкнуть по кнопке «Справка», откроется окно «Справка», которое содержит информацию о порядке применения, особенностях вступления в силу, источники публикации и другое.
Для перехода в оглавление документа нажмите кнопку «Оглавление», откроется окно «Оглавление», для перехода к нужной статье документа следует щелкнуть по названию в оглавлении.
Оглавление существует для документов со сложной структурой, используется для быстрого перехода в нужный раздел документа. Достаточно щёлкнуть мышкой по названию пункта оглавления документа для перехода в его текст:
- Вызывается одноимённой кнопкой Правой панели окна с текстом документа.
- Наличие у раздела подразделов отмечено символом слева от названия раздела, что позволяет разворачивать/сворачивать оглавление разделов документа.
На Правой панели также расположены:
1. Список всех редакций документа;
2. Обзор изменений документа;
3. Подсчет страниц для печати.
Панель инструментов содержит пиктограммы:
· копирование текста в Word;
· отправка документа по почте;
· печать текста документа;
· связи данного документа с другими материалами;
· изменение размера шрифта и др.
Любой документ можно распечатать, если, находясь в его тексте, нажать кнопку пиктографического меню.
Кнопка позволяет с помощью установленной на компьютере Почтовой программы переслать найденный в системе Консультант-Плюс документа в виде текстового вложения. После нажатия этой кнопки автоматически откроется окно почтовой программы, и файл с текстом документа будет прикреплён к созданному сообщению.
Нужен кодекс
Пример: найдём вторую часть налогового кодекса:
- На стартовом окне нажмите кнопку «Кодексы»;
- В появившемся списке найдите Налоговый кодекс (часть вторая) и, щёлкнув мышью по его названию, перейдете в текст документа.