В технологии использования ИПС можно выделить три группы операций:
• операции, связанные с получением поисковых образов документов (ПОД), описывающих содержание документов и загрузкой их в базу данных (БД ПОД), а также загрузкой самих документов или их адресов хранения в БДДок и БДАдр.;
• операции составления поисковых образов запроса (ПОЗ) с использованием тезауруса, поиска и выдачи результатов на просмотр и отбор или файл или на печать найденных документов или списка адресов;
• операции ведения информационно-поисковой системы, включающие актуализацию БД ПОД, БДДок., БДАдр. и тезауруса вследствие возникновения и необходимости пополнения памяти системы новыми документами или ключевыми словами.
Какое назначение имеет СУД, в чем отличие ее от ИПС?
Отличие -для хранения структурированных данных можно применять специализированные информационные системы (типа бухгалтерской или торговой системы или системы планового отдела), основанные, на использовании СУБД, то для неструктурированных данных нужны системы общего назначения - электронные архивы, работающие на принципах информационно-поисковой системы.
|
|
СУД -некое средство автоматизации, которое может организовать не только хранение и поиск документов, но обеспечить высокую эффективность работы с документами в масштабах всей организации. (Договора, приказы, деловая переписка, финансовая, проектная и другие виды документации беспорядочно накапливаются на рабочих столах сотрудников или в файловых системах их компьютеров, затрудняя поиск информации, коллективную работу над документами, их согласование и соблюдение конфиденциальности)
Какие основные показатели работы ИПС и СУД Вы знаете?
Основными задачами, для решения которых предназначается СУД в дополнении к тем, которые реализуются средствами ИПС, являются следующие:
• создание и ведение единого электронного архива, способного аккумулировать данные любых типов, которые систематизируются с помощью гибко настраиваемых классификаторов документов и тематических иерархий проектов или папок;
• обеспечение быстрого и удобного поиска информации с возможностью немедленного вызова документа на редактирование в привычной для пользователя программе;
• ограничение возможности каждого конкретного пользователя по просмотру и модификации документов, обеспечивая необходимый уровень безопасности;
• обеспечение работы с несколькими версиями одного и того же документа, выписки документа для обработки вне системы и возврат его в библиотеку, а также экспорт и импорт документов;
|
|
• повышение надежности (целостности) хранения данных;
• обеспечение быстрого времени отклика электронной архивной системы вне зависимости от объемов хранящихся в ней данных и прозрачного доступа к информации, расположенной в различных территориально-разнесенных подразделениях предприятия;
• обеспечение коллективной обработки документов и их согласования.
Какие типы носителей используются в СУД?
Различают два типа оптических носителей. Диски WORM (write once and read many), обеспечивающие возможность только один раз записывать информацию в выделенный сектор и многократно ее считывать. Существуют также диски, данные на которые можно переписать. И те и другие выпускаются различного размера, хотя наиболее часто используются 5.251.
Разработаны устройства типа jukebox - это механические роботы, управляющие десятками или сотнями расположенных внутри них оптических дисков. Накопители типа jukebox могут содержать один или больше оптических дисководов, достигая емкости 600 Гб и более. Эти устройства рассчитаны в основном на корпоративные системы управления документами, поскольку на одном-двух jukebox может свободно расположиться весь архив предприятия, будь то финансовая компания, правительственное учреждение, юридическая или медицинская фирма, проектная организация, рекламное агентство.
Какие методы поиска документов относятся к классу «индексных»?
Индексный, или двоичный, поиск применятся главным образом со структурированными базами данных. В таких методах слова интерпретируются как последовательности закодированных символов. Используя формальный синтаксис, или язык запросов, система двоичного поиска выбирает точное соответствие для отдельного слова или цепочки слов.
Это самый простой вид поиска документа по содержанию, но и самый слабый вид поиска, что выражается в малой полноте (это означает, что редко удается найти нужный документ).
Какие методы относятся к статистическим методам поиска и их основное назначение?
статистический метод основываются на расчете различных частотных характеристик: частоты вхождения слова в документ, взвешенной частоты вхождения и частоты совместного вхождения нескольких слов
Что такое семантические методы поиска и их отличие от индексных?
Семантический поиск. Следующий шаг в развитии поисковых систем - это так называемый семантический (т. е. смысловой) поиск, основанный на построении и использовании базы знаний, с помощью которой осуществляется поиск информации на основе использования концептуальных отношений, которые не применяются при статистическом поиске.
Какие классы СУД Вы знаете, приведите примеры?
Интегрированные СУД связывают карточки документов с их физическими файлами на сетевом сервере - пользователи имеют дело уже с ними, а не с именами файлов и сложными путями к директориям.
Сетевые СУД - системы масштабируемые. Благодаря тому, что карточки документов хранятся в SQL-базах данных, СУД пригодны как для единиц, так и для десятков и даже десятков сотен пользователей