Одним из особых сегментов современного рынка систем управления документооборотом (СУД) являются так называемые системы управления выводом документов (output management systems — OMS), основным предназначением которых является генерация выходных документов. Ряд OMS-систем отвечает только за распределение и доставку выходных документов (в электронном виде — в форматах HTML, XML и PDF). Очень часто OMS-системы интегрированы с программными пакетами сканирования документов и изображений. Полезной возможностью некоторых OMS-систем является и взаимодействие с унаследованными системами.
В некоторых OMS-системах дополнительно реализована возможность архивации и долговременного хранения выходных отчетов и документов. В связи с этим, многие из OMS-систем классифицируются Gartner Group как и нтегрированные системы архивации и поиска документов (IDARS — integrated document archive and retrieval systems). Однако главной причиной популярности OMS-систем все же является занимаемая ими рыночная ниша — генерация документов и отчетов в информационных системах предприятий и организаций, построенных с использованием ERP-систем. По мнению аналитиков Gartner Group, одним из слабых мест современных ERP-систем является плохое управление генерацией выходных документов (разработчики ERP-систем больше сосредоточены на повышении функциональности ключевых модулей своего ПО, чем на «второстепенных» вопросах обеспечения генерации выходных отчетов, не имеющих, по их мнению, хороших рыночных возможностей). Именно этот недостаток ERP-систем и послужил основным фактором появления и быстрого развития рынка OMS-систем.
|
|
Информационно – поисковые технологии для электронного делопроизводства.
В системах должны быть предусмотрены развитые возможности индексирования, хранения и поиска документов, включая полнотекстовое индексирование.
Индексирование документов означает:
· реквизитную индексацию;
· ручное управление структурами хранения документов;
· настройку состава полей, типа и длины контрольных карточек документа в архиве;
· автоматическую полнотекстовую индексацию документов;
· автоматическое распознавание формата файла электронного документа;
· индексацию текста документа сразу при его вводе;
· морфологический анализ индексируемых текстов для приведения помещаемых в индекс слов к канонической форме (нормализация текста в индексе);
· наличие стоп – словарей при полнотекстовой индексации и обеспечение их настройки;
· выделение из текста сложных (составных) терминов и понятий;
· поддержку и настройку словарей и тезауруса;
· технологию реквизитной разметки документов;
|
|
· настройку набора реквизитов;
· возможность различных режимов реквизитной разметки документов (ручной, автоматический, полуавтоматический);
· интеграцию с произвольными программами создания, просмотра и изменения электронных документов.
Хранение документов включает в себя возможность:
· работы с библиотеками магнитооптических дисков, магнитных лент, компакт – дисков для хранения больших объемов информации;
· управление внешними носителями;
· хранение электронных документов произвольного формата, аннотированных текстов, по которым производится поиск;
· хранения в системе для каждой страницы как исходного изображения, так и распознанного текста.
Поиск предусматривает:
· наличие стандартного языка запросов к БД;
· реквизитный поиск документов;
· полнотекстовый поиск, точность поиска;
· поиск по именам документов и аннотациям;
· формирование сложных запросов с использованием логических операций;
· контекстный поиск и меру близости слов при поиске;
· адекватность результата поиска запросу;
· морфологический анализ при построении запроса;
· возможность работы с системой удаленных пользователей.
Поиск может быть составным и включать несколько поисковых атрибутов из перечисленных выше типов. Результатом поиска служат образ найденных документов и содержание аннотаций, построенных в процессе индексирования или его ручного атрибутирования. Найденные образы могут быть распечатаны или переданы по корпоративной сети для просмотра с другого рабочего места.
Запрос строится путем заполнения шаблона ключевыми словами, содержание которых пользователь может задавать произвольно. Поиск документов по запросу осуществляется на двух уровнях: сначала происходит поиск в справочнике данных, а по ссылкам ищется (при задании пользователем соответствующих атрибутов) сам документ. Как правило, хранение документов осуществляется автономно из – за больших объемов архива и необходимости использования оптических накопителей информации. Такая архитектура, кроме всего, позволяет минимизировать время, затрачиваемое на физический доступ к документам в режиме множественных запросов, а также обеспечивает доступ данных из неоднородных (гетерогенных) сетей.
Следует отметить, что образ документа может храниться как в текстовом, так и в графическом формате. В последнем случае он, как правило, является результатом использования OCR– технологий.