Системы управления выводом документов

Одним из особых сегментов современного рынка систем управления документооборотом (СУД) являются так называемые системы управления выводом документов (output management systems — OMS), основным предназначением которых является генерация выходных документов. Ряд OMS-систем отвечает только за распределение и доставку выходных документов (в электронном виде — в форматах HTML, XML и PDF). Очень часто OMS-системы интегрированы с программными пакетами сканирования документов и изображений. Полезной возможностью некоторых OMS-систем является и взаимодействие с унаследованными системами.

В некоторых OMS-системах дополнительно реализована возможность архивации и долговременного хранения выходных отчетов и документов. В связи с этим, многие из OMS-систем классифицируются Gartner Group как и нтегрированные системы архивации и поиска документов (IDARS — integrated document archive and retrieval systems). Однако главной причиной популярности OMS-систем все же является занимаемая ими рыночная ниша — генерация документов и отчетов в информационных системах предприятий и организаций, построенных с использованием ERP-систем. По мнению аналитиков Gartner Group, одним из слабых мест современных ERP-систем является плохое управление генерацией выходных документов (разработчики ERP-систем больше сосредоточены на повышении функциональности ключевых модулей своего ПО, чем на «второстепенных» вопросах обеспечения генерации выходных отчетов, не имеющих, по их мнению, хороших рыночных возможностей). Именно этот недостаток ERP-систем и послужил основным фактором появления и быстрого развития рынка OMS-систем.

Информационно – поисковые технологии для электронного делопроизводства.

В системах должны быть предусмотрены развитые возможности индексирования, хранения и поиска документов, включая полнотекстовое индексирование.

Индексирование документов означает:

· реквизитную индексацию;

· ручное управление структурами хранения документов;

· настройку состава полей, типа и длины контрольных карточек документа в архиве;

· автоматическую полнотекстовую индексацию документов;

· автоматическое распознавание формата файла электронного документа;

· индексацию текста документа сразу при его вводе;

· морфологический анализ индексируемых текстов для приведения помещаемых в индекс слов к канонической форме (нормализация текста в индексе);

· наличие стоп – словарей при полнотекстовой индексации и обеспечение их настройки;

· выделение из текста сложных (составных) терминов и понятий;

· поддержку и настройку словарей и тезауруса;

· технологию реквизитной разметки документов;

· настройку набора реквизитов;

· возможность различных режимов реквизитной разметки документов (ручной, автоматический, полуавтоматический);

· интеграцию с произвольными программами создания, просмотра и изменения электронных документов.

Хранение документов включает в себя возможность:

· работы с библиотеками магнитооптических дисков, магнитных лент, компакт – дисков для хранения больших объемов информации;

· управление внешними носителями;

· хранение электронных документов произвольного формата, аннотированных текстов, по которым производится поиск;

· хранения в системе для каждой страницы как исходного изображения, так и распознанного текста.

Поиск предусматривает:

· наличие стандартного языка запросов к БД;

· реквизитный поиск документов;

· полнотекстовый поиск, точность поиска;

· поиск по именам документов и аннотациям;

· формирование сложных запросов с использованием логических операций;

· контекстный поиск и меру близости слов при поиске;

· адекватность результата поиска запросу;

· морфологический анализ при построении запроса;

· возможность работы с системой удаленных пользователей.

Поиск может быть составным и включать несколько поисковых атрибутов из перечисленных выше типов. Результатом поиска служат образ найденных документов и содержание аннотаций, построенных в процессе индексирования или его ручного атрибутирования. Найденные образы могут быть распечатаны или переданы по корпоративной сети для просмотра с другого рабочего места.

Запрос строится путем заполнения шаблона ключевыми словами, содержание которых пользователь может задавать произвольно. Поиск документов по запросу осуществляется на двух уровнях: сначала происходит поиск в справочнике данных, а по ссылкам ищется (при задании пользователем соответствующих атрибутов) сам документ. Как правило, хранение документов осуществляется автономно из – за больших объемов архива и необходимости использования оптических накопителей информации. Такая архитектура, кроме всего, позволяет минимизировать время, затрачиваемое на физический доступ к документам в режиме множественных запросов, а также обеспечивает доступ данных из неоднородных (гетерогенных) сетей.

Следует отметить, что образ документа может храниться как в текстовом, так и в графическом формате. В последнем случае он, как правило, является результатом использования OCR– технологий.