double arrow

Системы автоматизации документооборота

Автоматизация документооборота заключается в комплексной автоматизации задач разработки, согласования, распространения, поиска и архивного хранения документов организации.

Постоянное увеличение количества информации, необходимой для принятия правильного управленческого решения, приводит к тому, что традиционные методы работы с документами становятся неэффективными. Так, по сведениям компании Delphi, 15% бумаж­ных документов безвозвратно теряются и для их поиска сотрудники тратят до 30% своего рабочего времени. При переходе к электрон­ным документам и автоматизации документооборота рост произво­дительности сотрудников увеличивается на 25—50%, сокращается время обработки одного документа более чем на 75%, на 80% умень­шаются расходы на оплату площади для хранения документов (оцен­ка Nortan Nolan Institute).

Тенденцию перехода от традиционных технологий организации документооборота к компьютерным отражают следующие цифры: соотношение количества бумажных и электронных документов че­рез пять лет составит 50 на 50%, через десять лет — 30 на 70%; коли­чество электронных документов удваивается за год, а бумажных до­кументов растет только на 7% (данные компании XPLOR).

В конце 80-х - начале 90-х гг. появились и начали интенсивно развиваться ряд новых технологий, успешно используемых в совре­менных системах автоматизации документооборота:

технологии обработки изображений документов (Imaging

System);

системы оптического распознавания символов (Optical Character

Recognition System, OCR);

системы управления документами, СУД (Document Management

System, DMS);

полнотекстовые базы данных (Full-Text System);

системы автоматизации деловых процедур, АДП (Work-Flow

System);

программное обеспечение для рабочих групп (Groupware).

Системы обработки изображений документов предназначены для ввода, обработки, хранения и поиска графических образов бумаж­ных документов. Подобные системы целесообразно применять в организациях с большим объемом документооборота. Техническое обеспечение систем включает высокоскоростные сканеры, документ-ные контроллеры (выполняют быструю и высокоэффективную ком­прессию/декомпрессию документов и обеспечивают скоростную ра­боту со сканерами и принтерами), библиотеки-автоматы на базе оптических накопителей с автоматической подачей дисков. Компью­терные образы документов находятся на сервере изображений и про­сматриваются на рабочих станциях-клиентах.

Системы обработки изображений осуществляют сканирование документов для записи на сервер, их классификацию по различным критериям, передачу изображений на рабочую станцию для просмо­тра, модификацию или печать. Подобные системы предусматривают также определение маршрута передачи изображений по сети, их рас­сылку по факсу или электронной почте, поиск изображений по от­дельным элементам.

Так как файлы изображений достигают больших размеров, су­ществуют различные варианты организации их хранения. В целях экономии памяти на запоминающем устройстве большинство сис­тем сжимают изображения и создают специальный индекс изобра­жений, где содержатся соответствующие значения атрибутов доку­ментов, например наименование, автор, тема.

В высокопроизводительных системах реализованы технологии, позволяющие увеличить скорость работы. Например, предвари­тельная выборка и перенос изображений с медленных оптических носителей на более быстрые магнитные; адаптируемое кэширова­ние, позволяющее хранить часто используемые изображения в памяти сервера; вывод на лазерный диск; групповое сканирова­ние, обеспечивающее считывание нескольких страниц за одну операцию.

Многие системы обработки изображений включают программ­ное обеспечение оптического распознавания символов (OCR).

Применение OCR позволяет решить проблему перевода бумаж­ных документов в электронную форму в виде текстового файла. Системы OCR позволяют получать электронную копию документа с печатного листа либо копию документа, пришедшего по факсу. Су­ществуют экспериментальные системы, позволяющие подобным образом обрабатывать также и рукописные материалы (Intelligent Character Recognition).

Кратко, функционирование системы OCR можно представить следующим образом. С помощью сканирующего устройства считы­вается изображение документа. В результате распознавания текста изображение документа отображается в файл, отформатированный как текстовый. Таким образом, бумажный документ, минуя низко­производительный и трудоемкий ручной ввод, автоматически преоб­разуется в электронную форму.

Выделяют два класса систем OCR - обучаемые и интеллектуаль­ные. Принцип действия систем первого класса основан на поточеч­ном сравнении оцифрованного символа с образцом из справочника. При совпадении образца и символа последний считается распознан­ным и добавляется в результирующий файл. При таком способе рас­познавания размеры образца и шрифта документа должны совпадать, т.е. в системе необходимо иметь маски для каждого размера каждого типа шрифта, поэтому подобная система более эффективна в случае однотипного и качественного текста. Во втором случае «маска» символа заменяется на его «образ», который может быть использован для любых размеров шрифтов.

Для повышения точности распознавания интеллектуальные си­стемы могут выполнять ряд проверок результирующего текста, на­пример осуществлять частотный анализ текста и сравнивать частоту появления данного символа в тексте с его частотой в языке оригина­ла, или обнаруживать неправильное сочетание символов исходя из правил орфографии.

В реальных системах OCR сочетаются различные распознава­тельные механизмы, что дает возможность обрабатывать любые шрифты и любые тексты.

На сегодняшний день известно несколько достаточно качествен­ных программных продуктов по распознаванию текста, в том числе — две системы отечественных фирм, ориентированных прежде всего на распознавание русскоязычных текстов (FineReader и CuneiForm). Средняя скорость работы системы OCR на оборудова­нии средней мощности составляет примерно одну машинописную страницу в минуту. Качество распознавания - в среднем одна - две ошибки на 1000 знаков в тексте среднего качества.

Можно рекомендовать следующие критерии выбора системы OCR:

совместимость с существующим или приобретаемым программ­ным и аппаратным обеспечением;

скорость сканирования и распознавания преобладающего в дан­ной организации типа текста, например: факс — русский язык, ксеро­копия различного качества, машинопись различного качества и др.;

качество распознавания текстов различных типов, например количество ошибок на 1000 знаков;

способность распознавать редкие шрифты;

способность обучения новым символам;

наличие элементов семантического анализа текста;

наличие модуля проверки орфографии;

удобство пользовательского интерфейса.

Системы управления документами (СУД) предназначены для ав­томатизации хранения, поиска и управления электронными доку­ментами разнообразных форматов, в том числе и изображениями документов. Можно сказать, что СУД фактически выполняют роль СУБД для неструктурированной информации.

Развитые системы управления документами осуществляют сле­дующие функции:

индексирование документов;

полнотекстовый поиск по ключевым словам;

управление конфигурацией документа с установлением взаимо­связи между отдельными структурными компонентами;

ассемблирование документов, позволяющее объединить все ча­сти составного документа для отображения на экране;

организация доступа к документу независимо от места его хра­нения;

поиск и управление документами с помощью ключевых компо­нентов, таких, как оглавление или название раздела;

многоуровневая защита данных, которая разрешает доступ к документам только отдельным пользователям или устанавливает виды доступа, например «только для чтения»;

администрирование учета и архивирования;

организация выдачи/возврата документа;

контроль версий документа;

рассылка документов.

Выполнение функции выдачи/возврата аналогична блокировке записи в БД. Если документ уже выдан, другие пользователи редак­тировать его не могут. Он остается доступным только для просмотра и копирования.

Функция контроля версий используется для отслеживания раз­личных версий документа, позволяет использовать предыдущие ре­дакции документа, которые для экономии памяти часто автоматиче­ски архивируются.

Функция рассылки документов осуществляется путем интегри­рования системы с приложениями электронной почты. Это позволя­ет перемещать документы по сети масштаба предприятия и переда­вать документы от одного сотрудника к другому.

Развитие сети Internet определяет появление ряда новых функ­ций современных СУД. Например, возможность помещения доку­ментов на Web-узле; поддержка обмена документами по интрасети между сотрудниками фирмы, а по Internet - с клиентами и партне­рами фирмы.

Системы управления документами базируются на архитектуре клиент-сервер, состоящей из четырех основных элементов:

центрального приложения, находящегося на сервере;

программ клиентов, работающих на сетевых рабочих станциях и образующих пользовательский интерфейс;

программного обеспечения для индексирования и поиска, раз­мещенного на сервере СУБД и работающего с базой данных, в кото­рой регистрируется место хранения документа;

документов, которые рассматриваются системой как объекты, состоящие из файлов различных типов - текстов, изображений, и могут храниться как на жестких дисках рабочих станций, так и на серверах.

Лидером на мировом рынке СУБД является компания Documentum (продукт Enterprise Document Management).

Программное обеспечение для рабочих групп (groupware) предназ­начено для организаций, сотрудникам которых по характеру их дея­тельности требуется постоянный обмен документами. Осуществ­ляет задачи хранения, просмотра и совместного использования до­кументов. Системы класса groupware позволяют автоматизировать такую деятельность, которая не вписывается в стандартные схемы реляционных баз данных. Например, взаимодействие большого чис­ла людей, исполняющих различные работы в физически удаленных друг от друга местах. Такие приложения могут обрабатывать как структурированную, так и неструктурированную информацию. Основными функциями ПО для рабочих групп являются: электронная почта;

поддержка видеоконференций/совещаний; управление изображениями документов; совместное использование документов; маршрутизация документов; календарное планирование.

Лучшими системами класса groupware считаются: Lotus Notes компании Lotus Development, Link Works компании Digital Equipment, Group Wise компании Novel.

Продукт Lotus Notes - это среда с архитектурой клиент-сервер, предназначенная для разработки и совместного использования при­ложений коллективной работы. В Lotus Notes входят три основные составляющие:

средства маршрутизации и обработки документов; средства обеспечения защиты/управления документами; распределенная база данных (документов). В базах данных Lotus Notes хранятся документы различных фор­матов, в том числе структурированная информация, различные тек­сты, электронные таблицы, изображения, видео- и аудиоинформа­ция. Lotus Notes позволяет создавать OLE-серверные приложения, т.е. графики, электронные таблицы, рисунки можно встраивать в документы. Специальные приложения Lotus Notes могут быть связа­ны с записями и полями реляционных баз данных. Также имеется возможность полнотекстового поиска.

Lotus Notes имеет развитую систему управления доступом, кото­рый осуществляется на нескольких уровнях: базы данных, документа или частей документа. Управлять доступом можно также на уровне одного пользователя или групп пользователей. В системе выделяется восемь видов доступа: от открытости для всех пользователей до пол­ного запрета доступа.

Важнейшим достоинством Lotus Notes является возможность синхронизации баз данных. Базы данных разных компьютеров син­хронизируются через определенные интервалы времени путем ми­нимально необходимого для этого обмена по каналам связи. Тира­жирование (процесс двусторонней синхронизации копий распреде­ленной базы данных) дает возможность пользователям различных сетей работать с одной и той же информацией. Через заданные ин­тервалы времени серверы Lotus Notes связываются друг с другом и синхронизируют все изменения в документах и списках управления доступом.

Lotus Notes интегрирован с системой электронной почты Notes Mail, позволяющей посылать корреспонденцию другим пользовате­лям или группам.

Базовыми средствами для разработки приложений в Lotus Notes являются формы, представления и макрокоманды. Представления — это форма вывода данных на экран или принтер (аналогичны отче­там в реляционных СУБД).

Достоинством Lotus Notes является высокая платформенная не­зависимость. Система работает на платформах OS/2, Windows NT, UNIX различных версий, Macintosh System 7. Приложения Lotus Notes достаточно легко масштабируются, их можно адаптировать как к малой рабочей группе, так для организации работы в масштабе предприятия.

В последнюю версию Lotus Notes 4.0 включены средства совме­стимости с Internet (встроен броузер, редактор Web-страниц, почто­вая программа, работающая со стандартным Internet-протоколом); расширены инструменты разработки приложений (включен язык LotusScript, являющийся расширенным аналогом Visial Basic).

Система Group Wise компании Novel включает средства электрон­ной почты, личного и группового календарного планирования, управ­ления заданиями и документами. Последние версии системы базиру­ются на архитектуре клиент-сервер и поддерживают стандарты Internet, отличаются высокой производительностью и масштабируемостью.

Основными составляющими системы являются хранилище до­кументов (библиотека) и три объектно-ориентированные базы дан­ных в формате Novel. Библиотека содержит документы (тексты, эле­ктронные таблицы, графические файлы). Все операции с документа­ми регистрируются. Доступ к документам осуществляется под кон­тролем средств защиты.

Первая БД хранит так называемые сообщения (почтовые, рече­вые сообщения, факсы, расписания встреч, перечень заданий, за­метки). Вторая БД содержит информацию о связях между пользова­телями и сообщениями/документами. Третья БД хранит характерис­тики документов.

В GroupWise имеется возможность поиска данных как по полно­му тексту, так и с помощью фильтров. Для обеспечения безопаснос­ти применяются пароли и средства управления правами доступа.

Достоинством последней версии GroupWise являются развитые средства управления документами. В систему интегрирована СУБД SoftSolutions, которая ранее выпускалась той же компанией, но от­дельным продуктом.

Продукт Link Works также относится к классу groupware и явля­ется объектно-ориентированной офисной системой. Предоставляет конечным пользователям возможность управления как их персональ­ными, так и связанными с рабочей группой документами при помо­щи единой объектно-ориентированной среды для настольных сис­тем. Администратор размещает групповые и персональные папки документов на серверах Link Works, а конечные пользователи наст­раивают среду настольных систем на обмен документами между пер­сональными и групповыми папками. В состав Link Works входят: система персонального документооборота (графический аналог ра­бочего стола); электронная почта; организация совместного исполь­зования документов и контроля версий.

Системы автоматизации деловых процедур (ЛДП) предназначены для создания сложных прикладных систем коллективной обработки документов в процессе осуществления конкретных бизнес-процес­сов. Документальные потоки на предприятии привязываются к су­ществующим бизнес-процессам и регламенту их взаимодействия. При жесткой маршрутизации документа заранее прописывается дви­жение документа по всем рабочим местам. Определяются права поль­зователей на документ в каждой точке маршрута. При свободной маршрутизации исполнитель может определить дальнейший путь движения документа, обычно на один уровень.

Примером систем АДП может служить продукт фирмы Staffware. Документы в системе обрабатываются по принятому в организации алгоритму и перемещаются в рамках корпоративной системы между отдельными подразделениями и исполнителями по заранее определенным маршрутам. Система основана на техноло­гии клиент-сервер, интегрируется с программными продуктами, работающими на платформах Windows NT, Windows 95, UNIX, В состав системы может входить графический построитель процедур (Graphical Workflow Definer), описывающий документопоток в виде диаграмм с указанием логических шагов, маршрутизации, предель­ных сроков и форм отчетов. Является инструментом для разра­ботки модели бизнес-процессов.

В последнее время наблюдается тенденция сближения и пересе­чения функциональных возможностей вышеописанных систем. Так, в системах, классифицируемых как groupware, могут использоваться технологии полнотекстовых баз данных, систем управления докумен­тами и автоматизации деловых процедур. Поэтому в современных системах автоматизации документооборота вышеуказанные техноло­гии могут применяться как в качестве отдельных, так и интегриро­ванных компонент.

Литература к главе 20

1. Дескрипторный словарь по информатике. - М., ВИНИ­ТИ,1991. - 162 с.

2. Ланкастер Ф. Информационно-поисковые системы. - М., Мир, 1972. - 310 с.

3. Михайлов А., Черный А. Основы информатики. — М., Наука, 4968.-456с.

4. Монастырский И. Информационно-поисковые системы. — М., Экономика, 1983.'-206 с.

5. Озкарахан Э. Машины баз данных. - М., Мир, 1989. - с. 539-643.

6. Субботин М. Гипертекст. Новая форма письменной коммуни­кации. - М., Знание, 1994.

7. Сэлтон Г. Автоматическая обработка, хранение и поиск ин­формации. - М., Советское радио, 1973. — 560 с.

8. Тихомиров В.П. Основы гипертекстовой информационной технологий. - М., МЭСИ, 1993.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: