Ранее документом называли деловую бумагу, подтверждающую какой-нибудь факт. С появлением компьютерных технологий это понятие расширилось и электронным документом стали именовать набор информации, который имеет имя, определенную структуру, хранится в памяти системы и может передаваться между нею и пользователем.
Материальным носителем документа стала не только бумага, но и фотопленка, платежная карточка, магнитная лента, магнитный, и оптический диск.
Содержащиеся в документе сведения должны быть удобны для обработки в системах. Если они записываются в общепринятой форме, определяемой международными стандартами, то говорят, что создается открытый документ.
Документ характеризуется стилем, содержит текст, изображения, фрагменты звука, соотносится со временем его создания, имеет реквизиты- обязательно указываемые сведения. Например, адрес, наименование, автор, подпись. Составляется документ на одном из естественных либо искусственных языков.
Совокупность документов образует документацию. Последняя классифицируется в соответствии с ее назначением. Поэтому, для одного и того же субъекта могут создаваться разные документы: банковские, сметные, технические, проектные, пользовательские. Развитие информационных систем и сетей привело к появлению электронных документов. Все болееважное значение получают так называемые составные электронные документы. Они создаются пользователями из заранее подготовленных блоков данных (текстов, изображений, фрагментов речи) либо сообщений, полученных по электронной почте, факсимильной связи.
|
|
Любые электронные документы должны создаваться в таком виде, чтобы они были понятны как пользователям, так и системам. Если они вначале составляются на бумаге, то предпочтительно применение машиночитаемых шрифтов. Из групп электронных документов формируются файлы. Последние хранятся в базах данных и знаний, а их поиск осуществляется информационными поисковыми системами. Из одной системы в другую электронные документы передаются в виде сообщений.
Обработка документов является процессом их создания и преобразования. Она заключается в классификации, сортировке, преобразовании в нужную форму, размещении в базах данных, поиске и выдаче пользователям. Стремление к созданию независимой от конкретных пользователей обработки привело к появлению технологии обработки открытых документов. Она опирается на международные стандарты. При этом выделяют две наиболее широкие сферы применения обработки документов: издательская и учрежденческая. Издательская деятельность охватывает обработку публикаций (книг, журнальных статей, рекламных изданий и т.д.). Здесь главным является взаимодействие между автором и издательством. Автор отвечает за содержание произведения, оставляя издательству процесс его оформления.
|
|
Учрежденческая деятельность имеет дело с обработкой и передачей документов. Этот обмен осуществляется, в отличие от издательской деятельности, без предварительных договоренностей и ограничений по характеру их обработки. Вместе с этим необходимо, чтобы адресаты понимали получаемые документы.
При обработке документов необходимо решать большое число задач, к которым, в частности, относятся:
· подбор необходимых сведений и ввод их в систему;
· организация хранения документов;
· комплексное структурирование информации;
· включение в документ разнородной информации (текстов, изображений, фрагментов звуков);
· объединение фрагментов, подготовленных различными работниками;
· передача страниц документов между таблицами и базами данных;
· внесение изменений, редактирование и актуализация использованных документов;
· координация действий работников, участвующих в подготовке сложных документов;
· выбор шрифтов, форматов и форм представлений документов;
· рассылка и распечатка документов.
Для уменьшения объема необходимой памяти осуществляется сжатие хранимых документов. При этом объемы логической и физической памяти могут отличаться в несколько раз. Сжимаемые документы при их хранении записываются в наиболее медленно работающие (а поэтому – дешевые) запоминающие устройства. Чаще всего ими являются оптические диски или магнитные ленты. В результате реализации рассматриваемой технологии создаются электронные архивы документов. Специальные программы позволяют управлять структурой архивов, быстро находить и выдавать пользователям необходимые им документы.
Для этого любой документ, помещаемый в базу данных или знаний, должен иметь имя (условное обозначение). Оно может присваиваться документу путем его индексирования – методики описания данных в базе с помощью указателей (индексов). Файл, обращение к содержимому которого происходит при помощи индексов, называют индексированным. Метод доступа к такому файлу именуется индексно-последовательным.
Процесс индексирования заключается в нахождении набора слов или кодов, служащих для идентификации документов и используемых для их поиска. Существует несколько методов индексирования. Статистический метод заключается в том, что из текста документа отбрасываются все незначащие слова, например: из, под, но. Затем подсчитывается частота употребления каждого оставшегося слова и учитывается отклонение частоты слов в документе от ожидаемой. В результате, создается поисковый образ документа. Он готовится специалистом либо прикладной программой и от его качества зависит полнота поиска, т.е. процент найденных документов, содержащих искомые сведения. Используются три степени поиска: по заголовкам, рефератам, полным текстам.
Движение документов между сотрудниками организации и предприятия называют документооборотом. Ядром документооборота является (рис. 3.1. база данных. В ней собираются и из нее выдаются все документы. Управление базой осуществляется с помощью созданных для этого программ. Редактирование документов, их индексирование, определение гипертекстовых ссылок осуществляется также путем взаимодействия с базой данных.
Структура документооборота
Документооборот определяет потоки электронных документов, необходимых в организации либо на предприятии для обеспечения эффективной координации и управления работой. Осуществляется документооборот с помощью системы, состоящей из комплекса прикладных программ. Последние обеспечивают запуск процессов, поиск документов, их анализ, классификацию, хранение и передачу в заданные информационные системы.
|
|
Для функционирования системы автоматизируемый процесс должен быть выделен из всей массы выполняемых на предприятии работ. Естественно, что этот процесс должен быть формализован и описан в виде алгоритма. В выделенном бизнес-процессе участвует группа сотрудников предприятия (организации). Поэтому, в нужных случаях, должны быть учтены вопросы синхронизации их деятельности.