Документы и их обработка

Ранее документом называли деловую бумагу, подтверждающую какой-нибудь факт. С появлением компьютерных технологий это понятие расширилось и электронным документом стали именовать набор информа­ции, который имеет имя, определенную структуру, хранится в памяти системы и может передаваться между нею и пользователем.

Материальным носителем документа стала не только бумага, но и фотопленка, платежная карточка, магнитная лента, магнитный, и оптический диск.

Содержащиеся в документе сведения должны быть удобны для обработки в системах. Если они записываются в общепринятой форме, определяемой международными стандартами, то говорят, что создается открытый документ.

Документ характеризуется стилем, содержит текст, изображения, фрагменты звука, соотносится со временем его создания, имеет реквизиты- обязательно указываемые сведения. Например, адрес, наименование, ав­тор, подпись. Составляется документ на одном из естественных либо ис­кусственных языков.

Совокупность документов образует документацию. Последняя клас­сифицируется в соответствии с ее назначением. Поэтому, для одного и того же субъекта могут создаваться разные документы: банковские, сметные, технические, проектные, пользовательские. Развитие информационных систем и сетей привело к появлению электронных документов. Все болееважное значение получают так называемые составные электронные доку­менты. Они создаются пользователями из заранее подготовленных блоков данных (текстов, изображений, фрагментов речи) либо сообщений, полу­ченных по электронной почте, факсимильной связи.

Любые электронные документы должны создаваться в таком виде, чтобы они были понятны как пользователям, так и системам. Если они вначале составляются на бумаге, то предпочтительно применение машиночитаемых шрифтов. Из групп электронных документов формируются фай­лы. Последние хранятся в базах данных и знаний, а их поиск осуществля­ется информационными поисковыми системами. Из одной системы в другую электронные документы передаются в виде сообщений.

Обработка документов является процессом их создания и преобра­зования. Она заключается в классификации, сортировке, преобразовании в нужную форму, размещении в базах данных, поиске и выдаче пользовате­лям. Стремление к созданию независимой от конкретных пользователей обработки привело к появлению технологии обработки открытых докумен­тов. Она опирается на международные стандарты. При этом выделяют две наиболее широкие сферы применения обработки документов: издательская и учрежденческая. Издательская деятельность охватывает обработку пуб­ликаций (книг, журнальных статей, рекламных изданий и т.д.). Здесь глав­ным является взаимодействие между автором и издательством. Автор от­вечает за содержание произведения, оставляя издательству процесс его оформления.

Учрежденческая деятельность имеет дело с обработкой и передачей документов. Этот обмен осуществляется, в отличие от издательской дея­тельности, без предварительных договоренностей и ограничений по харак­теру их обработки. Вместе с этим необходимо, чтобы адресаты понимали получаемые документы.

При обработке документов необходимо решать большое число за­дач, к которым, в частности, относятся:

· подбор необходимых сведений и ввод их в систему;

· организация хранения документов;

· комплексное структурирование информации;

· включение в документ разнородной информации (текстов, изображений, фрагментов звуков);

· объединение фрагментов, подготовленных различными работниками;

· передача страниц документов между таблицами и базами данных;

· внесение изменений, редактирование и актуализация использованных документов;

· координация действий работников, участвующих в подготовке слож­ных документов;

· выбор шрифтов, форматов и форм представлений документов;

· рассылка и распечатка документов.

Для уменьшения объема необходимой памяти осуществляется сжатие хранимых документов. При этом объемы логической и физической памяти могут отличаться в несколько раз. Сжимаемые документы при их хранении записываются в наиболее медленно работающие (а поэтому – дешевые) запоминающие устройства. Чаще всего ими являются оптические диски или магнитные ленты. В результате реализации рассматриваемой технологии создаются электронные архивы документов. Специальные программы позволяют управлять структурой архивов, быстро находить и выдавать пользователям необходимые им документы.

Для этого любой документ, помещаемый в базу данных или знаний, должен иметь имя (условное обозначение). Оно может присваиваться до­кументу путем его индексирования – методики описания данных в базе с помощью указателей (индексов). Файл, обращение к содержимому которо­го происходит при помощи индексов, называют индексированным. Метод доступа к такому файлу именуется индексно-последовательным.

Процесс индексирования заключается в нахождении набора слов или кодов, служащих для идентификации документов и используемых для их поиска. Существует несколько методов индексирования. Статистический метод заключается в том, что из текста документа отбрасываются все незначащие слова, например: из, под, но. Затем подсчитывается час­тота употребления каждого оставшегося слова и учитывается отклонение частоты слов в документе от ожидаемой. В результате, создается поиско­вый образ документа. Он готовится специалистом либо прикладной про­граммой и от его качества зависит полнота поиска, т.е. процент найденных документов, содержащих искомые сведения. Используются три степени поиска: по заголовкам, рефератам, полным текстам.

Движение документов между сотрудниками организации и пред­приятия называют документооборотом. Ядром документооборота является (рис. 3.1. база данных. В ней собираются и из нее выдаются все документы. Управление базой осуществляется с помощью созданных для этого про­грамм. Редактирование документов, их индексирование, определение ги­пертекстовых ссылок осуществляется также путем взаимодействия с базой данных.

Структура документооборота

Документооборот определяет потоки электронных документов, необходимых в организации либо на предприятии для обеспечения эффективной координации и управления работой. Осуществляется документооборот с помощью системы, состоящей из комплекса прикладных программ. Последние обеспечивают запуск процессов, поиск документов, их анализ, классификацию, хранение и передачу в заданные информационные системы.

Для функционирования системы автоматизируемый процесс должен быть выделен из всей массы выполняемых на предприятии работ. Естественно, что этот процесс должен быть формализован и описан в виде алгоритма. В выделенном бизнес-процессе участвует группа сотрудников предприятия (организации). Поэтому, в нужных случаях, должны быть учтены вопросы синхронизации их деятельности.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: