Тема 1.8.2. Преобразование электронного образца документа в текстовый документ в базу данных

Существует бездна определений электронного документа. Вот, например, как выглядит одно из них, взятое из стандартов в области офисных систем:

«Документ — совокупность данных в памяти вычислительной системы, предназначенная для восприятия человеком с помощью соответствующих программных и аппаратных средств. Электронный документ может включать текстовую, графическую и звуковую информацию, иметь нелинейную структуру; различные пользователи могут просматривать его в различной форме и изменять его».

 

Недостаток этого определения, в частности, в том, что все сказанное в нем про документ в равной степени можно отнести и к базам данных, и к системам мультимедиа.

Классическое соотношение документов и баз данных состоит в том, что БД загружается по многим входным формам и просматривается по выходным формам, которые в теории БД называются взглядами пользователя — user view. Любопытно, что если ввести понятие двойственности структур БД и документа, то можно доказать, что по структуре документа можно построить структуру БД и наоборот. Другими словами, с точки зрения структурной сложности документ и БД тождественны.

В начале 1980-х годов мы исследовали более 1000 применений СУБД ИНЕС. В результате входных форм документов в среднем оказалось девять, выходных — 16. Были реализации как с одной входной формой, так и более чем со 100, при этом число выходных форм приближалось к 300.

В системе МАГИС была использована автоматическая генерация минимальной схемы объектно-ориентированной базы данных (ООБД) на основе набора входных форм, а также загрузка ООБД по документам соответствующих форм. Такой подход оказался технологичным при создании плотных систем, систем со сложными структурами данных и систем с динамически изменяемыми схемами БД. Подобная техника прижилась в музеях, в научных учреждениях для проведения исследований по истории, системному анализу и др.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: