T-Media: от музейной библиотеки к информационной среде для интеграции музейных ресурсов и сервисов

1. Введение. Важным этапом в деле интеграции музейных ресурсов и развития связанных с этим сервисов было бы создание информационной среды, позволяющей эффективно работать как с текстовой информацией (ее типичными представителями являются полнотекстовые ресурсы музейных библиотек и каталоги-описания музейных фондов), так и с нетекстовой, прежде всего графической, которая представлена цифровыми образами (копиями) экспонатов, составляющих главное содержание систем учета музейных фондов.

К такого рода интеграции можно идти разными путями, причем как с точки зрения методологии, так и с точки зрения технологии.

В докладе рассматривается один из подходов к решению этой задачи, методологически основанный на теории мультимодальных культурных концептов и ее применению к созданию систем интеллектуального информационного поиска [1], а технологически – на развитии электронной библиотеки T-Libra с гибким полнотекстовым поиском, созданной в архитектуре Web-browser / Web-server / SQL-server (разработка ООО «Константа» и НП «Центроконцепт», г. Архангельск) [2], в направлении ее мультимодального и функционального расширения [3].

2. Музейная библиотека: новое реноме. Кроме прочего, этот подход предполагает переосмысление места и роли музейной библиотеки, вообще использования «текста» в общемузейном деле.

В традиционной музейной деятельности, где главными фигурами выступают Хранитель и Экскурсовод, «текст» играет второстепенную роль: он нужен лишь в качестве вспомогательного материала для подготовки экспозиций и экскурсий.

Характерно, однако, что даже в рамках традиционных музейных технологий его роль заметно возрастает при подготовке научных и методических публикаций, музейно-образовательных программ, а также презентационных материалов – то есть тогда, когда музей обращается к более широкой аудитории, находящейся за его стенами. 

Создание в музее современной интегрированной информационной среды заставляет нас по-новому взглянуть на место и роль текстовой информации, имеющей прямое или косвенное (общекультурное) отношение к музейному «контенту».

Во-первых, в самом тексте (представленном, например, в фондах музейных библиотек) содержится разносторонняя информация о различных культурно-исторических феноменах, так или иначе связанных с музейными предметами; эту информацию можно извлекать, различным образом структурировать и тематизировать с помощью современных информационных систем. 

Во-вторых, текстовая информация – это метаданные, это библиографические, иконографические и другие описания музейных предметов; в этом качестве «текст» является связующим звеном между всеми видами информации, представленными в интегрированной информационной среде.

В-третьих, взаимодействие «текста» и нетекстовой информации (графика, звук, видео и т.п.) крайне важно для создания полноценных виртуальных тематических экспозиций, ориентированных на сферы образования, науки, культурного туризма, досуга, и тем самым на продвижение новых интеллектуальных продуктов и сервисов на рынок.

Таким образом, музейная библиотека – естественная среда обитания текстовых ресурсов – вполне может изменить свой статус, и из вспомогательной музейной службы превратиться в точку опоры для создания качественно новой информационной инфраструктуры музея, вплоть до развертывания на ее основе публичного музейного информационного центра [4] с предоставлением многофункционального доступа к музейным ресурсам и сервисам (включая принципиально новые ресурсы и сервисы, создаваемые, например, в рамках развития виртуального музея или дистанционных музейно-образовательных программ). 

Заметим в этой связи, что по своему назначению музейная библиотека многофункциональна даже в большей мере, чем ее более известные родственники: публичные, университетские и академические библиотеки. Причина, разумеется, в наличии собственно музея, в тесной содержательной связи ресурсов музейной библиотеки («текстов») с основными ресурсами музея («экспонатами»). К научной, образовательной, просветительской функциям обычных библиотек здесь добавляется еще и функция информационного обеспечения экспозиционно-выставочной деятельности.

Поэтому желательно, чтобы электронная библиотека для музея предусматривала, как минимум, две вещи.

Во-первых, гибкий и удобный инструментарий для работы с библиографическими и полнотекстовыми ресурсами, в том числе для тематизируемого полнотекстового поиска и презентации его результатов с точностью до отдельного предложения или авторского абзаца (общее требование к любой полноценной библиотечной системе).

Во-вторых, такой инструментарий, который открывает возможность мультимодального расширения библиотеки, то есть включения в ее ресурсную базу нетекстовых модальностей информации (графика, звук, видео и т.д.), а в ее функционал – унифицированного поиска по гетерогенным базам данных с последующим автоматизированным созданием на его основе различных тематических экспозиций (специальное требование для музейной библиотеки).

3. T-Libra как основа для T-Media. Этими возможностями обладает многофункциональная электронная библиотека T-Libra, созданная в архитектуре «клиент-сервер», адаптированной к условиям Интернет (Web-browser / Web-server / SQL-server), и работающая под управлением СУБД Sybase ASA v.7.0.

Версии ЭБ T-Libra 5.0. и 5.1. с 2003 года используются в Институте управления (г. Архангельск) и в его филиалах в рамках как аудиторной, так и дистанционной технологий обучения.

В настоящее время на платформе T-Libra ведется разработка нескольких специализированных региональных библиотек (для медицины, экологии, культуры), виртуальной Интернет-лаборатории гуманитарной направленности [5], корпоративной библиотеки НП «Центроконцепт», музейной библиотеки ГМО «Художественная культура Русского Севера», а также образовательных серверов для поддержки дополнительного и профессионального образования.

При этом архитектура создаваемых библиотек проектируется с использованием различных вариантов СУБД (Sybase ASA, MS SQL Server, Oracle SQL Server, MySQL) и двух вариантов бизнес-логики приложений (внутренней логики, существенно использующей особенности этих СУБД и реализуемой на языке SQL, и внешней логики, встроенной в СGI-расширение Веб-сервера и реализуемой на объектно-ориентированном языке C++).

Это делает возможным использование информационной системы  в самых разных по масштабу и технологическому оснащению организациях: от национальных и университетских библиотек, имеющих возможность содержать и профессионально сопровождать мощные коммерческие СУБД и ориентированных (в перспективе) на тера- и петабайтовые объемы хранимой информации, до районных, школьных и персональных библиотек, ориентированных на бесплатно распространяемые СУБД (типа MySQL) и объемы первичной электронной информации от нескольких сотен до нескольких тысяч полнотекстовых «единиц хранения» (от нескольких десятков до нескольких сотен гигабайт в формате SQL-базы данных).   

В варианте ЭБ T-Libra v.5.2. имеются следующие основные функциональные разделы.

Административный раздел включает в себя набор программных средств, позволяющий: а) регистрировать и вести учет пользователей; б) обеспечивать защиту информационной системы от копирования и несанкционированного доступа; в) устанавливать и гибко изменять правила допуска различных групп пользователей к различным ресурсам электронной библиотеки. Он дает также необходимые инструменты администратору и операторам системы для ее сопровождения и развития, в том числе модуль импорта новых текстов в SQL-базу данных и программу ParaGen для автоматического генерирования (русскоязычной) лексико-грамматической парадигматики и пополнения электронного словаря.

Пользовательский раздел включает в себя три функциональные подсистемы, предназначенные для эффективного поиска и презентации информации: Каталог, Депозитарий, Полнотекстовый поиск.

Каталог. Подсистема предназначена для поиска по библиографической информации, организованной в виде SQL-базы данных, и последующей презентации в среде Веб-браузера всех ресурсов, имеющихся в электронной библиотеке.

БД подсистемы “Каталог” пополняется с помощью программ импорта из любых электронных каталогов, поддерживающих стандарты семейства MARC, или из библиографических файлов-описаний, создаваемых пользователем. Подсистема может быть дополнена программами автоматизированного создания библиографических файлов на основе информации, взятой из внешних электронных ресурсов.

Поиск по SQL-базе данных “Каталог” осуществляется с учетом лексико-грамматической парадигматики естественного языка по 8-ми полям: “Автор”, “Заглавие”, “Ключевые слова”, “Аннотация”, “Год издания”, “Предметная область”, “Библиотечные фонды”, “Носитель информации”.

Имеется полная и краткая форма поиска (в последней поля “Заглавие”, “Ключевые слова”, “Аннотация” объединены логическим сложением).

Булева алгебра (операции логического сложения, умножения, отрицания) включена в функционал соответствующих полей и структуру формы поиска.

Поле “Предметная область” фактически представляет собой «каталог в каталоге» – настраиваемый мультирубрикатор, включающий в себя набор стандартных классификаторов (ББК, УДК, ГРНТИ, ВАК), а также рубрикатор “Депозитарий”, создаваемый с учетом интересов конкретного корпоративного пользователя.

Депозитарий. Подсистема содержит файловые ресурсы различного формата (*.pdf, *.doc, *.txt, *.html и т.д.), соотнесённые с теми или иными предметными областями (учебными дисциплинами; научными направлениями; тематикой мероприятий; каталогами выставок и т.д.). Она имеет собственный рубрикатор ресурсов, с помощью специализированного интерфейса настраивается на интересы корпоративного пользователя и позволяет несколькими нажатиями на интерфейсные кнопки получить сначала описания ресурсов (метаданные), а затем и сами электронные ресурсы: полные тексты (учебников, учебных пособий, справочников, монографий и т.п.), графические документы, аудио-, видео-файлы и т.д.

Полнотекстовый поиск и его функциональные возможности.

Специализированная подсистема «Полнотекстовый поиск» организована как совокупность гибких параметризируемых запросов к полнотекстовой SQL-базе данных. Подсистема ориентирована на компьютерную поддержку тех видов деятельности пользователя, в основе которой лежит многоплановая работа с текстом первоисточника.

Все реализованные в T-Libra v.5.2. запросы предназначены для экспликации терминологических полей разного типа, вида и уровня.

Термины выступают здесь в роли своеобразных смысловых «зарядов», а их различным образом упорядоченные совокупности репрезентируют смысловые поля, в явном или чаще неявном виде содержащиеся в первичном тексте.

В архитектуре подсистемы предусмотрены: а) блок электронных словарей с программой автоматической генерации лексико-грамматических парадигм естественного языка (в версии 5.2. имеется около 1 млн. словоформ русского языка); б) блок гибких параметризируемых поисковых запросов (в версии 5.2. представлены 2 типа и 6 видов таких запросов); в) блок функциональных моделей смыслового (концепт-ориентированного) поиска (в версии 5.2. не представлен).

Методологически и технически в системе запросов выделяются: а) единицы поиска (в зависимости от вида запроса это могут быть термины, цепочки терминов, многослойные терминологические структуры и т.д.), б) единицы результатов поиска (произвольный абзац, частотно-ранжированная совокупность терминов и т.д.), в) единицы представления результатов поиска (авторский абзац, таблица частотно-ранжированных терминов и т.д.).

Для каждого из запросов имеется возможность формировать «корзину ресурсов», то есть область определения запроса, в пределах которой он выполняется.

В версии 5.2. реализованы 2 типа запросов: «Абзацно-ориентированный поиск» и «Частотно-ориентированный поиск», каждый из которых представлен тремя видами. Первый тип запросов ориентирован на экспликацию линейно упорядоченных терминологических полей в пределах естественной смысловой единицы текста – авторского абзаца. Второй тип – на частотный анализ текста и построение частотно-ранжированных таблиц терминов, «терминограмм» произведения или совокупности произведений.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: