Многомерные базы данных

Многомерные базы данных (Multi-value Database)

Многомерные базы данных — технология, которая длительное время воспринималась как новинка, — сегодня является решением, которое предлагает не только высокую производительность и простоту использования, но и обеспечивает возможности, необходимые для разработки, расширения и быстрого развертывания бизнес-приложений при сокращении ИТ-затрат. Системы на основе многомерных баз данных идеально подходят для потребностей как для рынков среднего и малого бизнеса (SMB), так и крупных предприятий.

Многомерные базы данных отличаются от реляционных прежде всего трехмерностью — поддержкой неограниченного числа значений в поле, и находят свое применение там, где необходима эффективная и простая работа с большими массивами символьной информации. В многомерных СУБД данные организованы в виде упорядоченных многомерных массивов, удовлетворяющих требованиям защиты от несанкционированного доступа в организации. Они обеспечивают более быструю реакцию на запросы данных за счет того, что обращения поступают к относительно небольшим блокам данных, необходимых для конкретной группы пользователей. Для достижения сравнимой производительности реляционные системы требуют тщательной проработки схемы базы данных, определения способов индексации и специальной настройки. Ограничения SQL остаются реальностью, что не позволяет реализовать в реляционных СУБД многие встроенные функции, легко обеспечиваемые в системах основанных на многомерном представлении данных.

Основные преимущества многомерных СУБД

· Общая простота системы, что позволяет осуществлять быстрое встраивание технологий многомерных СУБД в приложения. Системы на основе многомерных баз данных требуют меньше специальных навыков по разработке и администрированию;

· Относительно низкая общая стоимость владения, а также быстрый возврат инвестиций;

· В случае использования многомерных СУБД поиск и выборка данных осуществляется значительно быстрее, чем при многомерном концептуальном взгляде на реляционную базу данных, так как многомерная база данных обеспечивает оптимизированный доступ к запрашиваемым ячейкам;

· Многомерные СУБД легко справляются с задачами включения в информационную модель разнообразных встроенных функций, тогда как объективно существующие ограничения языка SQL делают выполнение этих задач на основе реляционных СУБД достаточно сложным, а иногда и невозможным.

Наиболее коммерчески успешными из известных программных продуктов, основанных на многомерных технологиях, являются СУБД UniVerse компании Rocket Software и СУБД jBASEодноименной компании jBASE International.

Специалисты компании ГазИнтех предлагают надежные и недорогие решения, которые позволяют перейти на использование современных открытых технологий. В том числе нами разработаны уникальные решения, позволяющие использовать преимущества стразу нескольких программных продуктов многомерных СУБД. Мы оказываем услуги по настройке, системной интеграции, администрированию и поддержке, а также разработке приложений различного масштаба на платформах многомерных СУБД UniVerse и jBASE.

9. Общая характеристика и виды документальных информационных систем

Напомним, что в фактографических информационных си­стемах единичным элементом данных, имеющим отдельное смысловое значение, является запись, образуемая конечной со­вокупностью полей-атрибутов. Иначе говоря, информация о предметной области представлена набором одного или несколь­ких типов структурированных на отдельные поля записей.

В отличие от фактографических информационных систем, единичным элементом данных в документальных информа­ционных системах является неструктурированный на более мелкие элементы документ. В качестве неструктурированных документов в подавляющем большинстве случаев выступают, прежде всего, текстовые документы, представленные в виде текстовых файлов, хотя к классу неструктурированных доку­ментированных данных могут также относиться звуковые и графические файлы.

Основной задачей документальных информационных сис­тем является накопление и предоставление пользователю до­кументов, содержание, тематика, реквизиты и т. п. которых адекватны его информационным потребностям. Поэтому мож­но дать следующее определение документальной информаци­онной системы — единое хранилище документов с инстру­ментарием поиска и отбора необходимых документов. По­исковый характер документальных информационных систем исторически определил еще одно их название — информаци­онно-поисковые системы (ИПС), хотя этот термин не совсем полно отражает специфику документальных ИС.* Соответ­ствие найденных документов информационным потребностям пользователя называется пертинентностью. В силу теоретических и практических сложностей с формализацией смысло­вого содержания документов пертинентность относится скорее к качественным понятиям, хотя, как будет рассмотрено ниже, может выражаться определенными количественными показа­телями.

* Поиск информации (данных) осуществляется и в фактографических ИС. Таким образом термин ИПС определяет функциональное назначение ИС, но не отражает спе­цифики представления и обработки данных. Специфика документальных ИПС заключается в том, что они удовлетворяют информационные потребности пользователя, пре­доставляя ему документы, в которых содержится интересующая пользователя инфор­мация.

В зависимости от особенностей реализации хранилища до­кументов и механизмов поиска документальные ИПС можно разделить на две группы:

• системы на основе индексирования;

• семантически-навигационные системы.

В семантически-навигационных системах документы, помещаемые в хранилище (в базу) документов, оснащаются специальными навигационными конструкциями, соответству­ющими смысловым связям (отсылкам) между различными до­кументами или отдельными фрагментами одного документа. Такие конструкции реализуют некоторую семантическую* (смысловую) сеть в базе документов. Способ и механизм выра­жения информационных потребностей в подобных системах заключаются в явной навигации пользователя по смысловым отсылкам между документами. В настоящее время такой под­ход реализуется в гипертекстовых ИПС.

* Семантика (от греч. «semantikos»—обозначающий)—смысловая сторона языка, отдельных слов и частей слова, а также— раздел языкознания, изучающий значения слов.

В системах на основе индексирования исходные докумен­ты помещаются в базу без какого-либо дополнительного пре­образования,* но при этом смысловое содержание каждого до­кумента отображается в некоторое поисковое пространство. Процесс отображения документа в поисковое пространство на­зывается индексированием и заключается в присвоении каж­дому документу некоторого индекса-координаты в поисковом пространстве. Формализованное представление (описание) ин­декса документа называется поисковым образом документа (ПОД). Пользователь выражает свои информационные потреб­ности средствами и языком поискового пространства, форми­руя поисковый образ запроса (ПОЗ) к базе документов. Система на основе определенных критериев и способов ищет доку­менты, поисковые образы которых соответствуют или близки поисковым образам запроса пользователя, и выдает соответству­ющие документы. Соответствие найденных документов запро­су пользователя называется релевантностью.** Схематично об­щий принцип устройства и функционирования документаль­ных ИПС на основе индексирования иллюстрируется на рис. 6.1.

* За исключением возможного сжатия (архивирования).

** На практике термин релевантность часто отождествляют с термином пертинентность, хотя в строгом отношении они различны.

Рис. 6.1. Общий принцип устройства и функционирования до­кументальных ИПС на основе индексирования

Особенностью документальных ИПС является также то, что в их функции, как правило, включаются и задачи информаци­онного оповещения пользователей по всем новым поступаю­щим в систему документам, соответствующим заранее опреде­ленным информационным потребностям пользователя.* Прин­цип решения задач информационного оповещения в документальных ИПС на основе индексирования аналогичен принципу решения задач поиска документов по запросам и ос­нован на отображении в поисковое пространство информа­ционных потребностей пользователя в виде так называемых поисковых профилей пользователей (ППП). Информационно-поисковая система по мере поступления и индексирования но­вых документов сравнивает их образы с поисковыми профиля­ми пользователей и принимает решение о соответствующем опо­вещении. Принцип решения задач информационного оповеще­ния схематично иллюстрируется на рис. 6.2.

* Задачи информационного оповещения основаны на идеологии т.н. избиратель­ного распространения информации (ИРИ), наработанной в библиотечном деле.

Рис. 6.2. Принцип решения задач информационного оповещения в документальных ИПС на основе индексирования

Поисковое пространство, отображающее поисковые образы документов и реализующее механизмы информационного поиска документов так же, как и в СУБД фактографических систем, стро­ится на основе языков документальных баз данных, называемых информационно-поисковыми языками (ИПЯ). Информационно-поисковый язык представляет собой некоторую формализован­ную семантическую систему, предназначенную для выражения содержания документа и запросов по поиску необходимых доку­ментов. По аналогии с языками баз данных фактографических систем ИПЯ можно разделить на структурную и манипуляционную составляющие.

Структурная составляющая ИПЯ (поискового пространства) документальных ИПС на основе индексирования реализуется индексными указателями в форме информационно-поисковых ка­талогов, тезаурусов и генеральных указателей.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: