Структура RDF-моделей

В основе графовых моделей данных, используемых для организации RDF-представлений, лежит структура (тройка, триплет), состоящая из трех элементов – субъекта, предиката и объекта. Т. е. всякое RDF-описание строится как описание некоторого отношения (предиката), связывающего субъект с объектом. При этом субъект и объект ассоциируются с узлами графа, а предикат (также называемый свойством триплета) – с дугой, соединяющей эти узлы и имеющей направление от субъекта к объекту (рис. 3.1).

При вербальном описании триплета, представленного на рис. 3.1, принято говорить, что сущность «субъект» имеет свойство «предикат», значение (или величина) которого определяется «объектом». С точки зрения формальной логики каждый такой триплет является отображением некоторого утверждения. Соответственно, единая модель RDF-текста представляет собой множество утверждений, каждому из которых соответствует свой триплет в RDF-графе, а логическая интерпретация этой модели означает конъюнкцию (логическое «И») всех представленных в графе утверждений.

 
 


Рис. 3.1. Структура триплета RDF-графа

Каждый узел и дуга RDF-графа именуются. Именем может являться либо URI, либо литерал (строка в стандартной кодировке Unicode). Литералы в свою очередь могут быть либо простыми (plain literal), либо типизированными (typed literal). Помимо информационной части (называемой в документации «лексической формой») простой литерал содержит необязательный тэг национального языка, а типизированный литерал – обязательный URI, определяющий тип данных. В упрощенном виде URI в RDF-графе могут рассматриваться как описания типов данных и переменных, а литералы – как значения переменных (константы). Даже если литерал содержит URI, обработчик RDF-текста (RDF-процессор) не интерпретирует его как инструкцию активации некоторого ресурса, т. е. литерал является описательной константой.

Рассмотрим основные выразительные средства RDF на примерах. На рис. 3.2 представлен граф, отображающий следующее утверждение: «Существует человек (Person) Алексей Иванов, информация о котором хранится по адресу https://www.etu.ru/people/contact#me, имеющий адрес электронной почты ivanov@etu.ru и степень доктора наук».

Из рис. 3.2 видно, что RDF позволяет оперировать со следующими базовыми видами сущностей:

- индивидуумы (например, Алексей Иванов, имеющий идентификатор https://www.etu.ru/people/AI/contact#me) – т. е. некоторые идентифицируемые ресурсы, предметы, сущности (субъекты или объекты);

- виды (или типы) предметов (например, «Person»);

- свойства предметов (например, адрес e-mail Иванова);

- значения свойств предметов (например, «Alexey Ivanov» или «Dr.»).

Здесь и далее на рисунках литералы (т.е. значения свойств) размещаются в прямоугольниках, свойства (предикаты) – рядом с соответствующими дугами, а задаваемые через URI сущности и их виды – в овалах.


Рис. 3.2. Пример RDF-графа

Важным отличием RDF от обычных нотаций XML является использование для идентификации ресурсов так называемых квалифицированных URI, которые могут содержать дополнительный фрагмент идентификатора, отделяемый символом «#» и несущий основную смысловую нагрузку при расширенном описании сущностей и отношений между ними. Этот дополнительный фрагмент (в дальнейшем для краткости будем использовать для него термин «квалификатор»; в англоязычной литературе по RDF принят термин «fragment identifier» – «идентификатор фрагмента») представляет собой фактически возвращаемое значение какого-либо свойства данных, являющееся результатом некоторой поисковой операции (причем синтаксически допускается последовательное определение нескольких квалификаторов). Соответственно, включение квалификаторов в описания узлов и дуг RDF-графа может быть аналогично определению процедур обработки информации, результаты которых и являются объектом непосредственного представления данных при интерпретации RDF-текстов. Для прямого указания на расширенный синтаксис описания URI в документации на RDF используется термин URI-ссылка (URIref).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: