Язык разметки XML
Языки разметки
Размеченный текст позволяет легко анализировать и обрабатывать текст. Он включает:
· текст, несущий смысловую информацию (infoset);
· разметку (markup), указывающую структуру текста.
Язык разметки предназначен для того, чтобы отразить данную структуру текста (т.е. определить значение участков текста).
XML – наиболее распространенный язык разметки. Это универсальный язык для представления определенной структуры информации. Самое главное преимущество языка XML в том, что синтаксис и семантика используются основными производителями техники и компьютеров в том числе, что обеспечивает интероперабельность (умение работать вместе).
· Любой текст начинается с заголовка.
· Разметка в языке XML заключается в использовании так называемых "тэгов" (≈ярлыков). Тэг – это специальная легко узнаваемая последовательность символов, заключенная между знаками < и >. Тэги аналогичны скобкам. Тэги с разными именами (любой произвольной длины) отражают разные типы скобок.
|
|
Именованные тэги:
· открывающий <TAG>
· закрывающий </TAG>
· пустой <TAG/>
Свойства XML:
· каждому открывающему тэгу должен быть сопоставлен закрывающий тэг;
· участки текста, ограниченные разными тэгами, не должны перекрываться: ([ ]) – правильно, ([) ] – неправильно;
Исключение из правил составляет пустой тэг: он не требует закрывающего тэга. Пустой тэг (сокращенная запись тэгов без содержимого) эквивалентен открывающему тэгу, сразу за которым идет закрывающий тэг: <t/> ≡ <t> </t>
Помимо имени в состав тэгов могут входить дополнительные параметры, которые задаются атрибутами, находящимися сразу после имени тэга перед знаком >.
< | < |
> | > |
" | " |
& | & |
С помощью символа & внутри тэга можно задать специальные символы. Например, последовательность < эквивалентна значению знака <. В незакодированном виде символ < будет восприниматься как начало тэга.
Текст на языке XML помимо заголовка содержит только один тэг.
|