Элементы разметки документа

Язык HTML описывает документ как совокупность контейнеров, каждый из которых имеет свое начало и конец, обозначенные указателями разметки – тегами. Текст тега заключается в угловые скобки («<» и «>»). HTML-тег, определяющий начало контейнера (старт-тег – start tags), состоит из имени, за которым может следовать (а может и не следовать) список атрибутов тега. В стандарте HTML имя тега и имена атрибутов не чувствительны к регистру, в XHTML всё нужно записывать только строчными буквами. Имя тега всегда имеет семантический контекст. Например, теги <HTML> и <html> определяют в стандарте HTML одно и тоже – начало HTML-документа. HTML-тег, определяющий конец контейнера (стоп-тег – stop tags), имеет имя, идентичное имени старт-тега. Отличия состоят в том, что перед именем стоп-тега ставится косая черта (/), и стоп-тег не имеет атрибутов. Например, тег </HTML> определяет конец HTML-документа. Интерпретаторы языка HTML – браузеры – допускают, в некоторых случаях, отсутствие в контейнерах конечного тега, в этом случае начальный тег контейнера воспринимается также как конечный тег предыдущего. Ярким примером этого может служить тег абзаца <P>. Когда один абзац заканчивается, следующий тег <P> сигнализирует браузеру о том, что нужно завершить данный абзац и начать следующий. В XHTML стоп-тег обязателен.

Атрибуты в тегах характеризуются значениями, которые определяют функции тега. Синтаксис записи имеет форму: атрибут = "атрибут". Значение атрибута в одно слово можно не заключать в кавычки. Если значение атрибута булево, то HTML допускает минимизацию: наличие ключевого слова с названием атрибута в записи тега означает "да", а отсутствие – "нет". Множество атрибутов тега формирует список. Элементы этого списка отделяются друг от друга знаками табуляции или пробела или символами возврата к началу строки. Например, Консорциума W3C рекомендует указывать язык содержимого веб-страниц, используя в теге <html> атрибут lang. Это может быть записано следующим образом для белорусского языка <html lang="be">.

Замечание. Буквенный код того или иного языка для атрибута lang приводится в соответствии со стандартом ISO 639. Подробную информацию можно получить по URL: http://www.w3.org/WAI/ER/IG/ert/iso639.htm.

Подведя итог сказанному, приведем общую схему построения контейнера в формате HTML:

<"имя тега" "список атрибутов"> "содержание контейнера" </"имя тега">.

Отметим также, что в языке HTML в качестве элементов разметки используются теги, которые не требуют конечного компонента, это так называемые автономные элементы разметки. Примером может служить тег <IMG>, который служит для вставки в документ графического изображения. В XHTML для описания подобных элементов разметки вместо записи <тег> … </тег> принято использовать сокращенную форму <тег />.

Ещё элементами разметки являются специальные символы CER (Character Entity Reference). Их используют, когда в теле документа употребляются символы разметки, но не в угоду гипертекста. CER-символы фактически являются лексемами языка. Синтаксис их записи содержит две формы. В первой форме записи CER-символ обозначается идентификатором из строчных латинских букв c префиксом из символа амперсанд (&). Во второй форме используется числовой код, записанный арабскими цифрами, числовому коду предшествует префикс (&#). CER-символ всегда заканчивается символом точка с запятой (;). Полный список CER-символов дан в специальных справочных таблицах.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: