URI и URL

Каждый ресурс в Web - документ HTML, изображение, программа и т.д. - имеет адрес, который может быть закодирован с помощью URI (Universal Resource Identifier) - универсального идентификатор ресурса.

Примечание: более распространенной является аббревиатура "URL" (Uniform Resource Locator). Следует отметить, что URL образуют подмножество более общей схемы наименования URI, но в дальнейшем будем использовать аббревиатуру URL.

HTML использует URL (Uniform Resource Locator) для представления гипертекстовых ссылок и ссылок на сетевые сервисы внутри HTML-документа.

URL состоит из нескольких частей:

method://machine-name/path/page.html

Первая часть URL (до двоеточия) описывает метод доступа или сетевой сервис (протокол). Другая часть URL (после двоеточия) интерпретируется в зависимости от метода доступа. Обычно, два прямых слеша после двоеточия обозначают имя машины (сервера):

Следующий пример представляет собой вызов HTML-документа index.html с сервера www.is.sevntu.sebastopol.ua с использованием HTTP протокола:

http :// www . is . sevntu . sebastopol . ua / index . html

Полный формат URL представлен ниже:

METHOD://SERVERNAME:PORT/PATHNAME#ANCHOR

Опишем каждый из компонентов URL.

METHOD определяет тип операцию, которая будет выполняться при интерпретации данного URL. Наиболее часто используемые методы:

· file - чтение файла с локального диска. Имя файла интерпретируется для локальной машины пользователя. Данный метод используется для отображения какого-либо файла, находящегося на машине пользователя. Например: file:/home/alex/index.html - отображает файл index.html из каталога /home/alex на пользовательской машине;

· http - доступ к WEB-странице в сети с использованием HTTP-протокола. (Это наиболее часто используемый метод доступа к какому-либо HTML-документу в сети);

· ftp - запрос файла с анонимного FTP-сервера. Например: ftp://hostname/directory/filename;

· mailto - активизирует почтовую сессию с указанным пользователем и хостом. Например: mailto: webmaster@is.sevntu.sebastopol.ua - активизирует сессию посылки сообщения пользователю webmaster на машине is.sevntu.sebastopol.ua, если браузер поддерживает запуск электронной почты. Заметьте, что метод mailto: не требует указание слешей после двоеточия (как правило, после двоеточия сразу идет электронный адрес абонента)

· telnet: обращение к службе telnet;

· news: вызов службы новостей, если браузер ее поддерживает. Например: news:relcom.www.support;

SERVERNAME - необязательный параметр, описывающий полное сетевое имя машины. Если имя сервера не указано, то ссылка считается локальной, и полный путь, указанный далее в URL вычисляется на той машине, с которой взят HTML-документ, содержащий данную ссылку. Следует отметить, что вместо символьного имени машины может быть использован IP-адрес.

PORT - номер порта TCP на котором функционирует WEB-сервер. Если порт не указан, то "по умолчанию" используется порт 80. Данный параметр (port) не используется в подавляющем большинстве URL.

PATHNAME - частичный или полный путь к документу, который должен вызваться в результате интерпретации URL. Различные WEB-сервера сконфигурированы по разному для интерпретации пути доступа к документу. Например, при использовании CGI скриптов (исполняемых программ), они обычно собираются в одном или нескольких выделенных каталогах, путь к которым записан в специальных параметрах WEB-сервера. Для данных каталогов WEB-сервером выделяется специальный логический путь, который и используется в URL. Если WEB-сервер видит данный путь, то запрашиваемый файл интерпретируется как исполняемый модуль. В противном случае, запрашиваемый файл интерпретируется просто как файл данных, даже если он является исполняемым модулем.

Следует отметить, что при описании пути используется UNIX-подобный синтаксис, где, в отличии от DOS и Windows используются прямые слеши вместо обратных. Если после сетевого имени машины сразу идет имя документа, то он должен находиться в корневом каталоге на удаленной машине или (как правило) в каталоге, выделенном WEB-сервером в качестве корневого. Если же URL заканчивается сетевым именем машины, то в качестве документа запрашивается документ из корневого каталога удаленной машины с именем, установленным в настройках WEB-сервера (как правило, это index.html).

#ANCHOR - д анный элемент является ссылкой на строку (точку) внутри HTML-документа. Большинство браузеров, встречая после имени документа данный элемент, размещают документ на экране таким образом, что указанная строка документа помещается в верхнюю строку рабочего окна браузера. Точки, на которые ссылается #anchor, указываются в документе при помощи тега NAME, как это будет описано далее.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: