Спецификация универсального адреса информационного ресурса в Интернет

Широкое использование компьютерных сетей неспециалистами на сегодня стало возможно благодаря разработке простых в примене­нии средств доступа к многообразным ресурсам Интернет. В первую очередь это относится к появлению специальных программ–клиентов WWW, называемых браузерами, обладающих «дружественным» гра­фическим интерфейсом (т.е. способом взаимодействия пользователя с программой).

Схема адресации в иерархически организованной файловой сис­теме, харак­терной для таких популярных операционных систем, как DOS и Unix, позволяет однозначно идентифицировать заданный файл путем указания его времени и уникального адресного пути к нему.

Пример.

В DOS C:\DOS\PROGR\FILE1.TXT (Запись с именем filel.txt расположена в корне на диске

С, в директории DOS, поддиректории PROGR)

В Unix /users/data/Letters.html (Запись с именем Letters.html расположена в корне,

в директории users, поддиректории data)

Важная для избежания ошибок при организации доступа к файлам разница в этих схемах состоит в использовании разных слэшей – прямо­го (/) в Unix и об­ратного (\) в DOS, а также чувствительность к верхне­му и нижнему регистру, свой­ственная только Unix. За основу схемы адресации ресурсов в Сети принята нота­ция Unix, которая претерпела естественные расширения за счет приписывания к существующей схе­ме слева – имени протокола доступа к заданному ресурсу, где распо­ложен ресурс; а справа – после служебных символов (#,?) имени мет­ки внутри файла или элементов поискового ресурса. В примерах

http://www.citmgu.ru/users/data/Letters.htm#Markl

http://www.citmgu.ru/cgi–bin/proc?corn

содержится обращение по протоколу http к компьютеру с доменным именем www.citmgu.ru с попыткой доступа в первом случав к области файла Letters.html с меткой Markl, а во втором –реализация поиско­вого запроса к программе ргос с термином для поиска «corn» на том же сервере.

Отметим, что именно в таком виде и вводятся строки запроса на ресурсе в специально отведенном поле браузера, после чего нажати­ем клавиши Enter ини­циируется соединение и загрузка.

Итак, в основу построения адреса ресурса в Сети оказались заложены сле­дующие понятия и принципы:

Расширяемость – новые адресные схемы должны были легко вписываться в существующий синтаксис URI (Uniform Resource Iden­tifier –универсальный индикатор ресурса).

Полнота – по возможности, любая из существующих схем должна описы­ваться посредством URI.

Читаемость – адрес должен быть легко читаем человеком, что вообще ха­рактерно для технологии WWW.

Расширяемость была достигнута за счет выбора определенного порядка ин­терпретации адресов, который базируется на понятии «адресная схема». Иденти­фикатор схемы стоит перед остатком адре­са, отделен от него двоеточием и опре­деляет порядок интерпретации остатка.

Полнота и читаемость порождали коллизию, связанную с тем, что в некото­рых схемах используется двоичная информация. Эта про­блема была решена за счет формы предоставления такой информа­ции. Символы, которые несут слу­жебные функции, и двоичные дан­ные отображаются в URI в шестнадцатеричном коде и предваряются символом «%».

Прежде, чем рассмотреть различные схемы представления адре­сов, приве­дем еще один пример простого адреса URI:

http://polyn.net.kiae.ru/polyn/index.html

Перед двоеточием стоит идентификатор схемы адреса – «http». Это имя отделено двоеточием от остатка URI, который называется «путем». В данном слу­чае путь состоит из доменного адреса машины, на которой установлен сервер HTTP, и пути от корня дерева сервера к файлу «index.html».

Кроме представленной выше полной записи URI существует уп­рощенная. Она предполагает, что к моменту ее использования многие параметры адреса ре­сурса уже определены (протокол, адрес машины в Сети, некоторые элементы пути).

При таких предположениях автор гипертекстовых страниц может указывать только относительный адрес ресурса, т.е. адрес относи­тельно определенных базо­вых ресурсов.

Схемы адресации ресурсов Интернет. В RFC–1630 (Request for Comment – документы с таким названием содержат в себе материа­лы по Интернет–техно­логии, которые доведены до уровня стандарта или близки к этому уровню) рас­смотрено восемь схем адресации Ин­тернет для каждого из ресурсов.

Схема HTTP. Это основная схема для WWW. В схеме указы­ваются ее иден­тификатор, адрес машины, TCR–порт, путь в директо­рии сервера, поисковый кри­терий и метка.

Следует отличать понятие TCR–порта от физического разъема на задней стенке системного блока компьютера. В Интернет принято идентифицировать конкретную прикладную программу с определен­ным числом, или портом (это по­нятие абсолютно не связано с назва­нием физического устройства ввода–вывода компьютера). Всякий раз передаваемый по сети от одного компьютера к другому пакет данных содержит информацию о том, какой именно протокол используется и с какой прикладной про­граммой машины пытается установить связь. Номер порта и обозначает эту при­кладную программу.

Приведем несколько примеров URI для схемы HTTP:

http://polyn.net.kiae.ru/polyn/manifest.html

Это наиболее распространенный вид URI, применяемый в доку­ментах WWW. Вслед за именем схемы (http) следует путь, состоящий из доменного ад­реса машины и полного адреса HTML–документа в дереве сервера HTTP.

В качестве адреса машины допустимо использование и IP– адреса:

http://144.206.160.40/risk/risk.html

При указании адреса ресурса возможна ссылка на точку внутри файла HTML. Для этого вслед за его именем может быть указана метка внутри доку­мента:

http://polyn.het.kiae.ru/altai/volume4.html#first

Символ # отделяет имя документа от имени метки.

Другая возмож­ность схемы HTTP – дача параметров. Первоначально предполага­лось, что в качестве параметров будут передаваться ключевые слова, но по мере развития механизма сервисных программ (скриптов) в каче­стве параметров стала передаваться и дру­гая информация.

http://polyn.net.kiae.ru/isindex.html?keyword1+keyword2

В данном примере предполагается, что документ «isindex.html» – документ с возможностью поиска по ключевым словам. При этом в зависимости от поиско­вой машины (программы, реализующей поиск) знак «+» будет интерпретиро­ваться либо как «AND», либо как «OR». Вообще говоря, «+» заменяет «» (пробел) и относится к классу неото­бражаемых символов.

Схема MAILTO. Данная схема предназначена для отправки почты но стан­дарту RFC–822 (стандарт почтового сообщения). Об­щий вид схемы выглядит так:

mailto:paul@quest.polyn.kiae.ru

Из приведенных выше примеров видно, что спецификация адре­сов ресурсов URI является довольно общей и позволяет адресовать практически любой ресурс Интернет. При этом число ресурсов может расширяться за счет создания новых схем. Они могут быть похожими на существующие, а могут и отличаться от них. Реальный механизм интерпретации идентификатора ресурса, опирающийся на URI, назы­вается URL (Uniform Resource Locator), и пользователи WWW имеют дело именно с ним.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: