Основные компоненты технологии World Wide Web

World Wide Web (WWW, Web)- всемирная паутина Интернета

Лекция 1.

Тема 1.1. История развития технологий Всемирной Сети и ее основные компоненты.

КОНСПЕКТ ЛЕКЦИИ

ДОНБАССКАЯ ГОСУДАРСТВЕННАЯ МАШИНОСТРОИТЕЛЬНАЯ АКАДЕМИЯ

МИНИСТЕРСТВО ОБРАЗОВАНИЯ УКРАИНЫ

по дисциплине

„Web-технологии и web-дизайн”

Модуль 1

Утверждено на заседании

ученого совета факультета ФАМИТ

Протокол №1 от 31.08.2011 г.

Краматорск, 2011г.

Интернет - всемирная информационная сеть, имеющая единое адресное пространство, основанное на протоколе TCP/IP. Интернет состоит целого ряда сервисов. Интернет часто отождествляют с WWW (World Wide Web - всемирная паутина), но это только одна, хотя и наиболее известная служба (сервис).

Каждый компьютер в Интернет должен иметь свой уникальный адрес. В протоколе TCP/IP каждый компьютер адресуется четырьмя десятичными числами (каждое из которых может быть от 1 до 255). IP адрес компьютера может выглядеть примерно так: 19.226.192.108. Кроме IP адреса каждый компьютер имеет уникальное имя, назначаемое Службой Имен Доменов (Domain Name System - DNS).

Для WWW-службы имя Интернет-сервера, или Интернет-сайта может выглядеть например так: www.name.ru. Где:

· www обозначает WWW-службу Интернета;

· name – зарегистрированное для данного конкретного сайта имя домена второго уровня;

· ru – имя домена первого уровня (зоны Интернета, в которой зарегистрирован домен второго уровня).

На одном сервере в сети может располагаться несколько Интернет-сайтов и, соответственно, один сервер может иметь несколько DNS-имен.

Каждая служба Интернета использует свой способ адресации для задания источника и приемника информации.

WWW (World Wide Web - всемирная паутина) - самый известный, самый популярный и распространенный сервис Интернета, всемогущее средство получения информации.

Технология WWW или просто Web, была разработана в 1989 г. в Женеве, в Лаборатории физики элементарных частиц Европейского центра ядерных исследований (CERN) и была первоначально направлена на создание единой сети для научных сотрудников, занимающихся физикой высоких энергий.

Однако вскоре эта технология нашла гораздо более широкое применение и с 1992г. Web-служба – это общедоступная наиболее динамичная и быстро развивающаяся служба Интернета.

Web-служба основана на двух протоколах

1. HyperText Transport Protocol (HTTP) - Протокол Передачи Гипертекста.

2. HyperText Markup Language (HTML) - Язык Создания Гипертекста.

Понятие гипертекста известно давно, это такой формат текстового документа, который кроме собственно текста может содержать ссылки на другие гипертекстовые документы, по которым можно непосредственно перейти на эти документы.

Гипертекстовый Web-документ может включать в себя текст, 2D и 3D графику, звук, видео, ссылки на другие гипертекстовые документы, ссылки на файлы различного формата и т.д.

Интернет-ссылки - URL (Uniform Resource Locator), могут указывать не только на Web-документы, но и на другие сервисы и информационные ресурсы Интернет: FTP, E-Mail и т.д.

Web работает по принципу клиент-сервер. В сети Интернет существует множество Интернет-серверов, которые по запросам клиентов - пользователей Интернета возвращают ему гипертекстовый документ – сайт Интернета.

К 1989 году гипертекст представлял новую, многообещающую технологию, которая имела относительно большое число реализаций с одной стороны, а с другой стороны делались попытки построить формальные модели гипертекстовых систем, которые носили скорее описательный характер и были навеяны успехом реляционного подхода описания данных. Идея Т.Бернерс-Ли заключалась в том, чтобы применить гипертекстовую модель к информационным ресурсам, распределенным в сети, и сделать это максимально простым способом. Он заложил три краеугольных камня системы из четырех существующих ныне, разработав:

- язык гипертекстовой разметки документов HTML (HyperText Markup Language);

- универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);

- протокол обмена гипертекстовой информацией HTTP (HyperText Transfer Protocol).

- Позже команда NCSA добавила к этим трем компонентам четвертый:

- универсальный интерфейс шлюзов CGI (Common Gateway Interface).

Java не включается в этот список намеренно, т.к. область применения этого языка гораздо шире чем простое "оживление" World Wide Web.

Идея HTML - пример чрезвычайно удачного решения проблемы построения гипертекстовой системы при помощи специального средства управления отображением. На разработку языка гипертекстовой разметки существенное влияние оказали два фактора: исследования в области интерфейсов гипертекстовых систем и желание обеспечить простой и быстрый способ создания гипертекстовой базы данных, распределенной на сети.

В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем, т.е. способов отображения гипертекстовой информации и навигации в гипертекстовой сети. Значение гипертекстовой технологии сравнивали со значением книгопечатания. Утверждалось, что лист бумаги и компьютерные средства отображния/воспроизведения серьезно отличаются друг от друга, и поэтому форма представления информации тоже должна отличаться. Наиболее эффективной формой организации гипертекста были признаны контекстные гипертекстовые ссылки, а кроме того, было признано деление на ссылки, ассоциированные со всем документом в целом и отдельными его частями.

Самым простым способом создания любого документа является его набивка в текстовом редакторе. Опыт создания хорошо размеченных для последующего отображения документов в CERN'е был - трудно найти физика, который не пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал стандарт языка разметки - Standard Generalised Markup Language (SGML).

Следует также принять во внимание, что согласно своим предложениям Т.Бернерс-Ли предполагал объединить в единую систему имеющиеся информационные ресурсы CERN, и первыми демонстрационными системами должны были стать системы для NeXT и VAX/VMS.

Обычно гипертекстовые системы имеют специальные программные средства построения гипертекстовых связей. Сами гипертекстовые ссылки хранятся в специальных форматах или даже составляют специальные файлы. Такой подход хорош для локальной системы, но не для распределенной на множестве различных компьютерных платформ. В HTML гипертекстовые ссылки встроены в тело документа и хранятся как его часть. Часто в системах применяют специальные форматы хранения данных для повышения эффективности доступа. В WWW документы - это обычные ASCII- файлы, которые можно подготовить в любом текстовом редакторе. Таким образом, проблема создания гипертекстовой базы данных была решена чрезвычайно просто.

В качестве базы для разработки языка гипертекстовой разметки был выбран SGML (Standard Generalised Markup Language). Следуя академическим традициям, Бернерс-Ли описал HTML в терминах SGML (как описывают язык программирования в терминах формы Бекуса-Наура). Естественно, что в HTML были реализованы все разметки, связанные с выделением параграфов, шрифтов, стилей и т.п., т.к. реализация для NeXT подразумевала графический интерфейс. Важным компонентом языка стало описание встроенных и ассоциированных гипертекстовых ссылок, встроенной графики и обеспечение возможности поиска по ключевым словам.

С момента разработки первой версии языка (HTML 1.0) прошло уже пять лет. За это время произошло довольно серьезное развитие языка. Почти вдвое увеличилось число элементов разметки, оформление документов все больше приближается оформлению качественных печатных изданий, развиваются средства описания нетекстовых информационных ресурсов и способы взаимодействия с прикладным программным обеспечением. Совершенствуется механизм разработки типовых стилей. Фактически, в настоящее время HTML развивается в сторону создания стандартного языка разработки интерфейсов как локальных, так и распределенных систем.

Вторым краеугольным камнем WWW стала универсальная форма адресации информационных ресурсов. Universal Resource Identification (URI) представляет собой довольно стройную систему, учитывающую опыт адресации и идентификации e-mail, Gopher, WAIS, telnet, ftp и т.п. Но реально из всего, что описано в URI, для организации баз данных в WWW требуется только Universal Resource Locator (URL). Без наличия этой спецификации вся мощь HTML оказалась бы бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к распределенным ресурсам сети. В URL можно адресовать как другие гипертекстовые документы формата HTML, так и ресурсы e-mail, telnet, ftp, Gopher, WAIS, например. Различные интерфейсные программы по-разному осуществляют доступ к этим ресурсам. Одни, как например Netscape, сами способны поддерживать взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW, другие, как например Chimera, вызывают для этой цели внешние программы. Однако, даже в первом случае, базовой формой представления отображаемой информации является HTML, а ссылки на другие ресурсы имеют форму URL. Следует отметить, что программы обработки электронной почты в формате MIME также имеют возможность отображать документы, представленные в формате HTML. Для этой цели в MIME зарезервирован тип "text/html".

Третьим в нашем списке стоит протокол обмена данными в World Wide Web - HTTP (Hyper-Text Transfer Protocol). Данный протокол предназначен для обмена гипертекстовыми документами и учитывает специфику такого обмена. Так в процессе взаимодействия, клиент может получить новый адрес ресурса на сети (relocation), запросить встроенную графику, принять и передать параметры и т. п. Управление в HTTP реализовано в виде ASCII-команд. Реально, разработчик гипертекстовой базы данных сталкивается с элементами протокола только при использовании внешних расчетных программ или при доступе к внешним, относительно WWW, информационным ресурсам, например базам данных.

Последняя составляющая технологии WWW - это уже плод работы группы NCSA - спецификация CGI (Common Gateway Interface). CGI была специально разработана для расширения возможностей WWW за счет подключения всевозможного внешнего программного обеспечения. Такой подход логично продолжал принцип публичности и простоты разработки и наращивания возможностей WWW. Если команда CERN предложила простой и быстрый способ разработки баз данных, то NCSA развила этот принцип на разработку программных средств. Надо заметить, что в общедоступной библиотеке CERN были модули, позволяющие программистам подключать свои программы к серверу HTTP, но это требовало использования этой библиотеки. Предложенный и описанный в CGI способ подключения не требовал дополнительных библиотек и буквально ошеломлял своей простотой. Сервер взаимодействовал с программами через стандартные потоки ввода/вывода, что упрощает программирование до предела. При реализации CGI чрезвычайно важное место заняли методы доступа, описанные в HTTP. И хотя реально используются только два из них (GET и POST), опыт развития HTML показывает, что сообщество WWW ждет развития и CGI по мере усложнения задач, в которых будет использоваться WWW-технология.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: