Основные приемы работы

Идея применить гипертекстовую модель к информационным ресурсам, распределенным в сети, и сделать это максимально простым способом была предложена Т. Бернерс-Ли. Он заложил три краеугольных камня системы из четырех существующих ныне, разработав:

язык гипертекстовой разметки документов HTML (HyperText Markup Language);

универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);

протокол обмена гипертекстовой информацией HTTP (HyperText Transfer Protocol).

Позже команда NCSA добавила к этим трем компонентам четвертый: универсальный интерфейс шлюзов CGI (Common Gateway Interface).

В сети Internet используются следующие основные способы поиска информации:

· Навигация: • гипертекстовые ссылки (World Wide Web);

• строки-селекторы (Gopher);

· Информационный поиск: • Archie;

• Veronica;

• Wais;

• Information Retrieval Systems.

Существует два вида информационных баз данных о Web-страницах:

поисковые машины и каталоги:

· поисковые машины (spiders, crawlers) постоянно исследуют Сеть с целью пополнения собственной базы данных документов. Обычно это не требует никаких усилий со стороны человека. Для поисковых систем довольно важна конструкция каждого документа. Большое значение имеют title, meta-tag и содержимое страницы. Примером может быть поисковая система Altavista;

· каталоги: в отличие от поисковых машин, информация в каталоги заносится по инициативе человека. Добавляемая страница должна быть жестко привязана к принятым в каталоге категориям. Конструкция страниц значения не имеет. Примером каталога может служить Yahoo.