Идея применить гипертекстовую модель к информационным ресурсам, распределенным в сети, и сделать это максимально простым способом была предложена Т. Бернерс-Ли. Он заложил три краеугольных камня системы из четырех существующих ныне, разработав:
язык гипертекстовой разметки документов HTML (HyperText Markup Language);
универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);
протокол обмена гипертекстовой информацией HTTP (HyperText Transfer Protocol).
Позже команда NCSA добавила к этим трем компонентам четвертый: универсальный интерфейс шлюзов CGI (Common Gateway Interface).
В сети Internet используются следующие основные способы поиска информации:
· Навигация: • гипертекстовые ссылки (World Wide Web);
• строки-селекторы (Gopher);
· Информационный поиск: • Archie;
• Veronica;
• Wais;
• Information Retrieval Systems.
Существует два вида информационных баз данных о Web-страницах:
поисковые машины и каталоги:
· поисковые машины (spiders, crawlers) постоянно исследуют Сеть с целью пополнения собственной базы данных документов. Обычно это не требует никаких усилий со стороны человека. Для поисковых систем довольно важна конструкция каждого документа. Большое значение имеют title, meta-tag и содержимое страницы. Примером может быть поисковая система Altavista;
|
|
· каталоги: в отличие от поисковых машин, информация в каталоги заносится по инициативе человека. Добавляемая страница должна быть жестко привязана к принятым в каталоге категориям. Конструкция страниц значения не имеет. Примером каталога может служить Yahoo.