Поиск по адресам URL
Самый быстрый и надежный вид поиска информации в Интернете - поиск по адресам URL. Многие из них приводятся в печатных изданиях, специальных справочниках, звучат в эфире популярных радиостанций и с экранов телевизора.
* Поклонникам группы «Король и шут» хорошо известен официальный сайт этой группы www.korol.spd.ru.
* Любители телеканала НТВ без труда найдут его сайт по адресу www.ntv.ru.
Для быстрого доступа к вышеназванным ресурсам достаточно запустить программу-браузер, например Internet Explorer, и набрать знакомый адрес URL в строке адреса.
Поисковые системы
В Интернете сосредоточено огромное количество документов. Чтобы облегчить поиск нужной информации, создаются специальные поисковые машины.
Поисковые машины- это автоматические системы, опрашивающие серверы, подключенные к глобальной сети, и сохраняющие в своей базе информацию об имеющихся на серверах данных. |
По специальным образом сформулированному запросу поискoвые машины предоставляют информацию о том, где можно получить необходимые данные.
|
|
Как правило, поисковые машины состоят из трех частей: робота, индекса и программы обработки запроса.
* Робот (Spider, Robot или Bot) - это программа, которая посещает веб-страницы и считывает (полностью или частично) их содержимое. Роботы поисковых систем различаются индивидуальной схемой анализа содержимого веб-страницы.
* Индекс - это хранилище данных, в котором сосредоточены копии всех посещенных роботами страниц. Индексы в каждой поисковой системе различаются по объему и способу организации хранимой информации. Базы данных ведущих поисковых машин храпят сведения о десятках миллионов документов, а объемы их имдекса составляют сотни гигабайт. Индексы периодически обновляются и дополняются, поэтому результаты работы одной поисковой машины с одним и тем же запросом могут различаться, если поиск производился в разное время.
* Программа обработки запроса - это программа, которая в соответствии с запросом пользователя «просматривает» индекc на предмет наличия нужной информации и возвращает ссылки на найденные документы. Множество ссылок на выходе системы распределяется программой в порядке убывания релевантности, то есть от наибольшей степени соответствия ссылки запросу к наименьшей [3].
В настоящее время самыми популярными для российских пользователей Интернета являются три крупные поисковые системы индексного типа: Яндекс (www.yandex.ru); Апорт (www.aport.ru); Рамблер (www.rambler.ru).
Основными характеристиками поисковых машин являются:
* объем документов в индексе; |
* частота обновления информации; |
* информационное пространство, которое охватывает робот поисковой машины, и разнообразие типов документов, о которых собирается информация; |
* скорость обработки запроса; |
* критерий определения релевантности (соответствия найденного документа поисковому запросу); |
* возможность детализации и уточнения запроса. |
1. Поиск по рубрикатору поисковой системы
|
|
Поисковые каталоги представляют собой систематизированную коллекцию (подборку) ссылок на другие ресурсы Интернета. Ссылки организованы в виде тематического рубрикатора, представляющего собой иерархическую структуру, перемещаясь по которой, можно найти нужную информацию.
Рассмотрим пример. Предположим, вы собираетесь приобрести мобильный телефон и хотите сравнить характеристики аппаратов разных фирм. Поиск мог бы вестись по следующим рубрикам каталога:
Яндекс > Каталог > Компьютеры и связь > Мобильная связь > Мобильные телефоны.
Получив ограниченное количество ссылок, можно достаточно оперативно их просмотреть и выбрать телефон, исследовав характеристики по фирмам и модификациям аппаратов.
2. Поиск по ключевым словам
Большинство поисковых машин имеют возможность поиска по ключевым словам. Это один из самых распространенных видов поиска. Для поиска по ключевым словам необходимо ввести в специальном окне слово или несколько слов, которые следует искать, и щелкнуть на кнопке Поиск. Поисковая система найдет в своей базе и покажет документы, содержащие эти слова.
Для того чтобы сделать поиск более продуктивным, во всех поисковых системах существует специальный язык формирования запросов со своим синтаксисом.