Поиск информации в интернете по ключевым словам. Поиск информации в интернете по категориям

Это вторая из наиболее распространенных технологий поиска в сети необходимой информации. Она известна также под именами «поисковые указатели», «индексы». Суть технологии заключается в том, что пользователь отсылает запрос, состоящий из ключевых слов, на центральный сервер. Для формирования запроса на web-странице расположено поле для ввода и редактирования текста, которое может служить визитной карточкой такой технологии. Сервер ищет в своей базе данных ключевые слова и выдает список документов, которые их включают.Эта технология состоит из регулярного сканирования Интернета и получения данных; составления из них гигантской базы данных, поискового индекса и получения запроса от пользователя; нахождения в базе соответствующих ссылок и возвращения результатов пользователю. Весь процесс автоматизирован, получение и обновление данных идет непрерывно, благодаря чему подобные поисковые системы имеют огромные базы проиндексированных web-страниц.Отсортированные результаты поиска доставляются клиенту. Обычно они представляют собой список, в котором для каждого документа указан URL, затем следует название, если оно есть, и, возможно, несколько первых строк, помогающих клиенту сориентироваться в назначении документа. Иногда присутствуют даты регистрации документа и его последней проверки.Найденные ключевые слова выделяются цветом или шрифтом, также может присутствовать рейтинговое число, выраженное в процентах.Если результаты поиска не уместились на одной странице, что бывает весьма часто, то внизу появляются ссылки на оставшиеся страницы, которые загружаются по мере вызова.Число страниц, поставляемых вышеописанными поисковыми указателями, обычно велико, поскольку базы данных охватывают до 25% всех web-ресурсов. Однако качество поиска, выражающееся в том, какой процент ссылок действительно подойдет, оставляет желать лучшего.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: