Инструменты поиска

Размещение информационных ресурсов.

Средства поиска информационных ресурсов.

В настоящее время рост информационных ресурсов Интернета происходит высокими темпами. Всемирная сеть напоминает читальный зал библиотеки, где хранятся гигантские объемы текстовых, графических, мультимедийных, архивных и прочих файлов. Этот зал невозможно обойти полностью. Здесь все ежечасно меняется, тело разнообразных документов возрастает каждую секунду. Найти необходимую информацию становится все труднее. Различные печатные справочники устаревают еще до их выхода в свет. Единственным надежным способом поиска информации является использование специальных поисковых систем, которые постоянно отслеживают изменения информации в сети.

Используемые в сети Интернет ресурсы чаще всего размещаются на страницах WWW-серверов (или Web-серверов), в файловых архивах (FTP-архивах) и в информационно-справочной системе Gopher.

WWW (World Wide Web — Всемирная Паутина) — это глобальная гипертекстовая система, использующая для транспортировки информации в сети Интернет протокол HTTP (HyperText Transfer protocol — протокол передачи гипертекста). Гипертекст — это способ представления всех типов информации в виде последовательности узлов, связанных друг с другом ассоциативной (а не последовательной) связью и реализованной в виде гиперссылок. Гиперссылка — выделенная в гипертексте последовательность символов, реагирующая на щелчок мыши и отсылающая пользователя на другой фрагмент гипертекста. Большинство документов, хранящихся на Web-сервере, создано на языке HTML (HyperText Markup Language — язык гипертекстовой разметки документов).

Gopher-сервер — это сервер, содержащий программы, позволяющие найти файлы, программы или другие ресурсы на заданную пользователем тему. URL-адрес такого сервера выглядит следующим образом (если сервер, например, принадлежит фирме «Microsoft»): gopher://gopher.microsoft.com.

Выделяют две группы поисковых инструментов: 1) поисковые системы и 2) поисковые службы.

ИПС (информационно-поисковая система) – это система, обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями источников информации (индексе) на основе информационно-поискового языка и соответствующих правил поиска.

В Internet можно выделить следующие поисковые инструменты для WWW: поисковые системы, метапоисковые системы (поисковые службы) и программы ускоренного поиска (поисковые агенты).


Рис.13. Средства поиска в WWW

В зависимости от того, кто создает базы данных, в которых осуществляется поиск необходимой пользователю информации, различают поисковые системы первого и второго рода. В поисковых системах первого рода базы данных создаются людьми, в поисковых системах второго рода этот процесс осуществляет компьютер.

Поисковые системы первого рода, как правило, называют каталогами (предметными или тематическими — subject catalogs). Обычно такие каталоги создаются людьми в виде иерархических деревьев, на верхнем уровне которых стоят наиболее общие понятия: бизнес, политика, образование, спорт, культура и т.д. Элементами нижнего уровня таких деревьев являются ссылки на конкретные Web-страницы и серверы. Обычно поиск в предметных каталогах осуществляется по ключевым словам. В этом случае он проводится не в содержимом Web-серверов, а в их кратких описаниях, хранящихся в каталоге. Запрос на поиск формируется либо ввиде списка ключевых слов («information technology», «computer linguisics» и т.п.) или же путем указания URL-адресов документов, в которых следует проводить поиск. Результаты поиска представляются в виде гипертекста, содержащего вкачестве гипертекстовых ссылок названия или URL-адреса найденных документов.

По ключевым словам можно осуществлять поиск следующей информации:

1) некоторого текста или его части;

2) фактических данных (например, массу солнца или имя президента страны);

3) картин, рисунков, кинофильмов и т.д. по их названиям;

4) технической информации (например, сведения о скорости некоторого автомобиля);

5) биографий людей (писателей, художников и т.п.).

Примерами тематических каталогов являются Yahoo, Galaxy, WWW Virtual Library, WebCrawler, HotBot и др. Подобная русскоязычная система носит название «Следопыт».

Поисковые системы второго рода иногда называют автоматическими индексами, «пауками» или «червями» spiders, crawlers). Они постоянно сканируют Интернет, находят в сети новые документы и из каждого документа извлекают все содержащиеся в нем гиперссылки, которыми пополняют свои базы данных (базы URL-адресов). Чтобы можно было выполнять эти функции, автоматический индекс включает в себя следующие три части: программу-робота, которая постоянно просматривает Интернет; базу данных (множество URL-адресов), которая собирается роботом, и интерфейс пользователя для поиска необходимой информации в этой базе данных. Существует большое число автоматических индексов. Наиболее популярными являются:

Зарубежные поисковые машины:

- Altavista (https://www.altavista.com);

- Go (Infoseek) (https://www.go.com);

- Google (https://www.google.com);

- Excite (https://www.excite.com);

- HotBot (https://www.hotbot.com);

- Nothern Light (https://www.northernlight.com).

- Российские поисковые машины:

- Яndex(https://www.yandex.ru);

- Рамблер (https://www.rambler.ru);

- Апорт (https://www.aport.ru).
Популярные белорусские поисковые системы:

- Система ALL.BY (https://all.by);

- Система *.BY (https://search.promedia.minsk.by);

- Регистр белорусских WWW-ресурсов Зубр (https://www.zubr.com);

- Белорусский интернет-каталог Акавiта (https://akavita.kryvia.net);

- Белорусские ресурсы каталог (https://www.belresource.com.by),

Большинство поисковых систем являются одним из компонентов многофункциональных Web-сайтов Internet – так называемых порталов.

Портал – многофункциональный Web-узел Internet, предлагающий разнообразные услуги: поиск информации, бесплатная электронная почта и т.д.

Последнее время во всемирной паутине стали появляться системы, автоматически осуществляющие поиск сразу в двух индексах (индексе каталога и индексе поисковой машины). Подобные системы позволяют использовать преимущества поисковых серверов обоих типов и называются каталогами-машинами.

Поиск информации с помощью различных поисковых инструментов может осуществляться путем формирования простых и сложных запросов. Простой запрос представляет собой слово или словосочетание, которое иногда берется в кавычки. Сложный запрос формируется из слов или словосочетаний, соединяемых операторами типа AND, OR, NOT, NEAR или математическими символами, например "*", "+", "-", "~". Иногда для тех же целей используются специальные термины domain, host, link tide и др.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: