Основы Internet. Основы WWW. Поиск информации в WWW

Internet – это всемирная компьютерная сеть сетей, состоящая из множества компьютерных сетей разного масштаба (от локальных сетей небольших предприятий до глобальных сетей крупных корпораций) и других сетевых устройств, соединенных каналами связи по которым передается информация.

Internet надо воспринимать как среду для обмена информацией между компьютерами всего мира т.е. как средство коммуникации. Некоторые параллели можно провести с телефоном. Телефонная сеть передает информацию от человека к человеку, Internet служит для общения компьютеров.

Основная задача сети Internet – это быстрая и надежная доставка информации от одного компьютера к другому.

Информация в сети Internet распределена между компьютерами неравномерно. Она концентрируется на определенных узлах, которые называются – серверы. Другие компьютеры подключаются к серверам и копируют к себе необходимую часть информации. Эти компьютеры называются клиентами. По мере копирования, информация визуализируется на экране клиентского компьютера в удобной для пользователя форме.

Для эффективной передачи информации компьютеры должны придерживаться общих правил. Правила взаимодействия компьютеров в сети называются протоколами. В основу всех протоколов сети Internet положены два протокола: TCP – протокол контроля передачи информации, и IP – протокол транспорта пакетов от узла к узлу.

Чтобы избежать путаницы при передаче информации все узлы сети Internet имеют уникальные идентификаторы – IP адреса. IP адрес состоит из 4-х целых чисел в интервале от 0 до 255 (размер 1 байт), с разделителем в виде "точки". Например: 194.226.247.17 или 240.34.127.28 и др. Все компьютеры сети Internet для правильной доставки информации руководствуются этими адресами.

Людям очень неудобно работать с IP адресами (их трудно запоминать). Поэтому для себя люди придумали другую систему именования узлов Internet – доменные имена. Домен – объединение компьютеров по социальному или территориальному принципу. Домены организованы в виде иерархии. Имена самых крупных доменов (1-й уровень) жестко фиксированы. Доменное имя компьютера образуется перечислением всех имен доменов по иерархической цепочке в направлении укрупнения с разделением точкой. Например: www.usma.ru или s1.mailserv.saletrue.com и др.

Internet, как и любая другая телекоммуникационная среда (например телефония), многофункционален. С помощью сети можно получать информацию в различной форме (текст, изображения, звук, видеоряд и др.), можно обмениваться электронными сообщениями друг с другом, можно общаться в реальном режиме времени, можно управлять компьютерами и другими устройствами и т.д. Для реализации определенной функции в сети Internet есть понятие ресурса. Ресурс – это процесс взаимодействия узлов по общепринятым правилам. Обычно у каждого ресурса есть свои правила взаимодействия узлов сети (протоколы), правила адресации компьютеров, правила хранения и форма представления информации.

Самый распространенный, на сегодняшний день, ресурс сети Internet – это Всемирная паутина (WWW). На долю этого ресурса приходится более 80% информационных запасов сети. Такое лидерство WWW имеет за счет самой адаптированной для сети Internet формы представления информации - гипертекста. Гипертекст, в отличие от обычного текста, содержит в себе гипертекстовые ссылки (информационные мостики). Они позволяют соединять логическими связями части одного документа или отдельные документы друг с другом. За счет гипертекстовых ссылок можно удобно и интуитивно понятно структурировать очень большие объемы информации (сотни и тысячи многостраничных документов). Всемирная паутина ориентирована на графическую информацию, что также очень важно в современном компьютерном мире.

WWW, как и другие ресурсы Internet, организована по клиент-серверной архитектуре. Web-сервера в огромном количестве разбросаны по всему миру. Они хранят на своих носителях информации гипертекстовые документы и предоставляют их пользователям сети в ответ на их запросы. Пользователи сети Internet для соединения с серверами и получения Web-документов используют клиентские программы – Web-браузеры. Самый распространенный браузер, на сегодняшний день, это программа фирмы Microsoft -–Internet Explorer (IE).

Рис. 6.1. Окно браузера Internet Explorer

Окно IE (рис. 6.1.) содержит следующие компоненты:

- основное меню – в нем собраны все команды доступные пользователю;

- панель инструментов – на нее вынесены в виде кнопок наиболее часто используемые команды;

- адресная панель – служит для создания запроса к серверу в виде адреса Web-документа;

- рабочее пространство – используется для визуализации полученного с сервера Web-документа;

- строка состояния – несет информационную нагрузку.

Для получения документа с какого-либо Web-сервера необходимо ввести в адресную панель его адрес и нажать Enter. Например: https://www.usma.ru/catalog/index.asp. Если полный адрес документа неизвестен, можно ограничиться адресом Web-сайта. Например: www.usu.ru или www.nlm.nih.gov. По мере копирования с сервера, запрашиваемая страница визуализируется в рабочем пространстве. Т.к. это гипертекстовая страница, то в ней могут быть гипертекстовые ссылки. Ими можно воспользоваться для перехода на другой документ или на другой Web-сайт. Для этого достаточно кликнуть на ссылке один раз левой кнопкой мыши.

Для достижения высокой надежности и живучести Internet построен по принципу полной децентрализации. Все сегменты сети работают автономно. Руководящее, центральное начало отсутствует. Этот факт создает проблему поиска информации. В сети нет компьютера или организации, которая знала бы об Internet все. Все информационные запасы, адреса всех страниц, их содержание и т.д. Эту проблему усугубляет и бурное развитие сети. Каждый день появляются новые сайты и страницы, меняются адреса.

Проблема поиска информации решается в двух направлениях. Первое направление более старое, классическое – это создание Internet-каталогов. Каталоги – это списки ссылок на различные сайты, представленные в виде иерархии категорий. Выбирая, из предложенных, нужную категорию, пользователь уточняет свой запрос, сужает поле поиска ссылок. Каталоги просты в использовании и обслуживании, процент соответствия информации у каталогов достаточно высок. Однако есть один существенный недостаток: в каталоги заносятся ссылки на сайты или крупные разделы сайтов, ссылки на все страницы сайта в каталог не попадают. Для детального, тонкого поиска каталоги не подходят. Адреса некоторых каталогов: www.rambler.ru; www.yahoo.com и др.

Второе направление в поиске информации – поисковые системы (машины). Поисковые системы позволяют искать информацию по ключевым словам. Они ведут поиск заданных пользователем ключевых слов на всех доступных страницах и выдают результат в виде списка Internet – адресов. С помощью поисковых систем можно вести детальный, тонкий поиск. Адреса некоторых поисковых систем: www.yandex.ru; www.altavista.com и др.

Главный недостаток поисковых систем – относительно низкий процент соответствия информации в списке результатов поиска. Т.е. далеко не каждый адрес в списке результатов поиска отвечает запросу пользователя. Иногда запрос пользователя сформулирован слишком широко, и результат поиска необъятно велик (десятки тысяч страниц), иногда поисковая система неправильно интерпретирует ключевые слова.

Для повышения качества поиска практически каждая поисковая система имеет два механизма. Первый – это расширенный поиск или фильтрация. Пользователь оставляет запрос без изменений, но к результату поиска может применить некоторые фильтры. Например: выбрать только самые свежие документы и т.д. Второй – использование в запросе специального синтаксиса - языка запросов. Язык запросов устраняет разночтения между пользователем и поисковой системой.

Следующий шаг повышения качества поиска – метапоисковые системы. Метапоисковые системы, как следует из названия, являются своего рода надстройками над универсальными поисковыми системами (специализированные поисковые системы, например медицинские, в эту конструкцию, как правило, не включаются). Работа метапоисковых систем основана на передаче запроса и последующем использовании ресурсов, которые находят поисковые системы. Благодаря этому полнота поиска и вероятность нахождения нужной информации увеличиваются. Примерами могут служить: www,quintura.ru; www.nigma.ru; www.exactus.ru; www.clusty.com.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: