double arrow

Системы, основанные на предметных каталогах.. Системы информационного поиска сети Интернет


Системы информационного поиска сети Интернет.

Cистема телеконференций Usenet (от Users Network).

Эта система организует коллективные обсуждения по различным направлениям, называемые телеконференциями. В каждой телеконференции проводится ряд дискуссий по конкретным темам. Сегодня Usenet имеет более десяти тысяч дискуссионных групп (NewsGroups) или телеконференций, каждая из которых посвящена определённой теме и является средством обмена мнениями. Телеконференции разбиты на несколько групп:

  • news — вопросы, касающиеся системы телеконференций;
  • comp — компьютеры и программное обеспечение;
  • rec — развлечения, хобби и искусства;
  • sci — научно-исследовательская деятельность и приложения;
  • soc — социальные вопросы;
  • talk — дебаты по различным спорным вопросам;
  • misc — всё остальное.

Внутри этих категорий существует иерархия. Так, например, rec.music.beatles — это дискуссия о творчестве Битлз, входящая в подгруппу "музыка" группы дискуссий по искусству. Существует большой выбор программ чтения телеконференций, которые формируют материал дискуссий в упорядоченном виде и предоставляют в распоряжение корреспондентов. Аналог телеконференций в других сетях — "электронная доска объявлений" (Bulletin Board System, BBS).




В Интернетe представлена информация на любые темы, которые только можно себе представить. Но найти в ней нужную информацию не так-то легко из-за того, что сеть по своей природе не имеет чёткой структуры. Поэтому для ориентировки в Интернет и быстрого получения свежей справочной информации разработаны системы поиска информации. Все системы поиска информации Интернет располагаются на специально выделенных компьютерах с мощными каналами связи. Ежеминутно они бесплатно обслуживают огромное количество клиентов. Поисковые системы можно разбить на два типа:

  • предметные каталоги, формируемые людьми-редакторами;
  • автоматические индексы, формируемые специальными компьютерными программами, без участия людей.

Используют базы данных, формируемые специалистами-редакторами, которые отбирают информацию, устанавливают связи для баз данных, организуют и снабжают данные в разных поисковых категориях перекрёстными ссылками. Кампании, владеющие предметными каталогами, непрерывно исследуют, описывают и каталогизируют содержимое WWW-cерверов и других сетевых ресурсов, разбросанных по всему миру. В результате этой работы клиенты Интернет имеют постоянно обновляющиеся иерархические (древовидные) каталоги, на верхнем уровне которых собраны самые общие категории, такие как "бизнес", "наука", "искусство" и т.п., а элементы самого нижнего уровня представляют собой ссылки на отдельные WWW-страницы и серверы вместе с кратким описанием их содержимого.



Пример. Если нужно выяснить, какая в мире имеется информация о динозаврах, достаточно спуститься по иерархии:

Науки ==> Животные ==> Доисторические животные ==> Динозавры.


Каталоги, составленные людьми, более осмыслены, чем автоматические индексы. Их очень мало, так как их создание и поддержка требуют огромных затрат. Для примера рассмотрим самый популярный предметный каталог Yahoo!, который обладает одной из крупнейших баз данных. Имеет информационные базы для детей и подростков. Поддерживает два основных метода работы с каталогом — поиск по ключевым словам и поиск по иерархическому дереву разделов. Не принимает запросов на естественном языке.







Сейчас читают про: