Поисковые технологии информационных систем

Поисковые машины (самое развитое средство поиска в Интернете) реализуют технологию полнотекстового поиска. Индексируются тексты, расположенные на опрашиваемых серверах. Индекс может содержать информацию о нескольких миллионах документов.

При использовании средств метапоиска запрос осуществляется одновременно несколькими поисковыми системами. Результат поиска объединяется в общий, упорядоченный по степени релевантности список. Каждая система обрабатывает только часть узлов сети, что позволяет расширить базу поиска. К подобному классу можно отнести и "персональные программы поиска", позволяющие формировать свои собственные инструменты метапоиска (например, автоматически опрашивать часто посещаемые узлы).

Базы информационных данных могут содержать практически любые виды информации, в том числе в любой комбинации. Информационный поиск осуществляется как по существующим в полнотекстовых ЭИР терминам, так и по специальным элементам, входящим в состав ИПЯ. Для формирования запросов используются специальные информационно-поисковые языки.

ИПС внутри найденной выборки обычно пытаются расположить документы в порядке их "релевантности", то есть близости к введенному пользователем запросу.

Примеры поисковых систем и сервисов.

Отличительные особенности представления информации в информационно-справочных системах от интернета заключаются в следующем:

— все документы в системах представлены не разрозненно (отдельно исходный документ, отдельно все изменения и редакции), а комплексно: сами тексты документов включают все изменения, гиперссылки на нормативную базу, сведения о действии и т.д., то есть применительно к системам речь идет о «живых» интерактивных электронных текстах документов;

— документы из информационно-справочной системы отличаются максимальной достоверностью, законностью, аутентичностью и актуальностью.

    Возможности ИПС

  • интеллектуальный поиск — поиск по свободно сформулированному запросу т.е. (слову, фразе, дате принятия, номеру и т. д.).
  • атрибутный поиск — поиск по общим или специализированным атрибутам.

Общие атрибуты — атрибуты, присущие большинству документов (поиск по тексту, наименование, вид документа, принявший орган, номер, дата принятия, актуальность).

Компьютерный вид документа по атрибутам включает в себя:

- тип файла: по расширению (*.txt; *.doc, *.jepg, *.mp3, *.ppt, *xls, …),

- по виду документа (текстовый, табличный, БД, презентация, аудио, графика, инженерная графика, видео, системные файлы…).

Специализированные атрибуты — атрибуты, свойственные данному виду документа.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: