Понятие стратегии и технологии поиска информации

Стратегия поиска - общий план (концепция) поведения пользователя для выражения и удовлетворения информационной потребности. План обусловлен характером цели и типом поиска, архитектурой БД, а также методами и средствами поиска(см.ниже) конкретной АИПС.

Выбор стратегии в общем случае – оптимизационная задача. На практике это достижение компромисса между практическими потребностями и возможностями имеющихся средств.

С точки зрения способа задания условия соответствия информационной потребности информационным ресурсам говорят о 2-х стратегиях: вербальной и кластерной.

Вербальная – аналог функционального задания. Традиционная стратегия, ее поддерживают большинство промышленных АИПС.

Отличительная черта - обязательное построение завершенного, логически и синтаксически правильного выражения, посредством которого может быть получена выдача формально релевантных запросу документов.

Кластерная – отражает особенности перечислительного способа.

Обобщающает понятие "документ"(или совокупность документов) до уровня запроса. Подход основывается на предположении, что документ, его фрагмент или группа документов могут рассматриваться не только как результат поиска, но и как некоторый поисковый образ.

Технологии, поддерживающие кластерные стратегии, в значительной мере позволяют сократить объем просматриваемой при поиске информации.Это происходит за счет определения на основе знаний пользователя групп документов для эффективной идентификации его потребностей.

Связь стратегии и типа поисковой задачи: каждому типу поиска соответствует свой тип запроса, форма его выражения, характер результата.

Вербальные стратегии ориентированы на структурные методы построения запроса.Это когда ищущему известен аналог или предмет поиска хорошо определен в предметной области.

Кластерные стратегии тяготеют к построению собирательного образа части предметной области, границы которой или предопределены при создании БД или определяются в процессе поиска.

Технология поиска –последовательности использования в процессе взаимодействия пользователя с системой отдельных средств поиска для получения устойчивого и эффективного конечного и промежуточных результатов. Поисковые технологии унифицированы и оптимизированы в рамках конкретной АИПС.

Технологии поиска объединяют два процесса:

-процесс объявления пользователем информационной потребности;

-процесс построения системой информационного массива.

Информационный массив - множество документов, выдаваемых пользователю в ответ на поисковое требование.

Технология генерации выдачи определяется архитектурой программного и информационного обеспечения конкретной системы. Выделяются два класса систем: диалоговые и пакетные.

Диалоговые ориентированы на работу в реальном масштабе времени, а условие отбора по одному запросу соотносится со всеми поисковыми образами документов

Пакетные :каждый поисковый образ документа (при поступлении в систему) соотносится с поисковыми образами всех запросов.

Выражение запроса:

непосредственного набор булевоподобного выражения;

формирование булевоподобного выражения с помощью “конструктора запросов”

форматно-ориентированные формы генерации “запроса по образцу”.

Методы поиска – совокупность моделей и алгоритмов реализации отдельных технологических этапов (таких, как построение ПОЗ, сопоставление ПОД и ПОЗ, расширение или реформулирование запросов и.т.д)

Средства поиска – комплекс ИПЯ и языков определения/управления данными, а также средства управления.

Языки обеспечивают представление и структурно-семантические преобразования основных и технологических объектов:словарей, документов, совокупностей результатов поиска.

Средства управления обеспечивают доступ к функциям конкретной АИПС (с помощью пользовательского интерфейса).



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: