Критерий смыслового соответствия
|
Существуют две технологии обработки запросов (режимов информационного поиска), режим ретроспективного поиска и режим избирательного распределения информации.
При ретроспективном поиске очередной ПОЗ сравнивается со всеми ПОД. В режиме избирательного распределения информации схема обратная: ПОД каждого вновь загружаемого документа сравнивается со всеми поисковыми образами запросов. В первом случае запросы обрабатываются после создания массива ПОД, которые, накапливаясь, формируют ретроспективную БД, во втором — массив ПОЗ создается до обработки документов.
13.Состав, назначение, требования к ИПЯ. Классификация дескрипторных ИПЯ.
ИПЯ включает в себя лексику (совокупность всех слов языка) и грамматику (множество правил составления и преобразования поисковых образов). Назначение ИПЯ – убрать многозначность слов, выразить только объективные характеристики соотношения и связи предметов. Требования: Обеспечение компактной, строго алгоритмизированной записи содержания документов и поисковых запросов.
Дескрипторы - это предназначенные для координатного индексирования документов и информационных запросов нормативные ключевые слова, у которых устранены синонимия, полисемия и омонимия.
Дескрипторный язык – ИПЯ, лексика которого состоит из дескрипторов, а грамматика не менее чем из способа построения ПОД и поисковых предписаний (Координируются соответствующие дескрипторы).
Классификация ИПЯ:
1. Не координируемые языки — не допускающие координации своих лексических единиц (нет связи между ними) ни в процессе индексирования, ни в процессе поиска. 2.Координируемые ИПЯ — языки, в которых лексические единицы связывается, координируются между собой или в процессе индексирования или в процессе использования. А) Предкоординируемые — связи между лексическими единицами устанавливаются перед поиском. Б)Посткоординируемые — когда связи между лексическими единицами устанавливаются только при поиске
Перечислительные классификации
|
Аналитико-синтетические классификации
|
Языки дескрипторного типа
|
14.Парадигматические и синтагматические отношения между лексическими единицами ИПЯ. Меры близости лексических единиц.
Парадигматические отношения – отношения между лексическими единицами языка (словами) не связанные с контекстом их употребления.
Синтагматические отношения – связь между лексическими единицами языка, в зависимости от контексту.
Меры близости лексических единиц:В зависимости от совпадения поисковых образов (частичного или полного) выделяются различные методы отбора документов – по булевым выражениям или более сложные. Меры близости вводятся формально, в зависимости от исследуемой предметной области и поставленной исследователем задачи.