Определение последовательности выбранных слов

Синтагматические отношения – отношения слов при соединении их в словосочетания и фразы. Например, «защита окружающей среды от человека» и «защита человека от окружающей среды».

Семантическая сила информационно-поискового языка определяется многообразием парадигматических и синтагматических отношений.

По способу организации понятия различают информационно-поисковые языки:

1. Классификационные (предкоординируемые). Предкоординация – предварительное (до индексирования) построение сложных классов путем логического умножения простых классов. Словарный запас задается в виде фиксированного списка слов, словосочетаний и фраз. Введение новых лексических единиц строго ограничено и возможно лишь до индексирования, т.е. при создании языка.

Предкоординируемые ИПЯ по принципу организации классифицируют на перечислительные (в них формируется список предметных заголовков в алфавитном порядке, содержание документа индексируется перечислением кодов тех рубрик, которые отражали темы документа) и систематизированные (в свою очередь, делятся на иерархические, когда список рубрик и подрубрик представлен в виде дерева, и фасетные, в которых вся предметная область разбивается на ряд исходных рубрик (фасет), выступающих в роли элементов, из которых можно сконструировать любую предметную рубрику).

Перечислительный и иерархический подходы используются в алфавитно-предметных каталогах. К недостаткам этих подходов можно отнести невозможность заранее перечислить все возможные темы документов. Этого недостатка нет в фасетном подходе.

2. Дескрипторные (посткоординируемые). Основаны на методе координатного индексирования. Лексические единицы объединяются в поисковом образе лишь во время индексирования. Словарь дескрипторного ИПЯ состоит из ключевых слов и дескрипторов (понятий, обозначающих группу эквивалентных или близких по смыслу ключевых слов, это имя класса синонимов, в качестве дескриптора используется код, слово или словосочетание).

Разработка дескрипторного языка сводится к разработке информационно-поискового тезауруса – специального словаря, в котором перечислены ключевые слова – дескрипторы, определения предметной области, их синонимы и т.д.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: