Назначениеинформационно-поисковыхтезаурусов

Вразличныхстандартахипособияхприводятсяразныеопределения информационно-поисковыхтезаурусов. Объемлющее определениеинформационно-поисковоготезауруса можносформулироватьследующимобразом:

Информационно-поисковыйтезаурус (ИПТ)-это контролируемыйсловарь терминовнаестественномязыке,явноуказывающийотношениямеждутерминамиипредназначенныйдляинформационногопоиска.

ОсновнымицелямиразработкитрадиционныхИПТявляютсяследующие:

· обеспечениепереводаестественного языкадокументов ипользователейна контролируемыйсловарь,применяемыйдляиндексированияипоиска;

· обеспечениепоследовательногоиспользованияединициндексирования;

· описаниеотношениймеждутерминами;

· использованиекакпоисковогосредстваприпоискедокументов.

Единицытрадиционныхинформационно-поисковыхтезаурусов

Основнойединицейтезаурусовявляются термины,которыеразделяютсяна дескрипторы (авторизованныетермины)инедескрипторы(аскрипторы).

Большинствоверсийстандартов по ИПТуказываютна связь терминовс понятиямипредметнойобласти. По американскомустандартутермин-это слово либо словосочетание,обозначающеепонятие.Стандарт ISO подчеркивает,чтоиндексирующийтермин-это представление понятияпредпочтительновформесуществительногоилиименнойгруппы.

Приэтомпонятиерассматриваетсякак единица мысли,котораяформируетсямысленнодляотражениявсехилинекоторыхсвойствконкретногоилиабстрактного,реальносуществующегоилимысленногообъекта.Понятиясуществуюткакабстрактныесущности,независимооттерминов,которыеихвыражают.

РоссийскийГОСТрассматриваетпонятиекакформумышления,отражающуюсущественныесвойства,связииотношенияпредметовиявлений,атерминомвопределенииГОСТаявляется слово или словосочетание,являющеесяточнымобозначениемопределенногопонятиякакой-либообластизнания.

ГОСТ7.74-96определяетединицытезаурусакаклексическиеединицыинформационно-поисковогоязыка-тоестьобозначенияотдельногопонятия,принятыевинформационно-поисковомязыкеинеделимыевэтойфункции.

Стоитотметить,чтоневсеразработчикитезаурусовчеткоразделялипонятияитермины.Так,разработчикитезаурусаAGROVOCопределилиегокактермино-ориентированный(term-oriented),чтонаходитсвоепроявлениевтом,чтоктерминуневозможнодобавитьсинонимы.Этаособенностьтезаурусарассматриваетсяавторамикакнедостаток,которыйнеобходимоисправить.

Такимобразом,разработчикитезаурусовпредполагают,чтопонятие предметнойобласти обычноимеетнескольковозможныхвариантовлексическогопредставлениявтексте,которыерассматриваютсякаксинонимы.Средитакихсинонимоввыбирается дескриптор -термин,которыйрассматриваетсякакосновнойспособссылкинапонятиеврамкахтезауруса.Другиетерминыизсинонимическогоряда,включенныевтезаурус,называются аскрипторами илинедескрипторами.Онииспользуютсякаквспомогательныеэлементы,текстовыевходы,помогающиенайтиподходящиедескрипторы.

Дескрипторы

Дескрипторытезаурусадолжнысоответствоватьвыбраннойпредметнойобластитезауруса.Каждыйдескриптор,внесенныйвтезаурус,долженпредставлятьотдельноепонятиеданнойобласти.Дескрипторможетбытьоднословнымилимногословным.Посколькучастобываетдостаточнотруднопонять,представляетлиотдельноепонятиемногословноесловосочетание,многиетезаурусыируководствауделяютособоевниманиеосновнымпринципамвключениявтезаурусвкачестведескрипторовмногословныхтерминов.

Набордескрипторовдолженудовлетворятьследующимтребованиям:

· посредствомвыделенныхдескрипторовдолжнобытьвозможноописатьтемыабсолютногобольшинстватекстовпредметнойобласти;

· дляуменьшениясубъективностииндексированиямножестводескрипторовнедолжновключатьсовокупностиблизкихдескрипторов;дляэтогоформируютсяклассыусловнойэквивалентности,когдасовокупностиблизких,норазличныхпонятийсводятсякодномудескриптору;

· дескриптордолженбытьсформулированоднозначно,егоподразумеваемоеврамкахтезаурусазначениедолжнобытьпонятнопользователю.Еслиоднозначныйиясныйдескрипторподобратьнеудается,термин,взятыйвкачестведескриптора,снабжаетсярелятором(краткойпометкой)иликомментарием.

Отношениявинформационно-поисковомтезаурусе

ГОСТ7.25указывает,чтоосновнымитипамиотношений,обычноотражаемыхвИПТ,являютсяследующие:

· род-вид;

· часть-целое;

· причина-следствие;

· сырье-продукт;

· административнаяиерархия;

· процесс-объект;

· функциональноесходство;

· процесс-субъект;

· свойство-носительсвойства;

· антонимия.

Такиесодержательные типысвязей междудескрипторамичащевсегонеотражаютсявподробномперечнеотношенийтезауруса,азаписываютсяспомощьюнебольшогонабораотношений,которыеобычноразделяютсянадватипа: иерархические и ассоциативные.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: