Вразличныхстандартахипособияхприводятсяразныеопределения информационно-поисковыхтезаурусов. Объемлющее определениеинформационно-поисковоготезауруса можносформулироватьследующимобразом:
Информационно-поисковыйтезаурус (ИПТ)-это контролируемыйсловарь терминовнаестественномязыке,явноуказывающийотношениямеждутерминамиипредназначенныйдляинформационногопоиска.
ОсновнымицелямиразработкитрадиционныхИПТявляютсяследующие:
· обеспечениепереводаестественного языкадокументов ипользователейна контролируемыйсловарь,применяемыйдляиндексированияипоиска;
· обеспечениепоследовательногоиспользованияединициндексирования;
· описаниеотношениймеждутерминами;
· использованиекакпоисковогосредстваприпоискедокументов.
Единицытрадиционныхинформационно-поисковыхтезаурусов
Основнойединицейтезаурусовявляются термины,которыеразделяютсяна дескрипторы (авторизованныетермины)инедескрипторы(аскрипторы).
Большинствоверсийстандартов по ИПТуказываютна связь терминовс понятиямипредметнойобласти. По американскомустандартутермин-это слово либо словосочетание,обозначающеепонятие.Стандарт ISO подчеркивает,чтоиндексирующийтермин-это представление понятияпредпочтительновформесуществительногоилиименнойгруппы.
|
|
Приэтомпонятиерассматриваетсякак единица мысли,котораяформируетсямысленнодляотражениявсехилинекоторыхсвойствконкретногоилиабстрактного,реальносуществующегоилимысленногообъекта.Понятиясуществуюткакабстрактныесущности,независимооттерминов,которыеихвыражают.
РоссийскийГОСТрассматриваетпонятиекакформумышления,отражающуюсущественныесвойства,связииотношенияпредметовиявлений,атерминомвопределенииГОСТаявляется слово или словосочетание,являющеесяточнымобозначениемопределенногопонятиякакой-либообластизнания.
ГОСТ7.74-96определяетединицытезаурусакаклексическиеединицыинформационно-поисковогоязыка-тоестьобозначенияотдельногопонятия,принятыевинформационно-поисковомязыкеинеделимыевэтойфункции.
Стоитотметить,чтоневсеразработчикитезаурусовчеткоразделялипонятияитермины.Так,разработчикитезаурусаAGROVOCопределилиегокактермино-ориентированный(term-oriented),чтонаходитсвоепроявлениевтом,чтоктерминуневозможнодобавитьсинонимы.Этаособенностьтезаурусарассматриваетсяавторамикакнедостаток,которыйнеобходимоисправить.
Такимобразом,разработчикитезаурусовпредполагают,чтопонятие предметнойобласти обычноимеетнескольковозможныхвариантовлексическогопредставлениявтексте,которыерассматриваютсякаксинонимы.Средитакихсинонимоввыбирается дескриптор -термин,которыйрассматриваетсякакосновнойспособссылкинапонятиеврамкахтезауруса.Другиетерминыизсинонимическогоряда,включенныевтезаурус,называются аскрипторами илинедескрипторами.Онииспользуютсякаквспомогательныеэлементы,текстовыевходы,помогающиенайтиподходящиедескрипторы.
|
|
Дескрипторы
Дескрипторытезаурусадолжнысоответствоватьвыбраннойпредметнойобластитезауруса.Каждыйдескриптор,внесенныйвтезаурус,долженпредставлятьотдельноепонятиеданнойобласти.Дескрипторможетбытьоднословнымилимногословным.Посколькучастобываетдостаточнотруднопонять,представляетлиотдельноепонятиемногословноесловосочетание,многиетезаурусыируководствауделяютособоевниманиеосновнымпринципамвключениявтезаурусвкачестведескрипторовмногословныхтерминов.
Набордескрипторовдолженудовлетворятьследующимтребованиям:
· посредствомвыделенныхдескрипторовдолжнобытьвозможноописатьтемыабсолютногобольшинстватекстовпредметнойобласти;
· дляуменьшениясубъективностииндексированиямножестводескрипторовнедолжновключатьсовокупностиблизкихдескрипторов;дляэтогоформируютсяклассыусловнойэквивалентности,когдасовокупностиблизких,норазличныхпонятийсводятсякодномудескриптору;
· дескриптордолженбытьсформулированоднозначно,егоподразумеваемоеврамкахтезаурусазначениедолжнобытьпонятнопользователю.Еслиоднозначныйиясныйдескрипторподобратьнеудается,термин,взятыйвкачестведескриптора,снабжаетсярелятором(краткойпометкой)иликомментарием.
Отношениявинформационно-поисковомтезаурусе
ГОСТ7.25указывает,чтоосновнымитипамиотношений,обычноотражаемыхвИПТ,являютсяследующие:
· род-вид;
· часть-целое;
· причина-следствие;
· сырье-продукт;
· административнаяиерархия;
· процесс-объект;
· функциональноесходство;
· процесс-субъект;
· свойство-носительсвойства;
· антонимия.
Такиесодержательные типысвязей междудескрипторамичащевсегонеотражаютсявподробномперечнеотношенийтезауруса,азаписываютсяспомощьюнебольшогонабораотношений,которыеобычноразделяютсянадватипа: иерархические и ассоциативные.