Нормирование в языках библиографического описания

Как уже говорилось, тезаурус представляет собой средство нормирования лексики и объединяет в себе два инструмента: словарь индексирования (дескрипторный словарь) и словарь базисных отношений между лексемами. Применение этих инструментов называют лексическим контролем. В информационно-библиотечных системах для этого используются термины “ авторитетный файл ” (как словарь индексирования) и “ авторитетный контроль ” (в качестве аналога понятия “лексический контроль”). Эти термины представляют собой кальку с английского (authority file, authority control). В русской научной литературе также можно встретить термины “файл нормативных/справочных записей” и “нормирование”, что используется реже, хотя и лучше отражает существо дела. Суть же дела всегда одна и та же: при описании документа и его индексировании встают проблемы нормализации лексических единиц ИПЯ и элементов библиографических данных, проблемы написания собственных имен, названий, аббревиатур, и т.д. Решение этих проблем и составляет суть авторитетного контроля. Лингвистическое обеспечение любой системы должно обеспечивать унификацию языковых средств, т. е. ограничение или учет вариаций выражения при описании и индексировании документов и формулировке запросов пользователей. Это и есть основная задача лексического (авторитетного) контроля.

Авторитетный контроль как отдельная технология стал развиваться с появлением автоматизированных систем, поэтому его основные понятия и сфера применения связаны с машинными библиографическими форматами и автоматизированными библиотечными системами. Основная единица авторитетного файла – «авторитетная запись». Это запись, основной (заглавный) элемент которой представляет собой унифицированную формулировку написания собственного имени, названия постоянного или временного коллектива, названия произведения или предмета (темы), используемых в качестве предметной рубрики в электронном каталоге.

Помимо основного элемента авторитетная запись может содержать:

методические замечания по использованию авторитетной записи

другие варианты написаний основного элемента

систему ссылок, фиксирующую связи данной записи с другими записями

номер авторитетной записи

указание источников, использовавшихся для создания авторитетной записи.

Фактически, это статья дескрипторного словаря (с некоторыми дополнительными пометами) для элементов данных ЯБО. В информационно-библиотечных системах для различных элементов данных создаются отдельные авторитетные файлы –имен авторов, названий постоянных и временных коллективов и организаций, географических названий, издательств и др. Можно сказать, что каждый из них представляет собой отдельный тезаурус.

Единство понятий «тезаурус» и «авторитетный файл» лучше всего видны на примере авторитетного файла предметных рубрик (ПР). В литературе язык предметных рубрик часто выделяется как предкоординированный язык иерархического типа. Однако его лексическая природа и практика его использования сближает его с дескрипторными языками. Изучение опыта создания авторитетных (нормативных) записей для ПР показывает, что фактически речь идет о создании предметного тезауруса. Авторитетный файл ПР представляет собой базу данных, содержащую массив записей, используемых для индексирования библиографических записей в электронном каталоге и поисковых выражений запроса при поиске.

Авторитетные записи обычно классифицируются и оформляются в соответствии с требованиями коммуникативного формата UNIMARC/Authorities. Описание этого формата и структура его записей во многом сходны с самим форматом UNIMARC.

Приведем примеры авторитетных записей авторов и учреждений.

100 ##$a19960316arusy0102####ca

200 #0$aКукрыниксы$cхудожники

305 1#Коллективный псевдоним художников Куприянов Михаил Васильевич$bКрылов Порфирий Никитич$bСоколов Николай Александрович

500 #1$5f0$aКуприянов$bМ.В.$gМихаил Васильевич$f1903–

500 #1$5f0$aКрылов$bП.Н.$gПорфирий Никитич$f1902–

500 #1$5f0$aСоколов$bН.А.$gНиколай Александрович$f1903–

100 ##$a19960316arusy0102####ca

210 02$aКавказские минеральные воды, курортная группа

305 1#$aЛитературу о конкретных курортах этой группы см. также под частными названиями $bЖелезноводск, курорт$bКумогорск, курорт$bКисловодск, курорт$b Теплый Нарзан, источник (Пятигорск)

330 1#$aИмеется в виду группа курортов в России (Ставропольский край). Включает Пятигорск, Кисловодск, Ессентуки, Железноводск

510 02$5|0$aЖелезноводск, курорт

510 02$5|0$aКумогорск, курорт

510 02$5|0$aКисловодск, курорт

510 02$5|0$aТеплый Нарзан, источник$c(Пятигорск)

При разработке автоматизированных ИПС также стоит задача проектирования машинной структуры тезаурусов и авторитетных файлов. Обычно эта задача рассматривается как составная часть разработки программного обеспечения, хотя на самом деле мы имеем дело с двумя структурами – физической и логической. И логическая структура тезауруса и авторитетного файла относится к комплексу языковых средств. Эта структура должна определяться как типом и задачами конкретной системы, так и имеющимися стандартами, обеспечивающими межсистемную совместимость, как приведенными здесь, так и другими.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: