Тема: Теоретические основы предметизации

Значение предметизации. Предметизация – один из фундаментальных методов организации знаний. Этим объясняется широта сфер его использования.

В основе предметизации как вида индексирования лежат две основные операции: 1.выявление предмета документа, установление аспектов и связей рассмотрения предмета и 2.преобразование этого предмета в краткую словесную формулировку, называемую предметной рубрикой (ПР).

Под предметизацией понимают интеллектуальный или автоматический анализ содержательных и формальных признаков документа с целью его свертывания и отражения в поисковой системе с помощью языка предметных рубрик (ЯПР).

Предметизация – многозначный термин, используемый для использования различных операций.

Во-первых, предметизация – вид индексирования, вид обработки документа. Целью предметизации в данном случае является формирование ПР, способствующих как раскрытию содержания фонда по предметному признаку, так и поиску документов, соответствующих запрашиваемому предмету. Процесс связан с обработкой документа и может быть назван документной предметизацией. Объектами предметизации могут выступать не только отдельный документ, но и его составная часть или совокупность документов. Существуют особенности предметизации текста документа, основанные на общей методике предметизации документа в целом. Данный вид предметизации можно назвать текстовым.

Предметизационный метод используется при формировании классификационных и предметизационных информационно-поисковых языков, предметных традиционных и электронных каталогов, картотек, библиографических указателей, единого алфавитно-предметного указателя к каталогам и т.д.

Метод предметизации используется при реализации другого вида индексирования – систематизации, так как процесс систематизации состоит не только из определения и оформления классификационного индекса, но и одновременно – рубрик алфавитно-предметного указателя (АПУ).

Единый АПУ обеспечивает поиск записей в систематическом каталоге, в систематической картотеке статей и является составной частью данных ИПС. Указатель обеспечивает связи различных элементов системы каталогов и картотек библиотеки и предоставляет возможность многоаспектного, организованного по предметному признаку поиска в отраслевых отделах систематических каталогов, картотек, указателей. АПУ способствует взаимопроникновению методов систематизации и предметизации.

В развитии теории и практики предметизации значительна роль РКП, осуществляющей централизованную предметизацию посредством печатных карточек и использующей предметизацию при составлении вспомогательных указателей к государственным библиографическим пособиям.

Редакции и издательства используют предметизацию при составлении прикнижных и прижурнальных вспомогательных указателей.

Вспомогательные указатели – упорядоченные путеводители, обеспечивающие быстрый поиск необходимой информации, заключенной в документе. В таких указателях список рубрик сопровождается номерами страниц, на которых помещен текст, соответствующий определенному предмету.

Аналогичные приемы предметизации распространяются на все виды вспомогательных алфавитных указателей, в том числе именные и географические.

Предметизация включает также процесс составления предметизационного информационно-поискового языка (ИПЯ), - искусственного языка, предназначенного для выражения основного содержания документа или информационного запроса посредством предметных рубрик. Такую предметизацию можно назвать лингвистической.

Органы ОНТИ используют данный метод для формирования рубрикаторов, информационно-поисковых тезаурусов, разработки вспомогательных указателей к информационным изданиям. Современные автоматизированные системы по существу лишь одна из разновидностей предметизационных систем.

Термин «предметизация» используется для обозначения процесса организации и ведения предметного каталога, картотеки, списка, указателя.

Итак, предметизация – многозначный термин, используемый для процесса индексирования документов, составления ИПЯ, формирования предметных ИПС и вспомогательных указателей ко многим видам первичных документов. Таким образом, можно вычленить три области применения предметизации:

- документную, предназначенную для индексирования документов;

- текстовую, способствующую дополнительному входу в содержание документа или ИПС по предметному признаку;

- лингвистическую, содействующую составлению вербальных ИПЯ.

В рамках АСПИ основное внимание уделяется рассмотрению документной предметизации. Главная задача предметизации как метода раскрытия содержания документа с помощью предметных рубрик – определение основного предмета произведения; установление аспектов его рассмотрения; фиксация его связей с другими предметами, отраженными как в тексте документа, так и в каталоге; указание формы и читательского назначения обрабатываемого документа.

Термин «предмет документа» - один из исходных и основополагающих для теории и практики всех видов индексирования.

Предмет в предметизации понимается весьма широко – это все, о чем в документе сообщается, то есть некоторая информация. Предмет раскрывает основную тему документа, его форму и читательское назначение.

Предмет документа – это все, что может быть объектом специального изучения: материальные вещи объективного мира в целом (человек, здание, машина); любые части вещей (сердце, фундамент, колеса) и их отдельные свойства, стороны, отношения (сердцебиение, бетонирование, размер); события, явления, факты, персоналии (Великая Отечественная война, снегопад, Л. Н. Толстой); отражение этих вещей в нашем сознании (ощущения, восприятия, представления, понятия); суждения, научные теории и т.д.

Предмет, интересующий пользователя, может формулироваться в произвольной форме с помощью любых слов естественного языка. В процессе предметизации эта форма преобразуется в предметную рубрику, формулируемую посредством специально разработанного предметизационного ИПЯ.

ГОСТ определяет термин «предметная рубрика» следующим образом:

«Предметная рубрика – элемент ИПЯ, представляющий собой краткую формулировку темы на естественном языке» (не указываются другие назначения).

Предметная рубрика – результат процесса предметизации, краткая формулировка факта, события, аспекта и т.п., рассматриваемого в документе, созданная на основе принципов и правил специально разработанного предметизационного ИПЯ.

Предмет, выявленный при анализе документа, отличается от предметной рубрики формой представления. Так, предмет учебника для основной школы «Азбука гражданина» можно сформулировать как «Права россиян», а рубрика на эту книгу будет выглядеть так: «Право – Российская Федерация – учебные издания для средней школы».

Рубрика – краткая формулировка темы конкретного документа, выраженная не только с помощью слов и словосочетаний естественного языка, но и цифрами и другими обозначениями, используемыми в естественном языке. Однако, ее не следует рассматривать только как нормализованную лексическую единицу естественного языка. Рубрики – это термины индексирования, поисковые, организующие, комплексирующие средства.

Таким образом, предметизатор должен определить предмет документа и преобразить его в предметную рубрику.

ГОСТ 7.74 – 96 «Информационно-поисковые языки: термины и определения» дает несколько определений, связанных с лингвистической предметизацией.

Предметизация – это предметное индексирование средствами языка предметных рубрик (или предметизационного ИПЯ).

Предметное индексирование – индексирование предметного содержания документов.

Документная предметизация – процесс представления содержания, формы и назначения документа посредством специально разработанных предметных рубрик.

Конечный результат процесса предметизации – поисковый образ документа (ПОД), представленный в виде предметной рубрики и оформленный в качестве элемента библиографической записи. При обработке специалисты имеют дело с рубриками как элементами ИПЯ и записи.

2. Предметизационный информационно-поисковый язык.

Качество любой ИПС, отражающей содержание документов, зависит от ИПЯ, с помощью которого система реализуется. Предметизационный язык или язык предметных рубрик (ЯПР) является искусственным информационно-поисковым языком, созданным на базе естественного языка и предназначенного для индексирования документов, частей документов и их совокупности, а также информационных запросов посредством ПР.

Основная задача ЯПР – наиболее полно раскрыть содержание той или иной предметной области в целом и отдельных ее разделов, то есть дать по возможности исчерпывающий перечень предметов науки (проблемы, темы), выразить взаимоотношения между ними. Массивы библиографических записей или первичных документов, сформированные по предметизационному признаку (предметные каталоги и картотеки, тематическая расстановка фонда), создаются на основе предметизационного языка или языка предметных рубрик.

ЯРП может быть представлен различными средствами, такими как «Словарь ПР», «Рубрикатор», «Алфавитный указатель ПР и ссылок», «Словарь предметного каталога», «Служебная картотека ПР», «Общий алфавитный ключ». В структуру ЯПР входит предисловие и алфавитный перечень предметных рубрик (словарь рубрик), организованных в продуманную систему с помощью ссылочно-справочного аппарата (ССА).

ЯПР относится к вербальным (словесным) ИПЯ, поскольку для представления своих ЛЕ в нем используются слова и выражения естественного языка, но имеющий существенные отличия. Словарь русского языка и словарь ПР содержат перечень слов в алфавитном порядке, но на этом их сходство заканчивается. Слова, представленные в ЯПР, проходят жесткий отбор из лексики естественного языка и формулируются по собственным правилам. Именно по этому ЯПР – искусственно созданный язык на основе естественного.

Естественный язык, с точки зрения информационного поиска обладает рядом недостатков, таких как многозначность и синонимичность, которые не позволяют производить однозначную запись содержания документов.

Формалзация лексики при создании предметных рубрик вызвана необходимостью устранения как «избыточности», так и «недостаточности» естественного языка для целей информационного поиска.

Важнейший принцип ЯПР – устранение синонимии, полисемии и омонимии для реализации «однозначности» информационного поиска.

1. Синонимия естественного языка – совпадение или близость значений различных слов. Например, желтуха – гепатит; формирование – создание – образование.

2. Полисемия – свойство какого-либо слова, имеющего одно или несколько этимологически близких значений, т.е. перенос названия с одного предмета на другой на основе сходства по форме, свойствам, функциям предметов. Ex. Звезда – геометрическая фигура, звезда – небесное тело, звезда морская.

3. Омонимия – внешнее совпадение слов, одинаковых по написанию и звучанию, но выражающих различные понятия. Ex. Родниковый ключ и замочный ключ; лук – оружие и лук овощ. (На речной косе девушка точила косу. Все было в девушке хорошо: и лицо, и стан, и длинная коса. Да жаль, была она коса.). Знание этих слов можно понять только из контекста.

Для различения омонимов в рубрику добавляют идентифицирующие признаки, заключенные в скобки, - локаторы. В качестве их могут использоваться понятия, характеризующие научные дисциплины, отрасль, этническую группу, язык, тип объекта, географическое название и т.д.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: