Свертывание в сфере информационного обслуживания

Свертывание в сфере информационного обслуживания является частным случаем информационного свертывания. Специфика лишь в том, что если при информационном свертывании в качестве объекта выступает, как правило, мыслительный образ некоторой непосредственной реальной (внешней или внутренней) ситуации, то при свертывании в сфере информационного обслуживания та же ситуация, но опосредованная документом автора (отправителя информации). И в том и в другом случае порождаются тексты.

Согласно Е. Агриколе (цит. по: [135]), процесс порождения текста представляет собой ступенчатое развертывание информации, заключенной в ядре (теме текста), а восприятие текста, напротив, выведение темы из конкретного текста. Одна и та же тема может быть реализована во многих текстах, которые могут рассматриваться как парафразы. Два текста считаются изотематическими парафразами, если они выводятся из одной темы, и сводимы к ней. Это положение охватывает не только тексты, имеющие одинаковый объем, но и разные объемы (экспресс-информация, резюме и др.), а также и совершенно различно построенные тексты1 в основе которых лежит одна тема.

В идеальном случае задача свертывания текста (документа) должна была бы сводиться к созданию ряда производных текстов (Т1, Т2, Т3), последовательно меньших по объему, чем исходный текст (Тисх), при сохранении их основного содержания: Тисх › Т1 › Т2 › Т3 и т, д. Однако такая процедура, к сожалению, дилеко не всегда возможна из-за характера текста в рамках какого-либо одного типа речи, не говоря уже о сложной (аспектной) структуре документа в целом.

В сфере информационного обслуживания свертывание (развертывание) информации рассматривается в трех его основных видах — документального (прежде всего библиотечно-библиографического) обслуживания, фактографического и концептографического. Теоретической базой свертывания (развертывания) в этих сферах информационного обслуживания соответственно являются такие, в частности, дисциплины социально-коммуникативного цикла, как библиотековедение и библиографоведение, фактография и концептография.11

Свертывание (развертывание) в этих областях информационного обслуживания сводится преимущественно к логико-лингвистическим преобразованиям текста (документа) с целью создании вторичного документа. При этом в случае свертывания преследуют цель уменьшения физического объема свертываемого документа с определенной потерей его информативности, а в случае развертывания — увеличение физического объема текста с некоторым приращением его информативности. В результате свертывания (развертывания) информации в указанных сферах информационного обслуживания образуются относительно самостоятельные ряды вторичных документов, совокупность которых представляет собой средство, «инструментарий», с помощью которого тот или иной вид обслуживания может функционировать.

Так, в сфере документального, библиотечно-библиографического, обслуживания сформировался ряд, включающий такие вторичные документы, как библиографическое описание, аннотация и библиографический обзор. Основная функция этого ряда вторичных документов — ориентация потребителей информации и документальном потоке. Вторичные документы, выполняющие эту функцию, раскрывают форму и содержание первичных документов с той степенью полноты и детальности, которая бы позволила, с одной стороны, достаточно точно идентифицировать документ в потоке, а с другой — потенциальному потребителю информации принять решение о целесообразности обращения к первичному документу.

3адача документов этого ряда (прежде всего аннотации как типичного представителя) — максимально полно отразить формальные признаки и тематическое содержание свертываемого документа на основе документографического (библиографического) анализа, подразделяющегося на учетно-регистрационной и тематический анализы.

Сущность учетно-регистрационного анализа сводится к фиксированию формальных признаков, заглавия и других элементов библиографического описания, тематического анализа — к описанию главных и второстепенных тем (аннотированию). Последнее заключается в выявлении в тексте первичных документов или в формулировании на основе их осмысления метаинформативных12 элементов. Можно сказать и так: тематический анализ заключается в формулировании и представлении на необходимом уровне свертывания (обобщения) субъектных элементов13 текста. Уровень детальности (точности) свертывания определяется размерами аннотируемого документа, его структурой, жанром и практическими соображениями (целевым и читательским назначением), но чаще свертывание в случае тематического анализа производится на уровне, близком к максимальному (макросвертывание).

В сфере фактографического обслуживания сформировался ряд, включающий такие вторичные документы, как фактографические описания (справки, таблицы, статьи в справочниках и энциклопедиях), рефераты, реферативные обзоры14 и др. Основная функция этого ряда вторичных документов — ориентация потребителей информации в информационном потоке (т. е. в некоторой совокупности фактов и концепций в принципе вне связи с конкретными первичными документами).

12 О метаинформацпи подробнее см. в разделе 2.1.

13 В качестве субъектных элементов текста могут выступать заглавия ко всему тексту, его разделам, абзацам и даже еще меньшим структурным единицам.

14Отнесение нами рефератов (и реферативных обзоров) к сфере фактографического обслуживания может вызвать у некоторых читателей недоумение, поскольку традиционно, на практике (например, в реферативном журнале) реферат всегда выполняет две функции — ориентации в документальном потоке (на основе библиографического описания и некоторых своих — метаинформативных элементов) и ориентации в информационных потоках (на основе содержащихся в нем фактов _и концепций). Некоторые специалисты (например, А. В.Соколов) по этой причине считают, что реферат — пограничный, гибридный (с точки зрения функций) вид вторичного документа. В действительности это чаще всего так и есть. Однако нами в данной работе реферат рассматривается с точки зрения не того, чем он часто является на практике, а того, что он есть как объект науки, т. е. как некоторая «идеальная модель» (подробнее о таком подходе см. в гл. 3). С последней, точки зрения, библиографическое описание, которым обычно предваряется реферат, играет вспомогательную роль. В принципе реферат как средство ориентации в информационном потоке, как средство описания некоторой экстралингвистической ситуации (на основе первичного документа) может вполне самостоятельно существовать и без библиографического описания (в то время как аннотация органически вытекает из библиографического описания, сама является частью его). Если говорить о пограничности, гибридности, то таким вторичным документом будет реферативная аннотация.

Задача документов этого ряда — максимально точно отразить факто-концептографическое содержание первичных документов. Степень полноты не зависит от размеров и особенностей первичного документа, а определяется преимущественно прагматическими соображениями, отсюда уровень свертывания в этих вторичных документах может быть нулевым либо близким к минимальному (микросвертывание).

Этот ряд вторичных документов образуется на основе фактографического анализа, сущность которого состоит в исследовании документов с целью извлечения из них фактов и концепций, релевантных читательскому назначению подготавливаемого вторичного документа. Фактографический анализ и синтез охватывают как субъектные, так и предикатные элементы текста.

Указанные ряды вторичных документов на практике часто пересекаются (соответственно пересекаются, дополняя друг друга, и виды анализов). Область пересечения этих рядов заполняют такие виды вторичных документов, как реферативная аннотация, реферативно-библиографический обзор и т. п., которые выполняют функции двух рядов одновременно.

Следует также отметить, что если библиографические вторичные документы образуют относительно замкнутый ряд, поскольку их потенциальное развертывание ограничивается рамками конкретного документа, то фактографические вторичные документы таких жестких рамок не имеют и могут при развертывании «переходить» в ряды первичных документов (текстов) с большим уровнем информативности.

В сфере концептографического обслуживания, под которым понимается формулирование и доведение до потребителей ситуативной информации, полученной в результате информационно-логического или концептографического анализа некоторой совокупности сообщений, сформировался ряд, включающий такие вторичные документы, как рекомендательные аннотации, «развернутые» рефераты, рецензии, аналитические обзоры и др.15 Основная функция этого ряда вторичных документов — интерпретированная ориентация потребителей в документальном и информационном потоке. При этом под интерпретированием понимается в данном случае не только высказывание суждений относительно анализируемых документов, фактов и концепций, но и развертывание — внесения в текст необходимых деталей, уточнений, пояснений и комментариев, обеспечивающих лучшее его понимание и восприятие.

Документы этого ряда образуются в результате не только документографического или фактографического анализов, но и анализа концептографического, предусматривающего исследование (на основе существующего знания) содержащихся в документах фактов и концепций с точки зрения их достоверности и истинности, а устройств, способов и материалов — с точки зрения непротиворечия знанию, лежащему в их основе, а также технико-экономической целесообразности, эффективности и перспективности.

Особым видом свертывания информации является и н д е к си рование — описание содержания и формы сообщений средствами того или иного информационного языка, в результате которого образуется поисковый образ данного сообщения;

Среди различных оснований для классификации видов индексирования 17 мы выделим здесь уровень интеграции (дезинтеграции) лексики естественного языка при построении лексических единиц информационно-поискового языка (ИПЯ). Согласно А. В. Соколову [124], существует три таких уровня: 1) уровень дезинтеграции, на котором в качестве лексических единиц ИПЯ выступают так называемые семантические множители, логическое произведение этих множителей образует в общем случае понятия, из которых «конструируется» затем тема или предмет индексируемого документа; 2) первый уровень интеграции, на котором в качестве лексических единиц выступают понятия (в частности, дескрипторы), из которых, так же как и в первом случае, «конструируется» тема или предмет документа; 3) второй уровень интеграции, на котором в качестве лексических единиц (рубрики предметных языков, УДК, ББК и пр.) выступают сами темы и предметы, которые формулируются в процессе создания языка (т. е. априорно, до индексирования документов). Таким образом, в первых двух случаях в качестве лексических единиц выступают упорядоченные перечни понятий, из которых в процессе свертывания формируется в поисковом образе на основе анализа смыслового содержания документа его тема (подтема) или предмет (предметы), в третьем случае мы уже имеем готовый перечень тем (предметов) и в процессе свертывания подводим содержание документа под ту или иную тему (или темы). Поскольку далеко не всегда тема (предмет) реального документа четко укладывается в априорно сформулированные рубрики (темы, предметы), на практике эта тема отражается лишь с большей или меньшей степенью смыслового приближения; чаще всего тема документа подводится под более широкую рубрику со всеми вытекающими отсюда следствиями относительно точности поиска.

Рассматриваемый нами аспект классификации видов индексирования на основе ИПЯ различного уровня интеграции (дезин­теграции) лексики представляет здесь интерес прежде всего с точки зрения использования этих языков в различных сферах информационного обслуживания. Так, если в сфере документального обслуживания для свертывания могут быть использованы ИПЯ всех уровней интеграции лексики, то для свертывания в сфере фактографического (и, возможно, концептографического) обслуживания языки второго уровня интеграции найти применения не могут. Наиболее перспективными ИПЯ в указанных сферах будут «языки понятий», т. е. первого уровня и дезинтеграционные.

Существенное различие между ИПЯ первого и второго уровней интеграции лексики заключается также в том, что первые (языки понятий) достаточно легко использовать для автоматизации процедуры индексирования. В этом случае индексирование идет от плана выражения к плану содержания. При использовании языков второго уровня интеграции (языков тем и предметов) процедура индексирования предполагает переход от плана со­держания (смысла) к плану выражения (рубрике), алгоритмиза­ция которого весьма затруднена.

Продолжая рассмотрение видов свертывания, следует остановиться также на информативном и метаинформативном свертывании.

Дихотомию информация—метаинформация, по-видимому, впервые в сферу информатики ввел Ю. А. Шрейдер [144, 145]. Согласно Шрейдеру, к информации относятся элементы текста, в которых отражается основное содержание текста и приводятся оригинальные точки зрения на это содержание, к метаинформацией — предложения, содержащие сведения о теме и организации данного текста, обеспечивающие доступ к собственно информации, являющиеся ключом к ее пониманию. Таким образом, «метаинформация» употребляется как обозначение информации об информации или, точнее, о способе кодирования информации. Метаинформацией в документах (или документальном потоке) будут поисковые индексы, оглавление, справочный аппарат, иногда введение, предисловие, комментарии, уточнения, логическая структура текста, способ организации фонда документов или отдельных фактов, правила «общения» с механизированными и автоматизированными информационными системами и многое другое. В ряде случаев документ в целом представляет собой метаинформацию о другом документе (например, библиографическое описание, аннотация, поисковый образ). Реферат (особенно реферативные аннотации) содержат в себе как метаинформацию о другом документе, так и элементы собственно информации из этого документа. Так, например, в реферативной аннотации № 2И227 (1977) из реферативного журнала (РЖ) «Информатика» заглавие, выходные данные, а также первая и вторая фразы содержат в себе метаинформацию о теме и содержании первичного документа, о его объеме и месте опубликования, величине пристатейной библиографии; третья и четвертая фразы — собственно информацию: в них содержится оценка предлагаемой методики.

2И227. Станиславская Э. В. Некоторые проблемы исследования пара­дигматики в ИПЯ. — В кн.: Проблемы оптимизации библиотечно-библио-графических классификаций. Л., 1976, с. 168—175.

(1) Одной из основных задач данного исследования является выявление зависимости системы парадигматических отношений от целей и задач, стоящих перед потребителем. (2) Описываются методика и эксперимент, позволившие проверить виды парадигматических отношений, подлежащих фиксированию в ИПЯ, и вскрыть факторы, влияющие на их установление. (3) Положительной стороной предлагаемой методики является простота и документальность, которые исключают трудоемкий процесс создания экспериментальной ИПС. (4) Другой положительной чертой является возможность изучения прагматических соображений потребителя, что помогает создать ИПС, гибко реагирующую на изменения информационных потребностей.

Библ. 9.

Следует, однако, учитывать, что каждая собственно информация и каждая метаинформация содержит в себе соответственно элементы метаинформации и информации: на основании отдельных фактов и концепций (т. е. информации) первичного документа или реферата можно составить некоторое представление о теме и содержании всего документа. И наоборот, констатация в тех или иных метаинформативных элементах текста факта проведения какого-либо исследования, выпуска изделия, разработки процесса или метода — все суть элементы информации, содержащейся в документах.

В каждом документе в зависимости от его целевого и читательского назначения должно быть оптимальное сочетание элементов информации и метаинформации. От этого зависит уровень восприятия данного документа, его информативность. В свою очередь в тезаурусе потребителя также должно соблюдаться определенное соответствие между запасом информации и метаинформации.

Это соответствие определяется требованиями компетенции, которым должен удовлетворять потребитель, относящийся к той или иной научной среде. Если потребитель не удовлетворяет этим требованиям, то в этом случае либо запас его метаинформации недостаточен и он не сумеет распознать структуру сообщения, взаимосвязи между его элементами, т. е. «раскодировать» содержание сообщения, либо априорный уровень тематических знаний (собственно информации) мал и тогда не произойдет содержательной перестройки тезауруса, т. е. количество воспринятой информации опять-таки будет минимальным.

Разделение информации и метаинформации имеет важное, по мнению Шрейдера, методологическое значение, так как позволяет достаточно четко отделить сферу информационной деятельности (как части научно-исследовательской) от сферы информационного обслуживания. Если первая имеет дело с содержательной обработкой научно-технической информации с целью получения новой информации или принятия управляющих решений в области своей профессиональной деятельности, то вторая занимается кодированием, хранением и распространением этой информации с помощью метаинформации. Шрейдер делает вывод, что именно метаинформация об информации представляет попой объект изучения информатики или что информатика есть наука о свойствах и способах получения и представления метаинформации.18 Из этого, однако, не следует, что изучение и подготовка метаинформации возможны без обращения к содержанию информационного сообщения.

Очевидно, что правильное сочетание собственно информации и метаинформации в отдельных текстах и информационных потоках в целом является необходимым условием для хорошей организации информационного обслуживания.

В связи с различением информации и метаинформации нами наделяются два подхода к свертыванию информации: метаинформативный и информативный. Первый (метаинформативное свертывание) предполагает создание ряда документов, основная цель которых — в той или иной степени раскрыть тему и содержание других документов. Назовем этот ряд библиографическим. К нему отнесем не только традиционные виды вторичных документов — библиографические описания, аннотации, библиографические обзоры, но и авторефераты диссертаций, предисловия и введения к книгам, программы учебных курсов, справочные аппараты изданий и др. Во всех этих документах, согласно терминологии Шрейдера, содержится «информация об информации». Более того, в качестве метаинформативных элементов могут выступать и отдельные фразы текста первичных документов — предваряющие, результирующие, обобщающие определенные фрагменты данного документа или его в целом. В них также «о снятом виде» содержится «информация об информации» в рассматриваемом контексте или документе (последнее более подробно освещено в разделе 3.5).

Второй подход (информативное свертывание) предполагает создание ряда документов, основная цель которых — служить непосредственным источником информации при решении определенных задач. Назовем этот ряд фактографическим. Он может включать в себя как первичные, так и вторичные документы различного уровня свертывания. Так, ряд фактографических первичных документов образует, например, цепочки: отчет, статья, краткие сообщения, информационный листок; фактографический ряд вторичных документов — рефераты типа экспресс- формация, информативные рефераты типа РЖ ВИНИТИ, самостоятельные фрагменты текстов, цитаты, фактографические справки, реферативные обзоры и другие документы, использование которых, как правило, не вызывает для определенной категории потребителей информации необходимости обращения к первоисточнику.

Таким образом, заключая данную главу, представляется возможным говорить о двух видах свертывания: научном, в ходе которого порождаются новые единицы знания, и информационном, связанном с текстовыми преобразованиями. Информационное свертывание в свою очередь разделяется на свертывание семантическое, сопровождающееся изменением информативности текста, и лексическое, сопровождающееся преобразованиями и плане выражения без изменения плана содержания.

Информационные виды свертывания используются в различных сферах информационного обслуживания при создании (и редактировании) как первичных, так и вторичных документов. При этом можно говорить об информационном свертывании (развертывании) как операции, лежащей в основе создания и редактирования первичных документов, о метаинформативном и информативном свертывании как операциях, лежащих в основе подготовки вторичных документов соответственно в сфере документального и фактографического обслуживания, наконец, об информативном и метаинформативном свертывании развертывании, лежащем в основе концептографического обслуживания.

Свертывание можно классифицировать и по ряду других критериев, например по степени формализации процесса — интуитивное, алгоритмизированное (анкетное в том числе), автоматизированное свертывание (о чем речь будет идти ниже); по количеству свертываемых документов — отдельных или некоторого множества (к примеру, реферат и реферативный обзор); по глубине (степени) свертывания (библиографическое описание, аннотация) и т. д. Однако наиболее важным основанием классификации видов свертывания, в результате которого образуются относительно самостоятельные параллельные ряды вторичных документов, обеспечивающих функционирование рассмотренных выше родов информационного обслуживания, является вид анализа — документографический, фактографический и концептографический. Виды свертывания и порождаемые на его основе документы приведены в табл. 1.1.

ГЛАВА 2 НЕКОТОРЫЕ ХАРАКТЕРИСТИКИ ТЕКСТА С ТОЧКИ ЗРЕНИЯ ЕГО СВЕРТЫВАНИЯ

В качестве объекта свертывания в нашей работе выступают тексты, прежде всего научно-технические. Качественные харак­теристики текстов, их структура определяют специфические требо­вания к свертыванию, в результате которого образуются также тексты.

Вплоть до 60-х годов нашего столетия для аналитико-синтетической переработки информации характерен был прежде всего содержательный, качественный подход к тексту. Документ анализировался преимущественно с точки зрения жанра, целевого и читательского назначения, вида издания, актуальности, оперативности и полноты содержащейся в нем информации. Такой подход был свойствен для библиографического и редакторского отношения к документу (шире — книговедческого). Интерес к тексту как к сложному структурно-многоуровневому и многоплановому явлению возник прежде всего в связи с попытками применения формализованных (машинных) методов обработки; информации (машинного индексирования, реферирования, перевода и пр.). Текст стал объектом пристального внимания не только стилистов, литературоведов, библиотековедов и книговедов, но и лингвистов, психологов, кибернетиков, информатикой. Проблематика текста выдвинулась на одно из первых мест в языков знании, в рамках которого сформировалось новое направление — лингвистика текста, поставившая перед собой задачу, по словам Р. Харвега [153], «найти текстообразующие закономерности, присущие всем текстам». Итак, прежде всего, что же понимается под текстом?

2.1. ТЕКСТ И ЕГО ОБЩАЯ ХАРАКТЕРИСТИКА

Как часто бывает, наибольшие трудности возникают при стремлении сформулировать «само собой разумеющиеся» понятия. К таким, вероятно, относится и понятие «текст». Дефиниции «текст», по-видимому, столько, сколько и авторов, предпринимавших попытки дать этому явлению определение. Из широкого спектра дефиниций достаточно привести несколько, лежащих на крайних флангах семиотики, чтобы показать, сколь различны могут быть подходы авторов к формулировке этого понятия.

1. Текст — это знак, обладающий некоторой внутренней структурой. Или: текст — это четверка из словаря V, множества мест М набора отношений на этом множестве <р и отображения в множества мест в словаре [143]. Символически это записывается следующим образом: Т=<У, М, Т1,..., «р.,»>. Так трактуют текст сторонники формализованного подхода к определению.

2. Текст — это изложенное в письменной или печатной форме, логически стройное и грамматически правильное авторское сочинение или высказывание [67]. Или: последовательность из нескольких (или многих) предложений, построенных согласно правилам языка [21]. Так трактуют текст представители умеренно гуманитарного фланга.

Естественно, что приведенные формулировки «текста» попросту несопоставимы, поскольку являются элементами различных систем, но даже если рассматривать существующие определения понятия «текст» в рамках одной какой-либо системы (логической, семантической, грамматической и т. д.), то и здесь обнаружим самое цветистое разнообразие определении.

Не вдаваясь в анализ приведенных выше дефиниции (как и многих других), поскольку авторы в своих определениях исходили из стоящих перед ними задач, мы (также руководствуясь своими задачами) будем придерживаться самого тривиального определения, согласно которому т е к с т – это линейная последовательность знаков, обладающая смыслом. Для того чтобы такая последовательность обладала смыслом, она должна содержать в себе суждение — либо логическое, либо текстовое. По этой причине в качестве текста может выступать как отдельное предложение,1 так и их совокупность, в которой одни предложения выражают предмет речи (текстовой субъект), а другие – информацию об этом предмете (текстовой предикат).

В качестве элементов линейной последовательности выступают в случае естественных языков знаки — слова и устойчивые словосочетания (элементы текста I лингвистического уровня), знаки-предложения3 (элементы текста II лингвистического уровня),

Всякое суждение выражается в предложении, но не всякое предложение выражает суждение.

2 Отсюда следует что не всякая совокупность предложении, в нашем „снимании, образует текст, а только такая, в которой одни (одно) предложения выражают предмет речи, а другие — предикат.

3 Понятие «предложение» понимается нами как минимальная целостная единица речи, обладающая смысловой законченностью. Поскольку единого определения понятия «предложение» еще не существует, мы под предложением будем понимать прежде всего речевое образование, синонимичное словам «суждение», «высказывание», «фраза». Вообще говоря, предложение, видимо, следует рассматривать в трех аспектах - синтаксическом, семантическом и прагматическом. С точки зрения синтаксиса предложение – это то, что «от точки до точки»; с, точки зрения семантики предложение – речевая единица любой протяженности, в рамках которой возможны «разумные» коннекторные связи. При этом непринципиально, сколько синтаксически понимаемых предложений такое речевое образование будет включать, важно только, чтобы в смысловом плане это образование представляло бы собой граф с общей вершиной. Наконец, с точки зрения прагматики предложения — такие речевые образования, которые позволяют оптимально воспринимать и осмысливать текст. Из психологии известно, что точка в конце речевого образования — сигнал законченности определенного «кванта» мысли, дающий «команду» для осмысления данного образования и ввода его в «оперативную память». Текст, правильно (с учетом читательского назначения) квантированный в синтаксическом плане, наиболее легко воспринимаем. В противном случае каждый из нас в процессе чтения разбивает интуитивно речевые образования на отрезки-предложения, удобные для собственного восприятия.

4 Проблема «значения и смысла», рассматриваемая здесь, принадлежит к числу древнейших. От античных стоиков через У. Оккама к Т. Гоббсу, |Г. Фреге, Ч. Пирсу, Р. Карнапу, к многочисленным современным исследователям прослеживается путь, на котором непосредственно или попутно затрагивалась эта проблема. Даже очень краткий обзор на эту тему показал бы, I что у каждого из авторов свое видение, свое толкование указанных понятий,,] в большей или меньшей степени пересекающееся, но редко полностью] совпадающее: в одних случаях эти понятия вообще не различаются, в других — значение определяется через смысл, а смысл — через значение Я в третьих — значение рассматривается как «общее для всех членов общества знание», а смысл — как личностное отношение индивида к содержанию слова, в четвертых — смысл характеризует семантику целого высказывания или текста, а значение — семантику только слова, в пятых — смысл как совокупность внеязыковых характеристик суждения, а значение как обобщение его внутриязыковых характеристик, в шестых... Мы будем придерживаться четвертой точки зрения. И. Р. Гальперин в [30], помимо семантических единиц «смысл» и «значение», трактуемых им примерно в нашем понимании, вводит еще понятие «содержание», которое соотносит с информацией, «заключенной в тексте в целом» [с. 20]. Введение такой дополнительной семантической единицы представляется нам целесообразным, однако в нашей работе она, к сожалению, не была употреблена.

5 Чтобы убедиться, насколько подобные «рабочие» определения отягощены в действительности грузом обыденного «здравого смысла», достаточно обратиться, например, к работе [147].

знаки — сложные синтаксические целые (элементы текста II лингвистического уровня).

Одним из исходных понятий текста, как широко известно,
является знак. Под знаком будем понимать чувственно воспринимаемый (материальный) объект, который условно представляет некоторый предмет, явление, свойство, связь или отношение предметов, явлений и свойств [67]. Основная его задача — обозначить нечто за пределами языка и дать этому нечто знаковую жизнь. Можно сказать и так: знак — это форма фиксации содержания знания и средство передачи содержания информации. Элементарным знаком считается наименьшая единица языка, имеющая значение. Отсюда отдельные буквы алфавита в естественном языке элементарными знаками обычно не являются (если они в свою очередь не являются знаком знака). Элементарный знак — это прежде всего слово и устойчивое словосочетание. Знаки, составляемые из элементарных знаков по правилам синтаксиса, образуют тексты.

Вербальное выражение знака в естественном языке назовем именем.

С точки зрения семантики знак обозначает денотат (нечто за пределами знака) и выражает концепт (то, что мы знаем об этом нечто). Один и тот же денотат может иметь несколько имен (слов) — явление синонимии знаков, с другой стороны, один и тот же знак (слово) может обозначать несколько денотатов (омонимия). И в каждом из этих случаев он будет иметь свое значение (свой концепт).

Основной характеристикой знака является его значение. Значение знака — это содержание, закрепившееся за ним в определенной лексико-семантической системе языка (результат социального опыта). М. В. Арапов и др. [4] указывают, что все говорящие на данном языке несколько по-разному употребляют слова этого языка. Эти различия определяются воспитанием, образовательным цензом, региональными особенностями и другими факторами, однако они (различия) не выходят за границы некоторой нормы. Эта норма «вариативности» (понимания) может быть различной для отдельных слов, но подразумевает для каждого из них некоторый инвариант употребления (общепринятое значение).

Таким образом, значение знака (слова) определяется употреблением его в некоторой знаковой системе — языке и знак может иметь в этой системе несколько значений (например, слово автоматический и как самодействующий, и как машинальный, непроизвольный).

Конкретное значение слово (знак) приобретает в лингвистической системе другого уровня — тексте, высказывании, предложении, т. е. в определенной речевой ситуации. Еще Оккам указывал, что значение термина всецело определяется его функцией в высказывании. Так, слово вентиль имеет в системе языка (в словаре) несколько значений (по числу реальных денотатов): как элемент духового инструмента, трубопроводный кран, электрическое устройство и др. Включенное в лингвистическую систему другого уровня (текст) это слово приобретает конкретное значение, определяемое данной речевой ситуацией. Например: Пользуясь вентилем, исполнитель извлекает натуральный звукоряд на другой высоте.

В отличие от «значения» «смысл» — семантическая категория иного (II, III) лингвистического уровня. Смысл непосредственно связан с текстом. Выше уже говорилось, что текст — это линейная последовательность знаков, обладающая смыслом, и для этого она должна содержать в себе либо логическое, либо текстовое суждение (субъект и предикат, или тему и рему). В качестве рабочего 5 примем следующее определение: смысл — это отражение в нашем сознании содержания связи и отношений между предметами и явлениями реального мира, или отражение содержания смысла.

В элементарном виде смысл в речи выражается в виде трехчленной формулы — подлежащего, сказуемого и связки. Так, выражение Красный дом смыслом не обладает (есть только значение), в выражении Дом красный смысл содержится. То же можно сказать и о конструкциях более развернутых. Так, заглавие «Субстанция и атрибутивные категории системного исследования» или рубрика УДК «Электродвигатели тяговые однофазные коллекторные переменного тока» имеют, с нашей точки зрения, лишь значение, но не смысл.

На трехкомпонентность элементарного смысла обращал внимание еще И. М. Сеченов: «...предметная мысль отображает не просто изолированные объекты, а предметные отношения. Отношения же по самой своей природе минимум двухкомпонентны. Раскрытие отношений, в свою очередь, требует сопоставления этих двух компонентов, или соотносящихся объектов. Тем самым в структурной формуле речевой оболочки мысли должны быть представлены эквиваленты не только самих соотносящихся объектов, но и эквивалент акта их соотнесения» (цит. по: [28, с. 67]).

Мысль о зависимости конкретного значения слова от смысла высказывания выдвигалась неоднократно и после Оккама (например, Дж. Локком, И. Гердером). На это обращает внимание и А. А. Леонтьев в [85]. Определяя высказывание в качестве минимальной единицы смысла, он пишет: «... само высказывание выступает не только как конструктивное целое, но и как смысловая перспектива (Р. А. Будагов), на фоне которой каждое отдельное слово определяется и уточняется в своем значении. Слово в высказывании не тождественно слову как отдельно взятой номинативной единице». Все это безусловно так. Нам только представляется, что в ряде случаев значение слова может проявляться и в лингвистических конструкциях, меньших (точнее, более простых), чем высказывание, например в лексических синтагмах. Поэтому, возможно, правильнее было бы говорить, что значение слова определяется ситуацией (как речевой, так и неречевой).

В противном случае как можем мы понимать значение выражений, не имеющих форму высказывания? Например, те же заголовки или рубрики УДК, примеры которых приведены выше. Впрочем, здесь мы находимся в плену известного «порочного круга», когда смысл текста вроде бы выводится из значений компонентов, а значение компонентов определяется смыслом текста...

Отнесенность понятий «значение» и «смысл» к различным лингвистическим уровням обращает наше внимание на явление, имеющее важное практическое значение. Известно, что каждый из уровней (фонетический, лексический, синтаксический) обладает некоторой автономией, выражающейся в том, что свойства единиц одного уровня невыводимы непосредственно из свойств единиц другого. Из этого, в частности, следует, что смысл конкретного предложения далеко не всегда можно вывести из простой совокупности значений, входящих в него слов. Или, иными словами, совокупность значений отдельных слов необязательно равна смыслу предложения (иногда эта «совокупность» может иметь и противоположный смысл). На это указывает, в частности, и [126]: «Смысл порождается с помощью значений, но не сводится ни к отдельным значениям, ни к их сумме... Сама мысль есть почто большее, чем сумма языковых значений...» В случае же индексирования мы стремимся с помощью текстовых единиц I лингвистического уровня моделировать в поисковом образе единицы II и III лингвистических уровней, т. е. с помощью отдельных ключевых слов и классификационных рубрик (значений) выразить смысл не только отдельных предложений, но и всего текста в целом. Естественно, что подобное моделирование не всегда достигает успеха, а отсюда и неизбежный поисковый шум.

Далее, автор (коммуникант), пытаясь выразить мысль при помощи тех или иных лексических конструкций, вкладывает в высказывание один смысл. Но включив высказывание в коммуникативный процесс, он уже теряет право на его однозначное толкование 6 (особенно это характерно для абстрактных рассуждений и в еще большей степени для поэтической речи). Чтобы конкретизировать смысл предложения, придать ему по возможности однозначность, автор включает его в контекст — развертывает, уточняет смысл высказывания с помощью других высказываний.

Таким образом, и здесь мы сталкиваемся с подобным явлением: сумма смыслов отдельных предложений не равна смыслу текста в целом. Взятая вне контекста, вырванная из текста фраза, как хорошо известно, может иметь иной смысл, чем смысл фрагмента в целом.

Эту особенность текстовых элементов различного уровня приходится учитывать при попытках формализованного (машинного, а также и интеллектуального) получения вторичных документов методом экстрагирования отдельных фраз, совокупность которых образует так называемый машинный реферат (квазиреферат). Извлеченные из текста первоисточника тем или иным способом на основе формальных признаков, фразы могут иногда значительно отличаться по смыслу от идентифицируемых ими фрагментов текста и документа в целом.

Знание, информация, информативность. Выше уже указывалось, что знак можно рассматривать как форму фиксации содержания знания и передачи содержания информации. Тем самым мы хотели обратить внимание на двойственную — статическую и динамическую — функцию знака. В первом случае знак имеет два плана: план выражения и план содержания (область семан­тики); во втором — в знаке обнаруживается третий план — план интерпретации знака потребителем (сфера прагматики) [108].

Знак в статике – это текст, фиксирующий некоторое значение.

Знак в динамике (в процессе коммуникации, восприятия) – это сообщение, несущее потенциально некоторую информацию.

В литературе понятия «знание» и «информация» употребляются часто как синонимичные, тем не менее нам представляется, что их следует различать. В нашем случае — чтобы определить понятие «информативность», трактуемое в разных источниках по-разному.

Итак, знание есть результат, с одной стороны, осмысления субъектом взаимосвязей предметов и явлений объективного мира (внутреннее знание), с другой — выражения этих взаимосвязей в знаковой форме (внешнее знание).

Феномену «информация» посвящена, как известно, обширная литература, в которой выстроен достаточно длинный ряд определений этого в общем-то полисемичного слова. Автор не рискует добавлять к этому ряду еще одно определение. Тем не менее свое понимание этого феномена он высказать должен. В самом общем смысле, информация есть нечто (отраженное разнообразие или что-нибудь еще), воздействующее на организованную систему и интерпретированное ею. Информация социальная, т. е. передающаяся в процессе общения людей, есть сведения (в широком смысле этого слова), имеющие знаковую форму и вызывающие перестройку индивидуального тезауруса. Или так: это есть нечто, проявляющееся в результате взаимодействия индивидуального тезауруса со знаком и основанное на запоминании.

Здесь следует уточнить: а) особенности строения белка (или нуклеиновых кислот) таковы, что в процессе воздействия он закрепляет в своей структуре следы этих взаимодействий, «запоминает» их и при последующих воздействиях способен «оценивать» их (узнавать, интерпретировать). Узнавание, основанное на запоминании, осуществляется на всех уровнях органических систем, начиная с «белково-нуклеинового узнавания» вплоть до сознательной деятельности человека. Отсюда воздействие в форме сигнала, не узнанное и не проинтерпретированное си­стемой, не будет информацией; б) любое воздействие и любое отражение вне знаковой формы имеет физическую, а не информационную природу. Мы ничего не можем познать, не придав этому нечто знаковой формы, а следовательно, и не наделив это нечто значением; в) структурная перестройка тезауруса субъекта возможна лишь в том случае, если знаковое воздействие (допустим, текст) будет «нетривиальным», т. е. в какой-то степени новым, для тезауруса; г) такое знаковое воздействие, т. е. вызвавшее перестройку тезауруса, является информацией, которая после перестройки становится знанием субъекта (внутренним знанием).

Здесь уместно привести удачное уточнение, сделанное С. Д. Коготковым к известной формуле «информация как отраженное разнообразие». Он считает, что информация — это отражаемое разнообразие. Отраженное разнообразие — это уже внутреннее знание реципиента.

Д. И. Дубровский в [43] выделяет три формы существования информации «в индивидуально-социальном контуре»: 1) внутриличностную (которая представлена психикой человека), 2) межличностную, связанную с внешней коммуникацией субъектов, и 3) внеличностную,8 к которой относятся «„не потребляемые", не используемые в данный момент продукты производственной деятельности, знаковые системы...» [43, с. 168]. Вкладываемое нами содержание в понятие «информация» охватывает лишь часть первой формы существования информации — внутриличностной; все остальные формы существования информации, с нашей точки зрения, суть знания. Отсюда можно рассматривать информацию как ту часть знания, содержащегося в сообщении, которая вызывает перестройку тезауруса. Естественно, что для различных тезаурусов одно и то же сообщение будет содержать в себе различное количество информации.9

В работе К. В. Казанцевой и А. Д. Урсула [55] предлагается различать информацию (научную) в широком смысле и в узком. В широком смысле информация, согласно [55], это знание — «продукт общественно-трудовой и мыслительной деятельности, представляющий идеальное воспроизведение в языковой форме объективных, закономерных связей практически преобразуемого объективного мира», т. е. здесь информация есть результат отражения, результат научно-исследовательской деятельности. В процессе передачи информация в широком смысле (или знание) превращается в научную и техническую информацию в узком смысле (предмет деятельности информационных служб). «В одном случае мы имеем дело с научной информацией как знанием (широкий смысл), в другом — с научной информацией как НТИ, выступающей уже предметом и в определенном смысле результатом... научно-информационной деятельности» [55]. Таким образом, зна­ние как результат научной деятельности — это информация в широком смысле, знание как «предмет» передачи в системе научных коммуникаций — это информация в узком смысле.

7 В этой связи хотелось бы высказать несогласие с мнением [54]; автор предлагает саму информацию рассматривать не только в процессе передачи (в динамике), но и в качестве субстанции, обособленной, отвлеченной от процесса передачи (в статике). В нашем понимании вне процесса коммуникации, передачи (восприятия) знак несет не информацию, а знание.

8 Мы считаем, что между межличностной и внеличностной формами ин­формации нет принципиальной разницы и потому вряд ли есть смысл в та­ком разделении.

6 В связи с проблемой соотношения понятий «знание» и «информация» нередко поднимается вопрос о соотношении этих терминов с понятием «данные». С нашей точки зрения, данные могут выступать в качестве как элемента знания, так и информации — в зависимости от того, какую позицию они (данные) занимают по отношению к индивидуальному тезаурусу. Более продуктивным представляется нам различение понятий «данные» и «факты» (последние как достоверные данные), однако и такое различие, как указыва­ется в [95], имеет больше теоретическое, чем практическое значение.

Обычно, когда мы говорим о широком или узком понимании того или иного термина, мы имеем дело с двумя сущностями не получившими еще своего четкого выражения. В таких случаях как правило, и возникают те досадные неувязки, которые мешают «разложиться научному пасьянсу». Информационная практика может оперировать с привычным ей уже термином «научно-техническая информация» (знание, понимаемое [55] в узком смысле); Это допустимо. Информатике как науке следует быть «щепетильнее», и предметом ее изучения выступать должна не только и не столько информация (в узком или широком смысле), сколько знание, которое и записывается, и хранится, и передается, и преобразуется в системе научных коммуникаций.

Итак, если представить себе коммуникативный процесс в сфере информационного обслуживания в виде традиционной трехзвенной цепочки (т. е. в рамках формальных коммуникаций), то можно следующим образом проследить путь передачи знания: коммуниканты порождают высказывания,10 в которых выражаются, фиксируются их внутренние знания о каком-то фрагменте (ситуации) реального мира. Эти высказывания в виде текстов, несущих: уже внешнее знание, поступают к информантам и после определенной обработки (редактирования, свертывания и т. п.) включаются в систему коммуникаций. Реципиентами эти тексты воспринимаются как сообщения. Если в этих сообщениях содержатся знания, способные изменить структуру тезауруса реципиента, сообщение становится информационным. Информация (определенное ее количество), составляющая некоторую часть знания, со­держащегося в сообщении, превращается снова во внутренние знания, но уже реципиента.

Во всех этих переходах знание (и информация) остается кате­горией идеальной, но в случае внутреннего знания — субъективной реальностью, в случае внешнего знания — реальностью объективной.

Выше рассматривался процесс передачи знаний, но, строго говоря, никакой буквальной передачи не существует. Если допустить определенную аналогию между понятием «мысль» и «знание» (и информация), то, следуя В. М. Солнцеву [108], можно сказать, что мысль не передается (передаются знаки). В голове воспринимающего речь появляется не переданная ему извне мысль, а своя собственная, но аналогичная (в случае взаимопонимания) мысли коммуниканта. Отсюда «передача мысли» (а следовательно, знания и информации) не более как метафора. Мысль не передается буквально, она лишь резонансно возбуждается.

Приведенное здесь толкование термина «информация» (и его отличие от знания) носит, возможно, чересчур узкий характер. Оно не только «замкнуто» в сфере психики, но и связано непосредственно лишь с процессом восприятия сообщения. Такое толкование значительно отличается от «житейского», применяемого в литературе по информатике и библиотековедению. В дальнейшем, кроме случаев специально оговариваемых, мы также будем придерживаться житейской трактовки информации как совокупности текстов, передаваемых по каналам информационных коммуникаций, в том числе и подвергающихся аналитико-синтетической переработке.

В отличие от субъективной реальности — информации, количество которой мы потенциально можем измерить лишь по степени изменения структуры индивидуального тезауруса [146], существует понятие информативность — объективная реальность, характеризующая степень разнообразия двух или более текстов, имеющих один денотат.11 Различные сообщения обладают различной информативностью не по отношению к какому-либо индивидуальному тезаурусу, а лишь по отношению друг к другу. Таким образом, информативность — свойство не информации (а следовательно, и не сообщения), а свойство знания (текста). Помимо информативности, знания характеризуются также содержательностью — мерой воздействия на структуру общественного тезауруса.12 Чем богаче знание в своих следствиях, предсказаниях, приложениях, тем оно содержательнее.

По мере познания (изучения, создания) некоторого объекта порождается цепочка текстов, отражающих определенный этап познания этого объекта. Иногда в литературе подобную цепочку называют «документальным сопровождением» развития научно-технического объекта. Звенья этой цепочки — различные виды

10 В данном случае под высказыванием мы понимаем не предложение, какого-либо языка, оцениваемое лишь с точки зрения его истинности (как принято в логике), а как продукт речевой деятельности, обладающий смыслом (необязательно минимальным). Рассмотрение одного и того же знака в трех «лицах» — знак-высказывание, знак-текст, знак-сообщение — чисто; условие, чтобы подчеркнуть различное отношение к знаку со стороны участников коммуникативного процесса.

11 Излагаемая здесь точка зрения на информативность противоречит мнениям многих авторов. Например, Г. Г. Воробьев [29] понимает под информативностью «то количество информации, которое извлекает из документа конкретный потребитель» (с. 56); Т. М. Дридзе [42]: «Под информативностью имеется в виду потенциальная интерпретационная характеристика текста, в известной степени позволяющая прогнозировать меру адекватности смыслового восприятия»; А. В. Соколов и В. П. Леонов под информативностью понимают свойство информационных сообщений удовлетворять информационные потребности и интересы. Она зависит от большого числа факторов, которые делятся на две группы: факторы, влияющие на содержание сообщения, и факторы, определяющие его полезность для данного потребителя. Нетрудно заметить, что во всех перечисленных выше случаях информативность связывается с реакцией потребителя на сообщение и по сути дела отождествляется с количеством воспринятой им информации.

12 «Общественный тезаурус» не менее абстрактное понятие, чем «тезаурус индивидуальный», оно включает в себя то, что известно всему человечеству, но не известно в полном объеме ни одному человеку.

документов (D) (в частном случае это могут быть патентные описания, отчеты о НИОКР, статьи, монографии...) — отличаются друг от друга уровнем содержательности (в),13 т. е. уровнем познания (создания) данного объекта: /\ < 0$г < Г>ъъ... (здесь каждое последующее звено более содержательно, чем предыдущее).

Различающиеся по уровню содержательности тексты D1,D2 и т. д. могут в системе коммуникации порождать в свою очередь цепочки других текстов, различающихся уже не по содержательности, а по уровню информативности (с1п) и метаинформативности (Ат) (или по уровню информативного и метаинформативного свертывания).

В первом случае формируется, к примеру, цепочка текстов „вида / -> йя, < о1 < д,„а. ■. < й„х. Так, информация, связанная с каким-либо изобретением и фиксирующая определенный момент в развитии того или иного научно-технического объекта, может быть отражена не только в описании к авторскому свидетельству, но и в кратком журнальном сообщении, в статье научно-технического сборника, в брошюре по обмену опытом, информационном листке, в популярной газетной заметке, в руководстве, обзоре и т. д. — везде на различном уровне информативности (или информативного свертывания). Подобное явление (когда одни и те же сведения, отражающие определенный этап в развитии объекта, на различном уровне свернутости публикуются в различных видах документов) названо нами «расслоением» документального потока — явление, которое вызвано к жизни в свою очередь функциональным расслоением информационной потребности и которое обусловило значительную избыточность современного документального потока.

Во втором случае формируется цепочка текстов вида/?е3->йт, <С < о1т, < о1„,3... о1тх, где каждый последующий текст отличается от предыдущего уровнем метаинформативности (например, заглавие, поисковый образ, аннотация 1, аннотация 2... и т. п.).

Если руководствоваться приведенными выше рассуждениями, то между документами, различающимися по уровню информативности (независимо от того, к числу каких — первичных или вторичных — отнесла их традиция), нет принципиальной разницы. Так, статья, краткое сообщение, реферат, информационный листок и фактографическая справка могут находиться в одной це­почке документов (различающихся лишь уровнем информативного свертывания).

Таким образом, об информативности текста можно говорить лишь в сопоставлении его с другим текстом или текстами, имеющими общий денотат.

Если вернуться к упомянутой выше трехзвенной структуре коммуникативного процесса, то можно задаться вопросом, каково отношение каждого из элементов этой трехзвенной цепи к знаку, с какой точки зрения оценивает знак коммуникант, информант и реципиент? Для коммуниканта, как уже указывалось, знак выступает в качестве высказывания и его оценка ведется им с точки прения содержательности, т. е. соответствия уровню развитости общественного тезауруса (или соответствия общественной информационной потребности). Для реципиента знак выступает в качестве сообщения и его оценка ведется им с точки зрения количества содержащейся в сообщении информации: насколько имеющиеся в нем знания удовлетворяют индивидуальную информационную потребность реципиента.

Такой подход к пониманию информации совпадает в известной степени с подходом Ю. А. Шрейдера и противоречит [951. По мнению авторов [95, с. 98], «семантическая ценность научной информации, содержащейся в каком-либо сообщении, может измеряться только относительно общечеловеческого, а не индивидуального тезауруса». Нетрудно видеть, что, согласно нашей концепции, измеряться относительно общечеловеческого тезауруса может знание, а не информация.

Для информанта знак выступает в качестве текста, и его оценка ведется им с точки зрения информативности данного текста по сравнению с другим текстом (имеющим общий денотат). Если в качестве информанта, допустим, выступает редактор, он сравнивает (оценивает) редактируемый текст (Т1) с некоторым гипотетическим текстом (Т2), который в качестве модели все время присутствует у него в голове, и оценивает на информативность Т1 по отношению к Т2. Если в качестве информанта выступает, например, референт, он оценивает на информативность вторичный документ по сравнению с реферируемым им первичным документом (и тем самым оценивает свою работу).

Естественно, что определять информативность вторичных документов может не только референт, но и любой другой информант, т. е. лицо, не находящееся в позиции реципиента. Последний рассматривает текст в качестве источника информации, необходимой либо для принятия решения, либо достройки психологической модели «разрабатываемого» объекта, либо удовлетворения информационного интереса (чем, пожалуй, и исчерпываются основные ситуации, вызывающие потребность в информации).

Разумеется также, что, реферируя документ, информант руководствуется не только категорией информативности, но и идеологической направленностью документа, новизной, содержательностью, соответствием целевому и читательскому назначению и др.; может он при этом почерпнуть и некоторое количество информации (если документ окажется в русле его интересов), однако прежде всего, выполняя этот процесс, информант будет руководствоваться информативностью.

Итак, в рамках своей профессиональной деятельности информант имеет дело не с информацией и не с информационным сообщением, а со знанием, которое содержится в тексте, руководству при этом свойством информативности.

2.2. СТРУКТУРЫ ТЕКСТА

Выше уже упоминалось, что текст представляет собой многоуровневую систему, причем не только в рассмотренном семиотическом аспекте: знак-слово, знак-предложение, знак — сложное синтаксическое целое, но и с точки зрения других измерений – его синтаксической структуры, коммуникативной, семантической, информативной и др. Рассмотрение текста с точки зрения перечисленных структур позволяет нам во многих случаях решить вопрос о форме свертывания (да и самой возможности свертывания) тех или иных структурных составляющих текста, выработать наиболее адекватную стратегию свертывания.

2.2.1. Синтаксическая структура текст

«Традиционная» лингвистика, примерно до конца 40-х годов нашего столетия, не выходила за рамки предложения. Текст как сложное синтаксическое целое изучался лишь литературоведами и стилистами. С 50-х годов в рамках научных направлений, по-разному себя называвших — «металингвистика» (М. М. Балтии), «транслингвистика» (С. Барета), «анализ речи» (3. Харрис), лингвистика текста, синтаксис текста, супрасинтаксис,14 все большее внимание начинают уделять изучению текстов, занимающих промежуточное положение между предложением и целым текстом (статьей, главой, разделом, параграфом и т. п.). Помимо прочего, объясняется это, в частности, тем, что текст как документ в целом представляет собой семантическое образование, слишком избыточное и громоздкое с точки зрения удовлетворения некоторых информационных потребностей отдельных категорий читателей. С другой стороны, мысль реализуется очень часто в речевых единицах значительно больших, чем предложение.

Текст с точки зрения его синтаксической структуры представляет собой сложную многоуровневую систему суперсинтаксических единиц, отличающихся друг от друга «масштабностью» своих микротем. В литературе эти суперсинтаксические единицы называются по-разному — «сложное синтаксическое целое», «суперсиннксическое единство», «прозаическая строфа», «сверхфразовое единство», «сегмент», «суперсегмент», «субтекст» и др.

В данной работе синтаксическую единицу, большую, чем предложение, будем называть «сложное синтаксическое целое» (ССЦ), под которым понимают (например, [136]) логически обусловленную, формально самостоятельную, синтаксически и семантически спаянную и функционально завершенную единицу языка. ССЦ является основной информативной и синтаксической единицей научного стиля.

Иногда ССЦ отождествляют с абзацем. Тем не менее это разные категории: абзац — семантико-стилистическая категория, и ССЦ — категория синтаксиса текста. Иногда ССЦ может совпадать с абзацем, иногда в одном абзаце обнаруживается несколько ССЦ, чаще несколько абзацев составляют одно ССЦ. Могут быть случаи, когда ССЦ состоит из одного предложения (формулировки, крылатые выражения).

ССЦ, в соответствии с [51], подразделяются на сверхфразовые единства и линейно-синтаксические цепи. ССЦ, обладающее одной микротемой, будем называть сегментом, а включающее в себя два и более сегмента (цепочку сегментов, находящихся иногда в различных иерархических отношениях), образующих минитему документа, суперсегментом.

Для сверхфразового единства (СФЕ), согласно [51], характерна отнесенность его к какому-либо одному речевому типу. Первое предложение СФЕ всегда автосемантично,15 т. е. самостоятельно, и имеет твердое начало (начинается с существительного-подлежащего или группы подлежащего), другие предложения этого единства синсемантичны, несамостоятельны, и характеризуются мягкими началами (сочинительный союз или глагол-сказуемое в начале предложения, наличие указательных, притяжательных или личных 3-го лица местоимений, местоименных наречий, неполнота предложения). Таким образом, «левой границей» СФЕ служит твер­дое начало, «правой границей» — твердое начало, которое впервые появляется после мягких начал, либо мягкое начало, относящееся к другому речевому типу.

Линейно-синтаксическая цепь (также согласно [51 ]) представляет собой последовательность предложений, относящихся к разным речевым типам, при условии, что эти предложения связаны мягкими началами. Начинаться такая цепь будет там, где закон-

С историей развития взглядов на этот предмет в зарубежной и отечественной лингвистике можно познакомиться, например, по сборникам «Новое в зарубежной лингвистике», вьтп, VIII (М., Прогресс, 1978). «Син­таксис текста» (М., Наука. 1979).

» Автосемантическим является то предложение, которое, будучи изъя­тым из контекста, не содержит в себе никаких эксплицитно выраженных связей с другими предложениями. Синсемантические предложения подчинены контексту и вне его лишаются ситуативной определенности. Связ­ность синсемантического предложения (или предложений) с автосемантическим определяется различными речевыми средствами, прежде всего так на­зываемыми коннекторами (словами-заместителями, словами-связками).

чится супертекстовая единица, поэтому начало ее может быть как твердым, так и мягким.16

В научной литературе ССЦ обычно начинается с автосемантического предложения, за которым следует несколько синсемантических. Затем последующее ССЦ снова может начинаться автосемантическим предложением, детерминирующим некоторую совокупность подчиненных ему синсемантических фраз (чаще всего от трех до семи). Таким образом, каждый микроконтекст (сегмент) можно рассматривать как результат некоторого развертывания автосемантического предложения. Аналогичную структуру имеют и более сложные речевые образования — суперсегменты: в них иногда первый сегмент выполняет функции автосегмента, а последующие — синсегментов. Следует, однако, заметить, что сегменты в рамках суперсегмента не всегда следуют один за другим, но могут и пересекаться, проникать один в другой, вкладываться друг в друга.

При рассмотрении ССЦ как объекта свертывания обращает на себя внимание следующее: автосемантические предложения обычно выступают в качестве метаинформативных элементов ССЦ, синсемантические — в качестве его информативных элементов. Поэтому, если стоит задача в процессе свертывания повысить уровень метаинформативиости ССЦ, из него последовательно удаляется определенное количество синсемантических предложений. При этом важно, чтобы в оставшихся синсемантических предложениях слова-заместители (типа эти, такой, подобный, они и т. д.) были заменены на соответствующие им смысловые элементы из удаляемых вышестоящих предложений. В противном случае свернутое ССЦ потеряет свое смысловое единство.

К числу основных текстообразующих признаков ССЦ обычно относят цельность, тематичность и связность.

Цельным называется такой текст [84, 85], который воспринимается как осмысленное целесообразное единство. Цельный текст характеризуется иерархией смысловых предикатов. «В этом смысле можно определить целостный (цельный) текст как такой текст, который при переходе от одной последовательной ступени смысловой компрессии к другой, более „глубокой", каждый раз сохраняет смысловое тождество, лишаясь лишь маргинальных элементов» [85 ].

Тематичность текста характеризуется единством предмета высказывания. По словам Н. И. Жинкина [46], во всяком тексте, если он относительно закончен и последователен, высказана одна основная мысль, один тезис, одно положение. Все остальное подводит к этой мысли, развивает ее, аргументирует, разрабатывает. Одним из важнейших текстообразующих факторов общепризнано является с в я з н о с т ь,17 без которой текст как функционально завершенное целое вообще немыслим.

Э. Ф. Скороходько в [121] указывает, что «именно этот механизм (связность, — Д. Б.) представляет собой основной текстообразующий фактор и именно ему должно быть отведено первое место в описании текста как лингвистической категории».

По мнению Т. М. Николаевой [101], «лингвистика текста на нервом своем этапе не выходила за пределы исследования связного текста». Однако, несмотря на ведущее место связности в общей проблематике лингвистики текста, до последнего времени еще нет полной ясности в вопросах, что такое связность, какие имеются средства, обеспечивающие внутритекстовую связность.

Так, С. И. Гиндин [34] считает связность особым принципом внутренней организации текста и выделяет фонетическую, лексическую, синтаксическую, логическую и семантическую связность текста.

М. П. Котюрова [71, 72] рассматривает связность как функционально-семантическую категорию,18 которая охватывает содержательный, логический и композиционные аспекты речи и выражает связь элементов содержания и логику изложения посредством лексико-грамматических, морфологических (грамматические признаки глаголов) и функционально-синтаксических средств.

Содержательный аспект связности проявляется в речи через употребление лексико-грамматических средств связи самостоятельных предложений и абзацев: лексические повторы, указательные и личные (3-го лица) местоимения, наречия с причинно-следственным, пространственным и временным значениями.

Логический аспект связн


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: