Конкатенация и линейность

Излагая в главе 4 общие принципы «формальной грамматики», мы сознательно приняли ту точку зрения, что всем предложениям присуща простая линейная структура, то есть что всякое предложение языка может быть удовлетворительно охарактеризовано в грамматическом аспекте как цепочка (или последовательность) составляющих (допустим, слов).

В качестве отвлеченной иллюстрации значения термина «цепочка» (представляющего собой специальный термин, употребляемый в математических исследованиях грамматической структуры языка) можно рассмотреть следующие примеры:

а + b + с + а.

Знак плюс используется здесь (в литературе встречаются и другие условные обозначения) для указания на конкатенацию («сцепление»). В результате соединения составляющих, или элементов, в определенном порядке получается цепочка. Что обозначает этот порядок, зависит от интерпретации, придаваемой системе при ее применении к определенным явлениям. В случае естественных языков порядок следования составляющих в цепочке слева направо может мыслиться как отражение временной последовательности (от произнесенного ранее к произнесенному позднее) в устной речи или порядка следования слева направо в письменных текстах при направлении письма, принятом для английского языка и большинства современных языков мира. В то же время следует иметь в виду, что тот же отвлеченный принцип линейной упорядоченности можно было бы использовать в описании языка для других целей. В самом деле, не существует причины, почему нельзя было бы интерпретировать линейную упорядоченность в разных частях грамматики различным образом. В главе 4 мы исходили из молчаливого предположения, что сочетание слов, получающееся в результате применения какого-либо грамматического правила, составляет цепочку, где порядок конкатенированных слов определяется порядком следования слов в предложениях языка.

В главе 2 (см. § 2.3.5) указывалось, что понятие синтагматических отношений не предполагает непременной упорядоченности элементов, между которыми устанавливаются эти отношения: были приведены примеры как линейных, так и нелинейных сочетаний элементов. Важно понять, что цепочка — это частный вид синтагмы, тогда как конкатенация — это частный вид сочетания. Если бы данные потребовали этого, мы могли бы формализовать теорию грамматической структуры в терминах неконкатенирующей системы правил, порождающей не цепочки элементов, а неупорядоченные множества (между членами которых устанавливаются определенные отношения синтагматической импликации, зависимости и т. д.). Например, правило подстановки (см. § 4.3.2) вида

Х → а + b + с + d

можно интерпретировать (не считая более плюс знаком конкатенации) как означающее единственно то, что X представляет собой синтагму, состоящую из неупорядоченного соединения элементов а, b, с и d. Хотя в данной главе наши рассуждения будут по большей части заранее ограничены конкатенирующими системами правил подстановки, этот момент следует учитывать. Некоторые из предлагаемых в следующей главе правил будут свободны от этого ограничения. Но прежде чем продолжить более формальное рас-смотрение вопроса, мы должны коснуться его истории.

6.1.2. НЕПОСРЕДСТВЕННЫЕ СОСТАВЛЯЮЩИЕ *

Большинство современных учебников лингвистики придает большое значение так называемому анализу по непосредственным составляющим. Термин «непосредственная составляющая» введен Блумфилдом (в 1933 г.), прокомментировавшим его следующим образом: «Любой человек, говорящий по-английски, который задался бы подобной целью, без сомнения, сказал бы нам, что непосредственными составляющими Poor John ran away являются две формы poor John 'бедный Джон' и ran away 'убежал прочь'; что каждая из них в свою очередь представляет собой комплексную форму; что непосредственными составляющими ran away будут ran... и away...; и что составляющими poor John являются...poor и John».

Имеется очевидное соответствие между анализом по непосредственным составляющим и традиционной процедурой «разбора» предложения на «подлежащее» и «сказуемое» и описания каждого из них, в соответствующих случаях, в терминах слов, словосочетаний и несамостоятельных предложений различных типов. Предложение Блумфилда может быть описано как простое предложение, подлежащим которого является именная группа[38], состоящая из существительного John, «определяемого» прилагательным poor; сказуемым же этого предложения является глагольная группа, состоящая из глагола ran, «определяемого» наречием away. В основе обоих подходов к грамматическому анализу лежит тот взгляд, что предложения представляют собой не просто линейные последовательности элементов, но состоят из «слоев» непосредственных составляющих, причем каждая составляющая более низкого уровня является частью составляющей более высокого уровня. Расчленение предложения на несколько «слоев» составляющих может быть графически представлено целым рядом способов. Мы можем использовать скобки: [ (Poor John) (ran away)]. Можно также построить дерево (см. рис. 8).

Рис. 8. Непосредственные составляющие по Блумфилду.

Эти два способа представления эквивалентны. (Символы х, у и z используются здесь исключительно для удобства ссылок на диаграмму.) Приведенное выше дерево зависимостей следует интерпретировать следующим образом: конечные составляющие предложения (элементы, из которых построено предложение) — это poor, John, ran и away; слова poor и John являются непосредственными составляющими одной конструкции poor John, так что ветви, ведущие к ним, исходят непосредственно из одного «узла» (у); слова ran и away, являясь непосредственными составляющими другой конструкции, связаны посредством ближайшего высшего «узла», общего им обоим (z); а эти две конструкции poor John и ran away являются непосредственными составляющими конструкции высшего уровня, самого предложения, поэтому они обе выходят непосредственно из «узла» х. Отметим, что ни в представление структуры составляющих предложения посредством скобок, ни в эквивалентное представление в виде дерева не включаются сведения о том, что poor — прилагательное, что poor John представляет собой именную группу и т. п. Мы также не учитывали тот факт, что poor John — «подлежащее», a ran away — «сказуемое», а также существование «модификаторов»[39]. В этих отношениях наш анализ предложения по непосредственным составляющим отличается от анализа в терминах категорий традиционной грамматики и пока «беднее» его.

В развитии теории структуры составляющих можно выделить три периода. Сам Блумфилд всего лишь ввел это понятие и пояснил его посредством примеров. Он считал «правильным разложением» предложения на составляющие «такое, которое учитывает значения». Его последователи, особенно Уэллс и Хэррис, сформулировали принципы анализа по составляющим более подробно и заменили довольно туманную рекомендацию Блумфилда «учитывать значение» эксплицитными дистрибуционными критериями. Наконец, в последние несколько лет теория структуры составляющих была формализована и подвергнута математической интерпретации Хомским и другими учеными, которые уделяли значительное внимание природе правил, необходимых для порождения предложений с соответствующей структурой составляющих.

6.1.3. ГРАММАТИЧЕСКАЯ НЕОДНОЗНАЧНОСТЬ *

Одним из самых неоспоримых доводов в пользу признания того, что предложения и части предложений имеют нелинейную структуру составляющих, является то, что оно дает нам возможность справиться с большим числом неоднозначностей на грамматическом уровне описания. Сопоставление следующих трех примеров показывает, что неоднозначность может быть функцией либо дистрибуционной классификации элементов, либо структуры составляющих, или же того и другого вместе:

(a) They can fish 'Они могут ловить рыбу' или 'Они консервируют рыбу'

(b) Beautiful girl's dress 'Платье красивой девушки' или 'Красивое девичье платье'

(c) Some more convincing evidence 'Некоторые более убедительные доказательства' или 'Еще несколько убедительных доказательств'.

В случае первого примера — (a) They can fish (ср. They could fish 'Они могли ловить рыбу', They may fish 'Им можно ловить рыбу', с одной стороны, и They canned fish 'Они консервировали рыбу', They eat fish 'Они едят рыбу' — с другой) неоднозначность объясняется двоякой классификацией как can (модальный вспомогательный или переходный глагол), так и fish (непереходный глагол или существительное). Из того, что глагольная группа в английском предложении может состоять из переходного глагола и существительного или из непереходного глагола с предшествующим вспомогательным глаголом (разумеется, это существенное упрощение), следует, что They can fish может быть проанализировано двояким образом. Соответствующее различие не получает, однако, никакого отражения при расстановке скобок; при обеих интерпретациях скобки в предложении расставляются так: They (can fish). В противоположность этому неоднозначность (b) beautiful girl's dress объясняется не в терминах дистрибуционной классификации элементов (beautiful, girl, dress), а в терминах различия структуры составляющих; при одной интерпретации — 'красивое платье девушки' — слова girl's 'девушки' и dress 'платье' образуют составляющую, при другой — 'платье красивой девушки' — в одни скобки заключаются образующие составляющую beautiful и girl. Третий пример представляет собой комбинацию обоих факторов: сочетание (с) some more convincing evidence можно перефразировать недвусмысленным образом или как (i) some evidence which is more convincing, или как (ii) some more evidence which is convincing; другими словами, можно заключить составляющие в скобки или как (i) some [ (more convincing) evidence], или как (ii) [ (some more) (convincing evidence)]. Но наряду с этим различием в структуре составляющих имеется также различие в дистрибуционной классификации элементов. Это станет ясным, если подставить less вместо more и good (или bad и т. п.) вместо convincing: some less convincing evidence 'некоторые менее убедительные доказательства' не двусмысленно; не являются также двусмысленными ни some more good evidence 'еще несколько хороших доказательств', ни some better evidence 'некоторые лучшие доказательства', ни some more evidence 'еще несколько доказательств'. Слово more относится (по крайней мере) к двум дистрибуционным классам: (i) подобно less, оно соединяется с прилагательными, образуя группы прилагательного (однако его дистрибуция более ограничена по сравнению с less, поскольку more находится в дополнительном распределении с суффиксом -er; ср. nicer 'приятнее' vs. *more nice и т. п.), и (ii) в отличие от less оно соединяется с предшествующим some, образуя «определение» к существительным и именным группам (ср. some more evidence vs. *some less evidence).

Таким образом, неоднозначность может быть функцией или структуры составляющих или дистрибуционной классификации конечных (и промежуточных) составляющих; и так обстоит дело не только в английском, но и во многих других языках. Мы должны, следовательно, при анализе предложений учитывать оба фактора. Это можно сделать достаточно легко, пометив соответствующим образом заключенные в скобки структуры или «узлы» дерева. Таким образом,

Σ {NP (A [poor] + N [John]) + VP (V [ran] + Adv [away])}.

С различными видами используемых здесь скобок не связывается никакое разграничение. Употребление разных скобок делает более легким зрительное восприятие членов правой и левой пары скобок. Представление этого примера в виде дерева (которое значительно легче поддается «прочтению») приведено на рис. 9.

Рис. 9.

Итак, теперь в нашем представлении грамматической структуры таких предложений, как poor John ran away, отражен тот факт, что poor John — именная группа (NP), состоящая из прилагательного (A) poor и существительного (N) John, и что ran away — глагольная группа (VP), составленная из глагола (V) ran и наречия (Adv) away. В дальнейшем мы будем считать такие сведения неотъемлемой частью анализа предложений в терминах структуры их составляющих. Мы все еще не ввели традиционных понятий «подлежащее» и «сказуемое». Ничего не было сказано и о «модификаторах». В традиционной грамматической теории словосочетание poor John классифицировалось бы как именная группа в связи с тем, что в предложениях оно «функционирует как существительное» или «играет роль» существительного. Это может быть истолковано как то, что словосочетания формы прилагательное + существительное имеют в предложениях, порождаемых грамматикой, ту же дистрибуцию, что и существительные, то есть что poor John, new car и т. д. можно свободно подставлять вместо John, car и т. д. в любом данном предложении, и в результате получится другое грамматически приемлемое предложение. В нашем анализе таких предложений, как Poor John ran away, этот факт отражен в том, что «узел», через который связаны прилагательное и существительное, помечается термином «именная группа» (NP).

Прежде чем продолжить рассмотрение понятий, связанных со структурой составляющих, с точки зрения генеративной грамматики, мы должны пояснить, что́ имеется в виду под термином «грамматическая неоднозначность», как он использовался выше. Рассмотрим все именные группы формы А + N1 + N2 в английском языке (А = прилагательное, N = существительное). Многие из них неоднозначны; при этом их неоднозначность можно разрешить, обозначив структуру их составляющих или как А + (N1 + N2), или как (А + N1) + N2. Существенно, однако, что реальное употребление в предложении обычно исключает возможность неправильного истолкования многих из этих сочетаний, так как остальная часть предложения или же общий контекст высказывания делает несомненным или по крайней мере весьма вероятным, что правильной является та, а не другая интерпретация. Сочетание fresh fruit market 'рынок свежих фруктов', например, вряд ли будет понято в значении, которому бы соответствовала расстановка скобок fresh (fruit market) 'свежий фруктовый рынок'; наоборот, сочетание new fruit market 'новый фруктовый рынок' едва ли будет использовано в значении (new fruit) market 'рынок новых фруктов'. Допустим (для простоты изложения), что и fresh fruit market, и new fruit market имеют каждое лишь одно толкование, то есть будем считать, что они однозначны с семантической точки зрения. Являются ли они грамматически неоднозначными? Является ли структура составляющих fresh (fruit market) в одном случае и (new fruit) market в другом грамматически приемлемой? Понятно, что ответ на эти вопросы требует обращения к какой-либо эксплицитной грамматике английского языка. Ясно, что, вообще говоря, скобочная запись А + (N1 + N2) приемлема, если первое существительное способно сочетаться со вторым (fruit market) и если прилагательное способно сочетаться со вторым существительным (new market,?fresh market), а скобочная запись (A + N1) + N2 приемлема, если первое существительное способно сочетаться со вторым существительным и если прилагательное способно сочетаться с первым существительным (fresh fruit,?new fruit). Таким образом, по существу это та же проблема, которую мы рассматривали выше в связи с вопросом о границах грамматики: проблема субклассификации, определяемая двумя ограничивающими факторами — недетерминированности, с одной стороны, и «снижения рентабельности» — с другой (см. § 4.2.11). Любому сочетанию формы А + N1 + N2 будет придано два грамматических анализа, если грамматика и лексикон, на которые мы опираемся, не запретят эксплицитным образом сочетание рассматриваемого прилагательного с одним или другим из существительных.

Введение понятия структуры составляющих оправдывается не только возможностью справиться с его помощью с неоднозначностями, подобными только что рассмотренным. Главное основание считать предложения состоящими из «слоев» составляющих заключается в том, что таким образом можно достичь более экономного и интуитивно более удовлетворительного описания. Это будет ясно из последующего. Мимоходом можно упомянуть о существовании других видов неоднозначности, которые могут быть описаны с помощью грамматической структуры существенно иного рода, нежели рассматриваемая нами в настоящее время. Некоторые из них обсуждаются ниже в этой главе (см. § 6.6.2).

6.2. ГРАММАТИКИ СТРУКТУРЫ НЕПОСРЕДСТВЕННЫХ СОСТАВЛЯЮЩИХ [40] *


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: