Методы моделирования языковой деятельности

Вопрос взаимосвязи процесса человеческого мышления и языка является одним из наиболее дискутируемых в теоретической лингвистике. Очевидно, что понятия мышления, языка и речи тесно связаны. При этом на каких этапах подключает какая система в процессе порождения речи, до сих пор однозначно не определено. Система мышление-язык-речь является сложной, многофункциональной, слабоорганизованной, недетерминированной, развивающейся. Она имеет огромное количество параметров, для ее исследования требуется целая армия специалистов разных профилей. Именно поэтому вопрос создания единой теории языка остается открытым.

При автоматизации моделирования языковой деятельности используется ряд допущений, позволяющих рассмотреть срез системы мышление-язык-речь с целью возможной формализации. Наиболее распространенной является методика представления процесса вербализации мысли в виде простой иерархии.

На первом, базовом уровне находится мышление человека. В нем хранится “база знаний” и содержится мысль, которую человек стремиться перевести в речь. Данному уровню соответствуют методы внелингвистического моделирования: модели представления знаний и методы работы с ними. Модели представления знаний можно разделить на четыре основных класса: продукционные Логические [8], сетевые [8, 32] и фреймовые [33]. К методам работы со знаниями относятся их: приобретение, пополнение, обобщение и классификация [33], неточный вывод.Следующим уровнем этой структуры является язык, который предоставляет средства для формирования предложений. На этом этапе происходит формирование морфологических и синтаксических конструкций предложения. Язык содержит правила по которым можно образовать все его правильные предложения. Данному уровню анализа соответствуют технологии обработки естественного языка. К ним относятся методы лексического анализа, анализа и синтеза словоформ (морфологический анализ, слабые методы обработки, анализа и синтеза предложений (синтаксический анализ) [30], семантического и прагматического [30] анализа. Синтаксический анализ включается в себя различные формализмы описания языка (рекурсивная сеть переходов, расширенная сеть переходов, контекстно-свободная грамматика, грамматики обобщенной структуры фразы, грамматика определенных выражений, функциональные грамматики, грамматика деревьев примыкания), а также методы их обработки: табличные (алгоритм коке-касами-янгера, алгоритм эрли, алгоритм валианта, головной, и островной, анализы) и автоматные (метод магазинного автомата [35, списка стеков, стека деревьев, и стека графовых структур,) синтаксические анализаторы.

На последней ступени иерархии находится речь человека. На данном этапе совершается акт вербализации предложения и инициации сопутствующих ему неречевых компонент общения. Особенность данной стадии в том, что она предоставляет средства для выражения понятий, которые невозможно выразить через имеющийся словарь языка. Таким образом, любое предложение речи состоит из двух компонент - устоявшегося и выразительного. Чем адекватней конструкции языка, тем меньше используются выразительные средства речи (к фразам лишенным выразительности можно отнести шаблонные фразы или инструкции). Соответственно, чем меньше владение терминологией данной области, тем более используются средства выразительности (впрочем, другим вариантом их использования является намеренное акцентирование внимания адресата, за счет применения заведомо неверных конструкций). Данному уровню соответствует семантический и прагматический методы анализа.

Таким образом, для моделирования речевой деятельности человека необходима система, состоящая из трех компонент: мышление (предоставляющее знания системы), язык (предоставляющий правила для анализа и формирования текстов) и система моделирования и анализа ситуации описываемой в тексте.

К лингвистической теории, претендующей на формализацию ЕЯ, кроме сложности и недетерминированности объекта описания, предъявляются дополнительные требования:

а) учет лексической омонимии, полисемии (несколько значений, соответствующих одному слову), синонимии (несколько слов имеют близко связанные значения);

б) привязка к контексту речи (с помощью анафорических местоимений) и к контексту ситуации (экзофорические или дейктические указатели);

в) использование эллипсиса (синтаксического и семантического) и фигур речи (использование слов не в их прямом значении).

В настоящем разделе анализируются ряд формальных лингвистических теорий, для многих из которых существуют компьютерные реализации: трансформационные грамматики Хомского и связанные с ней теории, модель «Смысл↔Текст», грамматики, основанные на логической семантике (в эту группу можно отнести GPSG и LFG), HPSG, функциональные грамматики (такие, как SFG). Наиболее популярными в настоящее время в компьютерной лингвистике являются современная модель Хомского GB и грамматические теории HPSG и SFG.

Процесс автоматического лингвистического анализа и синтеза текста разделяется на три основные этапа: морфологический, синтаксический, семантический. Это основные уровни представления лингвистической информации. Некоторые теории предусматривают более сложную иерархию.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: