Проблемами порождения текста с помощью ПК исследователи занимаются с начала 70-х годов 20 столетия, но до сих пор нет единой теории текстообразования

Гиперсинтаксическое или прагматическое понимание текста связано с выяснением семантических отношений между предложениями и с выявлениям соответствующей тексту ситуации реальной действительности.

П процессе семантического понимания текста автоматически устанавливаются значения выделенных на синтаксическом уровне составляющих предложения. Компьютер определяет нап.ример выражено ли подлежащие одушевленным или неодушевленным существительным, сказуемое выражено глаголом чувствования или движения, обстоятельство является обстоятельством времени, места, действия и т. д. Подобные процедуры проводятся с опорой на необходимое окружение.

Суть синтаксического понимания текста заключается в автоматическом выделении в каждом предложении главных и второстепенных членов и установления между ними различных типов связей.

Морфологическое понимание сводится к автоматическому приписыванию к каждому слову текста его морфологических характеристик. Это наиболее освоенный вид компьютерного понимания текста. Такие операции легко реализуются в рамках автоматического лексико-грамматического анализа корпусов текстов.

Соотнося уровни понимания текста компьютером с основными уровнями языка, выделяют следующие уровни автоматического понимания текста

· Морфологический

· Синтаксический

· Семантический

· Гиперсинтаксический или прагматический

Типы автоматического понимания текстов:

Компьютерная система понимающая письменный текст должна иметь в своей базе знаний следующую информацию:

· Знания о языке на котором написал текст

· Правила использования этих знаний

· Знания о реальном мире (предметной области) о физике, математике, компьютерным сетям

· Правила использования знаний о фрагменте реального мира

· Знания о пользователе системы, желающим получить от ПК некоторое понимание текста

В зависимости от видов знаний различают следующие типы понимания текстов:

· "понимание-узнавание" в системе лишь знания о языке. Суть понимания сводится к тому, что компьютер (система) узнает морфологическую структуру каждого слова, проводит синтаксический анализ каждого предложения, узнает в исходном тексте ключевые слова, словосочетания, предложения

· Понимание уподобления система должна иметь знания о языке и правилах использования этих знаний. Считается, что система понимает текст, если она может ответить на вопросы по этому тексту. При таком понимании ПК просто находит готовые ответы в своей базе знаний ранее занесенные человеком (таким образом он уподобляется человеку)

· Понимание прогнозирование эти системы ориентированы на понимание текстов достаточно узкой предметной области. В базе знаний знание о языке, правилах их использования и знание о предметной области. Считается, что система понимает текст если она может определить какой объект предметной области соответствует отдельным фрагментам этого текста. Однако, одним и тем же фрагментом могут соответствовать разные объекты поэтому соотносить их можно лишь с определенной степенью вероятности (отсюда термин: прогнозирование)

· Понимание-объединение в базе знаний системы представлены четыре вида знаний. Объединяя эти видит знаний компьютерная система должна уметь делать выводы по тексту, а также объяснять почему она сформулировала тот иной вывод (это работа экспертных систем)

· Понимание-объяснение система имеет в своей базе знаний все пять видов знаний включая знания о целях профессиональной компетенции пользователя системы. Компьютер (ПК) должен уметь объяснить пользователю каким образом он понял текст так как система должна давать объяснение любому конкретному пользователю с учетом уровня его образования, опыта, в таких системах используется диалог (компьютер - пользователь)

Сегодня проблема автоматического понимания текста реализована в следующих компьютерных системах:

· Системы автоматического индексирования, реферирования, аннотирования и перевода текста

· Информационно-поисковые системы

· Экспертные системы

· Системы автоматического порождения (генерации, синтеза) письменного текста

Не может быть создана единая теория порождения текста. Основная причина неоднозначное определение понятия "текст".


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: