Ю.Р. Лотошко

(Тверь, lotoshko@hotmail.com)

КОМПЬЮТЕРНОЕ ПОНИМАНИЕ ТЕКСТА В СЕМИОТИЧЕСКОМ АСПЕКТЕ

Ignotum per ignotius.

Объяснять неизвестное

еще более неизвестным. (Лат.)

1. Термин «понимание» широко используется в различных отраслях знаний и не является однозначно воспринимаемым представителями разных направлений (семиотика, герменевтика, филология, философия, психология и других когнитивных науках)[27]. В наших рассуждениях под этим термином, исходя из целей и задач, мы будем подразумевать следующее:

Понимание – это выявление содержательных элементов, параметров в анализируемом тексте в соответствии с задачами, параметрами, которые ставит перед собой исследователь или разработчик программного продукта.

Речь идёт именно о понимании текста как единого целого, а не о детальном понимании отдельных элементов, образующих текст.

2. «Текст» в различных направлениях, семиотики (семиотических школах) может трактоваться по-разному: от нелингвистического явления, например, игры до многотомного произведения, например, роман Л.Н.Толстого «Война и мир» как целостный текст или цикл произведений, созданных разными авторами, но объединенных одними и теми же героями, например цикл романов «Звёздные войны».

3. Любой «текст» предполагает триединство:

а) автора с его идеями, задачами, стилем изложения и т.п.,

б) сам текст (в данном случае набор букв, символов и проч.) и

в) «читателя» (того, кто пытается воспринять содержание текста, как-то понять, исходя из определенных условий, задач).

Наиболее подробно все эти особенности рассматриваются в герменевтике. Нас же интересует вопрос об общем понимании текста, о соотнесении его с определенной темой или темами. В скорочтении этот прием называется «ознакомительное чтение или просмотр», задача которого определить, является ли просматриваемый текст «интересным» для читателя, в случае с компьютерной программой – соответствует ли содержание анализируемого текста заданным (искомыми) параметрам.

4. Таким образом, при компьютерном анализе содержания текста мы должны учитывать три основных фактора, каждый из которых представляет сложный комплекс различных элементов: а именно:

а) двойная субъективность (автора и читающего, анализирующего) и

б) объективность (сам текст, представленный в том или ином виде).

Сравните разные подходы к анализу текста, представленного в работах разных коллективов, занимающихся компьютерным анализом текста, Например, работы Ермакова А.Е. и коллектива украинских исследователей во главе с Гладун В.П.

5. Корректная компьютерная программа должна рассматривать текст как единую сложную семиотическую систему, отражающую все выше названные факторы. Именно целостность системы является основополагающей при корректном семиотическом анализе, игнорирование любого элемента системы, отношений между элементами могут делать результат анализа некорректным[28].

6. Общеизвестно, что любой текст обладает определённой избыточностью. Для выявления общего «значения» (понимания) текста существуют уже давно опробованные методики, используемые при обучению русского языка как иностранного или при освоении методики быстрого чтения. В обоих случаях происходит сжатие информации, вычленении самого главного.

7. При компьютерном анализе выявляются определенные элементы общего содержания текста. Например, коннотативный компонент (субъективное отношение автора текста к излагаемому материалу, теме) может отражаться в использовании аффиксов наи- … -ший, -ейший и др. или словами с оценочным значением (более, менее, плохо, лучше и т.п.).

8. Учитывая структурные особенности текста, его размер, линейность, необходимо обращать внимание на место, позицию ключевых элементов, связанных с анализом понимания текста (заглавие, начало абзаца, конец текста и т.п.). Кроме этого, необходимо учитывать длину предложения (включая парцелляцию) и т.п. Наши исследования показали, что наиболее длинные предложения, как правило, отражают наиболее главные темы, понятия текста.

9. Парадигматические и синтагматические отношения элементов текста (тем, понятий) можно выявить при анализе миниконтекстов, что позволяет не только выделять смежные, пересекающие смысловые поля текста, но и делает содержательный (понятийный) анализ текста более точным.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: