О.А. Казакевич

(Москва, kazak@orc.ru)

ОБ ЭТАПАХ ПОНИМАНИЯ ТЕКСТА В ПРОЦЕССЕ РАСШИФРОВКИ ПОЛЕВЫХ АУДИОЗАПИСЕЙ[8]

Вот уде более десяти лет в лаборатории автоматизированных лексикографических систем НИВЦ МГУ имени М.В. Ломоносова ведется работа над проектами, непосредственно связанными с документацией и описанием малых языков Сибири – селькупского, кетского и эвенкийского. В рамках этих проектов регулярно проводятся лингвистические экспедиции для сбора материала по исследуемым языкам[9]. Поскольку текст является самым универсальным лингвистическим материалом, во время экспедиций мы используем любую возможность, чтобы сделать аудиозапись звучащей речи. Тексты записываются без какого-либо ограничения на жанры (истории из жизни нередко оказываются не менее ценным материалом, чем образцы фольклора). Особый интерес представляет запись спонтанной диалогической речи, хотя сделать такую запись удается довольно редко. Однако аудиозапись текста – это лишь исходная точка для дальнейшей работы. Сделанную аудиозапись необходимо расшифровать, то есть получить ее графическое представление (транскрипцию)[10] и перевод на русский язык, который в какой-то мере будет отражать наше понимание текста. В предлагаемом докладе речь пойдет об этапах понимания текста в процессе расшифровки его аудиозаписи и дальнейшей обработки при подготовке к публикации или к загрузке в базу данных.

Расшифровка аудиозаписи текста начинается еще во время экспедиции. Это первый, абсолютно необходимый этап, который осуществляется с помощью информанта-носителя языка. В идеальном случае расшифровщик - это сам рассказчик. Однако привлечь рассказчика к расшифровке собственного текста удается далеко не всегда, особенно если это человек пожилой. Тогда мы стараемся обратиться за помощью к кому-либо из его младших родственников, в крайнем случае, к людям, хорошо его знающим и относящимся к нему с уважением. Расшифровка текста – работа тяжелая, требующая помимо знания языка внимания и терпения, и личное хорошее отношение расшифровщика к рассказчику, а также знание особенностей его (рассказчика) идиолекта весьма способствует успеху в работе. На входе этого этапа расшифровки – аудиозапись текста, на выходе – транскрипционная запись, строго говоря, не самого исходного текста, а текста, повторенного расшифровщиком после неоднократного пофрагментного прослушивания исходного текста, а также, по возможности, пословный перевод этого текста на русский язык. Функция лингвиста при расшифровке с информантом состоит, во-первых, в том, чтобы добиться от расшифровщика повторения тех фрагментов, которые звучат при прослушивании аудиозаписи, а не их приблизительных вариантов (что удается далеко не всегда), во-вторых, затранскрибировать то, что произносит расшифровщик, отметив при этом расхождения с исходным текстом, если таковые замечены, в-третьих, записать предлагаемый расшифровщиком перевод каждого фрагмента на русский язык с минимальными пропусками (особенно большие проблемы при переводе вызывают у расшифровщиков используемые рассказчиками дискурсивные маркеры) и, наконец, по возможности поддерживать в расшифровщике желание довести работу до конца. Следует учитывать, что для расшифровки десятиминутного текста может потребоваться час, а то и два интенсивной работы. Очевидно, что чем лучше сам лингвист знает язык, на котором сделана аудиозапись текста, тем больше он может понять непосредственно из аудиозаписи, но даже и в случае хорошего практического знания исследуемого языка вряд ли разумно пренебрегать помощью носителя языка на первом этапе расшифровке. В языках без письменной традиции локальная и индивидуальная вариативность произношения столь велика, что помощь носителя того же локального говора, что и рассказчик, позволит избежать многих неточностей при расшифровке. Кроме того, расшифровщик иногда проясняет то, что в аудиозаписи практически не слышится, например, окончания глаголов и имен в селькупском или эвенкийском языке или выпадающие глагольные инфиксы в кетском, что вряд ли может ответственно сделать сам лингвист.

Следующим, уже лабораторным этапом работы с текстом и, соответственно, следующим этапом его (текста) понимания является уточнение полевой транскрипционной записи путем неоднократного пофрагментного прослушивания аудиозаписи теперь уже самим лингвистом. Задача состоит в том, чтобы графически представить исходный текст рассказчика, отделив его от повтора и вариаций расшифровщика. Параллельно с уточнением транскрипционной записи текста уточняется деление текста на предложения, что нередко оказывается далеко не тривиальным[11], а также его пофразовый перевод на русский язык..

Очередной этап – понимание того, как устроен текст, его лингвистический анализ: морфологический анализ словоформ (глоссирование) и анализ используемых в нем синтаксических структур. Наконец, дискурсивный анализ текста помогает понять стратегии, используемые рассказчиком при изложении событий. На каждом этапе может уточняться транскрипционная запись текста (очевидно, что мы не только понимаем то, что слышим, но и слышим то, что понимаем), а в связи с этим иногда и его пофразовый перевод на русский язык.

Обработанный таким образом текст рассматривается далее с точки зрения выявления отраженных в нем социальных, исторических и культурных реалий. На этом этапе обработки текст снабжается историческими и этнологическими комментариями, что дает возможность лучше понять как логику излагаемых в тексте событий, так и логику самого изложения.

Литература

Захаров Л.М., Казакевич О.А. К вопросу о границах предложения в устных текстах на языке без устойчивой письменной традиции // Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции Диалог 2006. М.: Изд-во РГГУ, 2006. С. 168-177.

Казакевич О.А. Специфика полевой работы в условиях языкового сдвига // I Международный симпозиум по полевой лингвистике. Тезисы докладов. Москва - 23-26 октября 2003 г. М., 2003. С. 43-45.

Казакевич О.А. Документация исчезающих языков Сибири (на материале двух поселков Красноярского края) // Вестник Российского гуманитарного научного фонда. 2006. № 3 (44). С. 221-231.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: