Корпусная лингвистика

Любое лингвистическое исследование в той или иной мере опирается на анализ языкового материала, языковых данных.

При традиционной технологии сбора и обработки языковых данных обновление собранного материала предста­вляет собой отнюдь не тривиальную задачу. Текущая обработка картотеки, поиск нужных единиц и пр. — все эти абсолютно необходимые операции отнимают значительное время. Кроме того, традиционная технология делает практически невозможным доступ к языковым данным на рас­стоянии.

Новые информационные технологии и технические средства (ком­пьютерные системы, системы связи, системы мультимедиа) значительно облегчили сбор языковых данных.

Этот технологический рывок создал, однако, другие – не менее серьезные – проблемы, существенно осложняющие использование язы­кового материала как для чисто научных, так и научно-практических целей. Дело в том, что чрезмерный объем изучаемых данных может и затруднить описание исследуемого феномена.

Встает задача разработки общих принципов построения лингвисти­ческих корпусов данных с использованием современных компьютерных технологий. Рассмотрим здесь две важнейших темы корпусной лингви­стики, связанные с конструированием корпусов текстов:

– формулировка общих требований к корпусу данных с точки зрения пользователя;

– обсуждение опыта создания корпусов данных для различных иссле­довательских проектов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: