Другие иноязычные лингвистические корпуса

Британский национальный корпус

Одним из самых авторитетных корпусов сегодня считается British National Corpus (https://www.natcorp.ox.ac.uk). Корпус был создан в 1990-х гг. Правила разметки, которые использовались при его создании, принялиза образец еще более ста появившихся позднее систем. Появление корпуса стимулировало развитие англоязычной лексикографии: данными корпуса пользуются при составлении наиболее авторитетных англоязычных словарей.

Корпус современного американского варианта английского языка (Corpus of Contemporary American English – COCA) – создан проф. Марком Дэвисом из Университета Бригама Янга (Brigham Young University). В настоящее время насчитывает более 425 млн. слов и более 160 млн. текстов за период с 1990 по 2011 г.

Корпусная лингвистика во Франции: один из наиболее грандиозных французских проектов – создание «Сокровищницы французского языка» (Tresor de la langue francaise informatise), включающей корпус текстов в 90 млн словоупотреблений. Разработка проекта началась в 1963 г., ввод основного материала был закончен к 1968 г. Введены тексты 19-20 вв., всего 80 тыс. вводов.

Корпус испанского языка – Corpus del Espanol.

Корпуса итальянского языка – COLFIS, CORIS, CODIS.

Корпус немецкого языка – Deutsche Referenzkorpus (DeReKo) (в Институте немецкого языка в Мангейме).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: