Корпусная лингвистика

Очевидно, корпусная лингвистика занимается составлением и изучением корпусов. Но что же такое корпус?

Так называют совокупность текстов на том или ином языке, которые особым образом размечаются и по которым может осуществляться поиск. Корпуса создаются для того, чтобы предоставить лингвистам достаточно большой языковой материал, который к тому же будет реальным (не какие-то искусственно сконструированные примеры типа «мама мыла раму») и удобным для поиска необходимых языковых явлений.

Это достаточно новая наука, зародившаяся в США в 60-е годы (в момент создания знаменитого Брауновского корпуса), а в России — в 80-е. Сейчас идёт продуктивная работа над развитием Национального Корпуса Русского Языка (НКРЯ), который включает в себя множество подразделов. Например, такие, как синтаксический корпус (СинТагРус), корпус поэтических текстов, корпус устной речи, мультимедийный корпус и так далее.

Также каждый из вас может поучаствовать в разработке «Открытого корпуса» (OpenCorpora), занимаясь разметкой, добавляя тексты и разрабатывая ПО.

Компьютерная лингвистика

Компьютерная лингвистика (также: математическая или вычислительная лингвистика) — это раздел науки, образовавшийся на стыке лингвистики и вычислительной техники и на практике включающий практически всё, что связано с использованием программ и компьютерных технологий в языкознании. Компьютерная лингвистика занимается автоматическим анализом естественного языка. Это делается для того, чтобы смоделировать работу языка в тех или иных условиях, ситуациях и сферах.

Также к этой науке относится работа над усовершенствованием машинного перевода, голосового ввода и поиска информации, и разработка программ и приложений, опирающихся на использование и анализ языка.

Короче говоря, и «окей, гугл», и поиск по новостям Вконтакте, и словарь Т9 — это всё достижения прекрасной компьютерной лингвистики. На данный момент область является самой развивающейся в сфере языкознания, и если вдруг она вам тоже приглянулась — вас ждут в «Школе анализа данных» Яндекса или в компании ABBYY.

Дискурсология

Дискурсология (или теория дискурса) является одним из самых новых направлений лингвистической теории, и поэтому даже с определением понятия «дискурс» у учёных все еще достаточно много проблем.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: