Лекция 9

В терминологических словарях всякого рода словосочетания занимают ведущее место по сравнению с отдельно употребленными терминами. И.И. Убин приводит следующие данные о количестве словосочетаний в терминологических словарях (табл. 2). Таблица 2

    доля терминов в процентах длиной в:
  Одно слово Два слова Три слова Четыре слова
Терминологические словари        
Тезаурус научно- технических терминов        

Из этой таблицы следует, что доля словосочетаний в научно-технических словарях составляет 75-80 процентов всего словаря.

Оценка эффективности терминологических словарей связана с требованиями, предъявляемыми к этим словарям. Обычно такие требования отражают специфические нужды пользователей. Однако можно выделить и общие требования к специальным словарям терминологии. Это следующие требования:

- адекватное описание лексики выбранной области науки и техники;

- наличие всей необходимой информации;

- отсутствие избыточной и ненужной информации;

- унификация композиции и систем индексации подобных словарей с тем, чтобы облегчить переход от одного словаря нужного типа к другому. В некоторых случаях создаются системы словарей или несколько словарей сходного типа, имеющие одну цель и одно терминографическое выполнение. [Марчук, 2002].

С точки зрения основной единицы своего словника автоматические переводные словари примыкают к традиционным терминологическим словарям. 80 - 90% лексических массивов автоматических переводных словарей составляют словосочетания [Автоматизированная словарно-терминологическая служба, 84]. Это в первую очередь объясняется тем, что крупные автоматические словари в своем большинстве фактически являются терминологическими банками и в своей основной функции направлены на решение тех же задач, что и традиционные терминологические словари. Интересной особенностью АПС является то, что верхняя граница словосочетаний в этих словарях еще более размыта, даже по сравнению с традиционными терминологическими словарями. В крупные АПС нередко включаются в качестве самостоятельных статей отдельные предложения и даже фрагменты текстов. Подобный подход к комплектованию словника переводного словаря в традиционной лексикографии не используется. Однако в автоматических переводных словарях такое решение в определенных условиях оказывается весьма удобным. Дело в том, что АПС показали себя эффективным инструментом полуавтоматического перевода стандартизированных текстов, например товаросопроводительной документации или юридических документов, в которых определенные части регулярно повторяются без существенных изменений.

Количество свободных словосочетаний и единиц текста в АПС определяется в первую очередь типом словаря и его задачами. Чем больше ограничены цели автоматического переводного словаря, чем уже он тематически, тем больше такой словарь является текстоориентированным, тем больше в нем может и должно быть свободных словосочетаний и единиц текста. Чем шире диапазон задач АПС, чем шире спектр тематик и различных слов лексики он охватывает, тем более такой словарь должен быть системоориентированным, тем меньше в нем должно быть свободных словосочетаний и единиц текста.

Аббревиация в терминообразовании

Одним из самых продуктивных способов словообразования в современную эпоху является аббревиация. Она характерна для всех языков. Компрессии подвергаются отдельные слова и целые словосочетания. Образование усечений, т.е. сокращений отдельных слов, уже давно практикуется в письме для общеупотребительной лексики. В настоящее время одно- и двусложные усечения получили распространение и в общенаучной и терминологической лексике. Наиболее распространенной моделью образования таких сокращений является отсечение конца слова.

В терминологической лексике четко прослеживается тенденция к свертыванию многокомпонентных терминологических единств и замена их в сфере функционирования различными сокращениями: инициальными аббревиатурами, акронимами, сращениями и другими образованиями. Образование всех видов сокращений в терминологической лексике - процесс в основном стихийный, никем не управляемый. Появление все новых сокращений приводит к возникновению синонимии и омонимии как между терминосистемами разных наук, так и в пределах одной и той же терминосистемы, что, безусловно, осложняет межъязыковое и внутриязыковое общение ученых и специалистов разных направлений. Рекомендации авторитетных международных и национальных органов, к сожалению, пока не оказывают решающего влияния па процесс создания терминологических сокращений.

В таких условиях удобным практическим решением проблемы сокращений является включение всех обнаруженных в сфере функционирования сокращений в специальные словари с указанием степени рекомендованности - нерекомендованности каждого из них, если, конечно, составитель словаря обладает соответствующей информацией. Такие словари регулярно издаются для основных языков мира и главных направлений развития науки и техники.

Помимо специальных словарей сокращения включаются практически во все переводные терминологические словари либо как самостоятельные единицы, либо чаще всего в составе специальных приложений, в которых обычно приводятся полная несокращенная форма данной терминологической единицы, ее полный переводной эквивалент и соответствующее сокращение на выходном языке. Таким образом, можно сказать, что проблеме сокращений в практике традиционной лексикографии уделяется серьезное внимание.

Автоматические переводные словари также не должны оставлять эту проблему в стороне. Как правило, промышленные АПС включают аббревиатуру в свой состав с отсылкой к основной несокращенной форме данной лексической единицы. Индекс надежности, который служит в АПС для определения степени рекомендованности термина или его переводного эквивалента, может также приписываться и сокращениям. Динамичность АПС позволяет изменять индекс надежности любой единицы, в том числе и сокращения, либо исключить ее из состава словаря совсем, в зависимости от ее частотности или рекомендаций специальных терминологических органов. Включение всех обнаруженных сокращений в автоматический словарь и последующее слежение за их употребительностью и статусом безусловно осложняет задачи составителей АПС и увеличивает его объем, но с другой стороны, этим значительно облегчается задача пользователя словаря и возрастает ценность АПС как источника лексикографической информации для традиционных словарей.

Сопоставляя перечень характеристик, на основании которых строят свои типологии разные исследователи, можно сделать вывод, что основными для всех типологий являются принципы отбора лексики, организация и интерпретация лексического материала в словаре. Объем словаря является как бы вторичной характеристикой, производной от времени и возможностей составителя или коллектива составителей словаря, и существенно не влияет на тип словаря. Такой вывод косвенно подтверждается тем, что в практике традиционной лексикографии существует большое разнообразие в объемах словарей одного и того же типа. Например, регулярно издаются различные переводные словари общей лексики для одной и той же пары языков объемом от 2 тыс. до 150 тыс. слов - карманные, краткие, средние («вузовские»), большие (настольные общеупотребительные). Примерно такое же положение и в переводной терминологической лексикографии. Однако следует отметить, что в этом разнообразии объемов переводных словарей существует одна четкая закономерность - с ростом объема количество разных словарей резко уменьшается. Так, если количество переводных словарей объемом до 20 тыс. слов для развитых лексикографий исчисляется сотнями (по всем языкам и тематикам), от 20 до 50 тыс. слов десятками, то от 50 до 100 тыс. слов -уже единицами. Переводные словари объемом 150 тыс. слов и более - явление исключительное практически для всех развитых лексикографий. Это объясняется не только огромными трудностями, с которыми сталкиваются создатели таких словарей, но и объективными «врожденными» недостатками традиционных «бумажных» словарей. Словари больших объемов в книжной форме содержат тысячи страниц, в большинстве своем являются многотомными и, как следствие, неудобными в работе и дорогостоящими.

С другой стороны, развитие общества в целом, науки и техники в первую очередь, требует создания лексикографических фондов для языка во всех его проявлениях, создания новых типов словарей, органично включающих в себя толкования, переводные эквиваленты, контексты, лексическую сочетаемость и многие другие виды лингвистической и экстралингвистической информации. К подобным работам раньше других приступили во Франции, где уже создана национальная лексикографическая служба с центром в Безансоне, в которой аккумулированы на сегодняшний день различные текстовые и лексикографические фонды французского языка общим объемом более 70 млн. словоупотреблений (TRESOR... Preface). Подобные работы проводились и в России в рамках создания Машинного фонда русского языка.

Создатели этих терминологических банков и автоматических словарей планируют дальнейшее увеличение своих лексических массивов как в пределах уже имеющихся, так и за счет подключения новых языковых пар и тематик с доведением суммарных объемов до миллиона словарных статей для основных пар языков и тематик.

Основываясь на сопоставлении объемов традиционных переводных словарей, с одной стороны, и многоязычных автоматических словарей и терминологических банков -с другой, а также учитывая современные тенденции развития вычислительной лексикографии, можно сделать вывод, что объем является существенной характеристикой, принципиально различающей традиционные и автоматические переводные словари. Автоматические словари объемом в 1 млн. и более словарных статей являются в настоящее время уже реальностью, а максимальные объемы традиционных переводных словарей достигают 150 - 200 тыс. словарных статей. Практика показывает, что создание словарей объемом свыше 300 - 500 тыс. слов в книжной форме нерационально. Первичной формой словарей должна стать их компьютерная форма, а книжная форма должна стать производной, проекцией автоматизированных лексикографических баз данных по составляющим, структуре и номенклатуре словарных статей.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: