Как переводит компьютер

Во-первых, всем ясно, что чем больше словарь, тем лучше перевод, значит, первая проблема – проблема создания больших словарей для систем.

Во-вторых, ясно, что система должна переводить такие предложения: «Привет, как дела?». Значит, еще одна проблема - научить систему распознавать устойчивые обороты. В-третьих, понятно, что предложение для перевода пишется по определенным правилам, по определенным правилам переводится, а значит, есть еще одна проблема: записать все эти правила в виде программы. Вот, собственно, и все.

Самое интересное, что эти проблемы действительно являются основными при разработке систем МП, другое дело, что методы их решения известны далеко не всем и отнюдь не так просты, как может показаться.

Системы МП семейства PROMT (PROgrammer's Machine Translation) - очень хороший объект, чтобы продемонстрировать, каким образом эти проблемы могут решаться эффективно.

В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться. Оно содержит 800 типов словоизменений для русского языка, более 300 типов как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено более 250 типов словоизменений.

Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

Кроме того, используемая модель морфологии позволила разработать экспертную систему для пользователя – создателя словаря. Эта система фактически автоматизирует процедуру выделения основы и определения типа словоизменения при вводе новых словарных статей.

Стало принятым делить системы перевода на системы типа TRANSFER и системы типа INTERLINGUA. Это разделение основано на особенностях архитектурных решений для лингвистических алгоритмов.

Алгоритмы перевода для систем типа TRANSFER строятся как композиция трех процессов: анализ входного предложения в терминах структур входного языка, преобразование этой структуры в аналогичную структуру выходного языка (TRANSFER) и затем синтез выходного предложения по полученной структуре.

Системы типа INTERLINGUA предполагают априори наличие некоторого метаязыка структур (INTERLINGUA), на котором можно описать все структуры как входного, так и выходного языков в общем случае; поэтому алгоритм перевода в системе типа INTERLINGUA предполагается как более простой: анализ входного предложения в терминах метаязыка и затем синтез из метаструктуры соответствующего предложения выходного языка. "Единственная" сложность в этом случае – разработать сам метаязык и описать естественный язык в соответствующих терминах.

МАШИННЫЙ ПЕРЕВОД – ЭТО… ИНСТРУМЕНТ.

Всем хорошо известно, что хороший перевод текста – это не только творческая, но и достаточно трудоемкая работа. Причем даже самый хороший перевод, как правило, нуждается в редакторской правке. Что касается творческой части, то в обозримом будущем в соревновании компьютер-человек всегда победит "живой" переводчик. Однако для решения проблем, обусловленных трудоемкостью процесса перевода, системы МП могут оказаться хорошим подспорьем. Для того чтобы это лучше понять, перечислим достоинства программ машинного перевода (общие для всех систем МП вообще и систем PROMT в частности):

1. Высокая скорость. Всего несколько секунд и Вы получаете перевод многостраничного текста. Это позволяет быстро понять смысл текста, а если система настроена на перевод текстов этой тематики, требуется минимальная редакторская правка.

2. Низкая стоимость. Это очень легко оценить: если вы обращатесь к профессиональным переводчикам, приходиться платить за каждую страницу переведенного текста (в зависимости от региона и уровня квалификации переводчика страница перевода будет стоить от 5 до 20 долларов), либо вы нанимаете штатного переводчика, которому приходится платить зарплату. В случае с системой машинного перевода, вы платите деньги только один раз – при покупке программы. Что вы предпочтете – разовое капиталовложение или регулярные издержки? По данным пользователей компании ПРОМТ при переводе от 50 страниц текста в месяц программа-переводчик PROMT 98 окупается примерно за месяц.

3. Доступ к услуге. Немаловажный фактор, который многие критики систем МП не принимают в расчет. Программа-переводчик всегда под рукой, а обращаться в переводческое бюро во многих случаях связано с дополнительными затратами времени и сил.

4. Конфиденциальность. Системе МП вы можете доверить любую информацию. Приятно ли вам отдавать на перевод личную переписку? Готовы ли Вы к тому, чтобы посвятить в свои финансовые дела постороннего переводчика? Пойдете ли вы в переводческое бюро для того, что бы перевести какую-нибудь эротическую литературу? Если да, то действительно вопросов нет. Но даже в этом случае, согласитесь, немногие пользователи Вас в этом поддержат. Мы знаем, что многие пользователи регулярно используют наши системы для перевода личных писем, поскольку часто получаем письма от людей, которым наша система помогла устроить личную жизнь. Программа- переводчик сохранит в тайне любые тексты, которой Вы ей доверите.

5. Универсальность. Любой переводчик всегда имеет специализацию, т.е. переводит тексты по той теме, которой он хорошо владеет. Система МП выгодно отличается тем, что она абсолютно универсальна. Нужно только грамотно подключить специализированный словарь по соответствующей тематике. Следует учесть и еще одно преимущество систем МП: пополнение их специализированных словарей новейшими терминами значительно опережает аналогичные словари полиграфического исполнения. В ряде случаев также рекомендуется вести свой собственный словарь новых терминов или новых значений. В этом случае вы гарантированно получаете необходимое качество перевода.

6. Перевод информации в Интернете. В онлайне наиболее ярко проявляются все преимущества систем МП. Более того, в большинстве случаев переводить информацию в Интернете, если Вы, конечно, сами не знаете нескольких языков, можно только с помощью программ-переводчиков. Именно эта потребность обусловила огромный рост интереса к системам МП сейчас в мире. Только благодаря онлайновым системам МП появилась возможность просматривать иностранные сайты, не затрудняясь с их переводом. Кроме того, здесь действуют все вышеперечисленные достоинства систем МП: перевод текстов по любой тематике производится быстро и конфиденциально. Коллективное использование систем МП в организациях дает дополнительные преимущества:

1. Единообразие стиля и используемой терминологии. Как известно, затраты на постредактирование при работе коллектива переводчиков составляют около 100-140 % отстоимости перевода. Перевод, выданный системой МПа, гораздо легче править, поскольку он выдержан в одном стиле. Если в тексте, какой-либо часто встречающийся термин переведен неправильно, то все эти ошибки можно исправить простой автозаменой. Когда объемный текст переводится группой переводчиков, то приходится вылавливать отдельные неточности, допущенные каждым переводчиком. Редактору в этом случае требуется также "выравнивать" и стиль перевода.

2. Отсутствие затрат на форматирование. Это особенно важно при переводе электронной документации. Программа-переводчик полностью сохраняет исходное форматирование, что позволяет сэкономить время и деньги при подготовке перевода.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: