Глава 3 Типовые разновидности ТСП и примеры их воплощения

Системы МП. PROMT.

Системы машинного перевода осуществляют автоматизированный перевод текста. Единицами перевода при этом служат слова или словосочетания, причем последние разработки позволяют учитывать морфологию переводимого слова. «Развитые системы МП осуществляют перевод по заданным разработчиком и/или корректируемым пользователем алгоритмам перевода» [3, 40].

Для осуществления машинного перевода в компьютер вводится специальная программа, реализующая алгоритм перевода, под которым понимается последовательность однозначно и строго определенных действий над текстом для нахождения переводных соответствий в данной паре языков Яз1 –Яз2 при заданном направлении перевода (с одного конкретного языка на другой). Система машинного перевода включает в себя «двуязычные словари, снабженные необходимой грамматической информацией (морфологической, синтаксической и семантической) для обеспечения передачи эквивалентных, вариантных и трансформационных переводных соответствий, а также алгоритмические средства грамматического анализа, реализующие какую-либо из принятых для автоматической переработки текста формальных грамматик» [2, 110]. Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более языков, но они в настоящее время являются экспериментальными.

В настоящее время существует две концепции развития систем машинного перевода:

1. Модель «большого словаря со сложной структурой» [4], которая заложена в большинство современных программ-переводчиков;

2. Модель «смысл-текст» [4], впервые сформулированная А.А. Ляпуновым, но пока что не реализована ни в одном коммерческом продукте.

На сегодняшний день наиболее известны такие системы машинного перевода, как

• PROMT 2000/XT компании PROMT;

• Retrans Vista компаний Vista и Advantis;

• Сократ – набор программ компании Арсеналъ.

В системах семейства PROMT разработано практически уникальное по полноте морфологическое описание для всех языков, с которыми системы умеют обращаться. Оно содержит 800 типов словоизменений для русского языка, более 300 типов, как для немецкого, так и для французского языка, и даже для английского, который не принадлежит к флективным языкам, выделено. более 250 типов словоизменений. Множество окончаний для каждого языка хранится в виде древесных структур, что обеспечивает не только эффективный способ хранения, но и эффективный алгоритм морфологического анализа.

Вместо принятого лингвистического подхода, предполагающего выделение последовательных процессов анализа и синтеза предложения, в основу архитектуры систем было положено представление процесса перевода как процесса с "объектно-ориентированной" организацией, основанной на иерархии обрабатываемых компонентов предложения. Это позволило сделать системы PROMT устойчивыми и открытыми. Кроме того, такой подход дал возможность применения различных формализмов для описания перевода разных уровней. В системах работают и сетевые грамматики, близкие по типу к расширенным сетям переходов, и процедурные алгоритмы заполнения и трансформаций фреймовых структур для анализа сложных предикатов.
Описание лексической единицы в словарной статье, которое фактически не ограничено по размерам и может содержать множество различных признаков, тесно взаимосвязано со структурой алгоритмов системы и структурировано не на основе извечной антитезы синтаксис - семантика, а на основе уровней компонентов текста.

При этом системы могут работать и с не полностью описанными словарными статьями, что является важным моментом при открытии словарей для пользователя, от которого нельзя требовать тонкого обращения с лингвистическим материалом.

В системе выделяется уровень лексических единиц, уровень групп, уровень простых предложений и уровень сложных предложений. Все эти процессы связаны и взаимодействуют иерархически в соответствии с иерархией текстовых единиц, обмениваясь синтезируемыми и наследуемыми признаками. Такое устройство алгоритмов позволяет использовать разные формальные методы для описания алгоритмов разных уровней.

ЭС. ABBYY Lingvo.

Электронный словарь – это, как правило, компьютерная база данных, содержащая закодированные особым образом словарные статьи, которые позволяют осуществлять быстрый поиск нужных слов и словосочетаний. Поиск слов осуществляется с учетом морфологических сочетаний (примеров употребления), а также с возможностью изменения направления перевода (например, англо-русский или русско-английский).

Основное отличие ЭС от СМП заключается в том, что ЭС предоставляет переводчику весь спектр занесённых в его БД значений искомого слова или словосочетания, оставляя выбор наиболее подходящего варианта за человеком, в то время как СМП сама осуществляет подбор варианта из БД на основе встроенных в неё алгоритмов.

ABBYY Lingvo — семейство электронных словарей. Создан российской компанией ABBYY. 13 августа 2008 года вышла новая версия x3 (икс три Объём словарных статей составляет более 8,7 млн. единиц.

Lingvo в переводе с языка эсперанто означает «язык», о чём есть статьи в словарях ABBYY Lingvo (LingvoUniversal и LingvoComputer).

Многоязычная версия охватывает 12 языков — армянский, русский, украинский, английский, немецкий, французский, испанский, итальянский, турецкий, латинский, китайский, португальский. Также существует Европейская версия — 130 словарей на 7 языках и англо-русско-английский электронный словарь.

В ABBYY Lingvo нет функции полнотекстового перевода, но возможен пословный перевод текстов из буфера обмена. В некоторых словарях на английском, немецком и французском большинство слов озвучены профессиональными дикторами — носителями языка.

В состав программы входит обучающий модуль Lingvo Tutor, помогающий запоминать новые слова.

Помимо существующих 150 профессиональных словарей, результата лексикографической работы сотрудников компании ABBYY и авторитетных бумажных и электронных словарей существует обширная база бесплатных пользовательских словарей для программы. Словари предварительно проверяются и находятся в общем доступе на сайте Ассоциации лексикографов Lingvo.

Разновидности ABBYY Lingvo х3:

· ABBYY Lingvo х3 Европейская версия — 130 общелексических и тематических словарей для перевода с русского языка на английский, испанский, итальянский, немецкий, португальский и французский языки и обратно.

· ABBYY Lingvo x3 Многоязычная версия — 150 общелексических и тематических словарей для перевода с русского языка на английский, испанский, итальянский, китайский, латинский, немецкий, португальский, турецкий, украинский и французский языки и обратно.

· Мобильный многоязычный словарь ABBYY Lingvo x3 — словарь для смартфонов, коммуникаторов и КПК, содержащий 38 современных полных словарей для 8 языков.

· ABBYY Lingvo х3 Английская версия — 57 общелексических и тематических англо-русских и русско-английских словарей.

· Все версии содержат толковые словари английского языка (Oxford и Collins) и Большой толковый словарь русского языка Ефремовой Т. Ф.

 

 

ИР, посвящённые переводу.

Кроме уже описанных выше средств ПО, служащих для помощи переводчика, также существуют и специальные ИР, позволяющие осуществлять поиск перевода в режиме онлайн, без необходимости загрузки и установки какого-либо ПО.

ИР также можно разделить на два типа: словари и схожие по принципу онлайн БД и машинные переводчики.

Самым известным онлайн словарём можно по праву признать интернет-версию ABBYY Lingvo. Помимо уже привычного пословного перевода и предоставления словарных статей сайт предлагает большой круг дополнительных возможностей:

• FineReader Online – это удобный онлайн OCR сервис, который распознает ваши изображения, PDF-файлы или фотографии документов и конвертирует их в нужные форматы – Microsoft Word, Excel, TXT, RTF или PDF с возможностью поиска

• Письменный перевод – разработка представителей компании ABBYY Lingvo, которая позволяет заказчику оптимизировать расходы. Тип перевода и его стоимость определяются предназначением документа, тематической областью, объемом и сроками выполнения проекта

• Индивидуальное обучение по телефону (или по Интернет – через Skype)

• Онлайн-версия программы ABBYY Aligner для выравнивания параллельных текстов и создания баз Translation Memory

• Услуга «Перевод по телефону» – это телеконференция, в которой кроме Вас и Вашего собеседника участвует удаленный переводчик

Дополнительно можно обратить внимание на такой ресурс, как Urban Dictionary. Данная онлайн БД создана для знакомства пользователей с постоянно изменяющейся и быстро обновляющейся сферой английского сленга, фраз с переносным значением, разговорных оборотов.

Данный ресурс позволяет пользователям самостоятельно вносить в БД новые слова и выражения, дополнять определения уже существующих. Каждая статья помимо пояснения выражения содержит примеры его употребления, взятые из популярных текстов, песен, фильмов. Также сайт содержит разделы «Слово дня» и «Слово года», где представлены выбранные пользователями путём голосования самые популярные слова и выражения дня и года соответственно.

Что касается онлайн переводчиков, то достаточно отметить, что большинство программ МП имеют интернет-версии, в том числе и PROMT. Они предлагают тот же набор функций, что и их программные «собратья».        


Заключение

В настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации. В этой связи электронные словари и программы, осуществляющие машинный перевод, являются очень удобным подручным средством в целях экономии времени и оптимизации процесса понимания иноязычной информации. Кроме того, сейчас имеются программы-переводчики, которые могут производить более или менее адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей.

Настоящую тему исследования можно считать вполне современной, поскольку история развития и внедрения в повседневную жизнь персональных компьютеров (а тем более таких, каким было бы 'под силу' осуществлять более или менее современные программы машинного перевода) насчитывает едва ли более пятнадцати лет. Особую актуальность эта тема приобретает, если учесть тот факт, что именно в настоящее время Республика Беларусь все более интегрируется в международное сообщество и что, наряду с экономическими и политическими барьерами, препятствуют этому во многом барьеры языковые. Вместе с тем, профессиональных переводчиков, способных и желающих осуществлять подобный процесс коммуникации сообществ во всех сферах науки и культуры, не так много. Это явилось следствием того, что на данном этапе процесс обучения профессионального переводчика занимает много времени и весьма трудоёмок. Поэтому именно сейчас особенно актуален поиск путей максимально автоматизировать процесс перевода, осуществляемого человеком, чтобы, с одной стороны, максимально облегчить нелегкий труд человека-переводчика, а с другой – сделать этот труд максимально эффективным. Осуществить подобное можно, лишь максимально интегрировав усилия специалистов в областях кибернетики, программирования, психологии, а главное - лингвистики.

В данной работе было произведёно исследование современного рынка ТСП, доступного переводчику.

Были изучены и описаны различные типы перевода с использованием ИТ:

• полностью автоматический перевод;

• автоматизированный машинный перевод при участии человека;

• перевод, осуществляемый человеком с использованием компьютера.

Были рассмотрены, описаны и проанализированы различные типы ТСП:

• электронные словари;

• системы машинного перевода;

• интернет-ресурсы для перевода.

Был произведён обзор конкретных продуктов, имеющихся в доступе на данный момент, были проанализированы их возможности, достоинства и недостатки.

На данном этапе развития ИТ можно сделать следующий вывод: самым перспективным направлением использования ТСП является полностью автоматизированный перевод. Разработка ПО в данной области занимает умы ведущих учёных и является одним из приоритетных направлений исследования в сфере компьютерной лингвистики.

Сейчас же самым популярным является использование ТСП в качестве вспомогательных инструментов в процессе перевода. В этой области современные разработки предоставляют самые широкие возможности по поиску и толкованию слов и выражений. Существуют БД не только по отдельным словам, но и БД устойчивых выражений, жаргонизмов, сленга и т.п.

Главной задачей в улучшении процесса перевода сейчас можно считать внедрение ТСП на всех уровнях, от первичного процесса обучения переводчика в ВУЗе до популяризации ТСП в СМИ. Сейчас же имеющиеся возможности ТСП используются в неполном объёме.

Список литературы к реферату

1. Беляева М.А. Грамматика английского языка / - М.: Высшая школа, 1987.

2. Блох М.Я. Теоретические основы грамматики / - М.: Высшая школа, 2000. – 280 с.

3. Вайхман Г.А. Новое в английской грамматике // Учебное пособие для ин-тов и факультетов иностранных языков / - М.: Высшая школа, 1990.

4. Ильиш Б. А. Современный английский язык // Современный английский язык. Теоретический курс: Учебник для пед. и учител. ин-тов иностр. яз. / - Ленинград,1980.

5. Казакова Т.А. Практические основы перевода / – Спб., 2002. – 324 с.

6. Качалова К.Н., Израилевич Е.Е. Практическая грамматика английского языка / - М.: Внешторгиздат, 1957.

7. Кутузов Л. Практическая грамматика английского языка / - М.: Вече, 1998. – 200с.

8. Семёнов А. Л. Современные информационные технологии и перевод // Учеб пособие для студ. Высш. Учеб. Заведений/ - М.:Издательский центр “Академия”, 2008. – 224 с.

9. Википедия – онлайн-энциклопедия [Электронный ресурс]. – Режим доступа: http://ru.wikipedia.org - Дата доступа: 29.12.2010.

10.  Онлайн-словарь ABBYY Lingvо [Электронный ресурс]. – Режим доступа: http://lingvo.abbyyonline.com/ru– Дата доступа: 29.12.2010.

11. Онлайн-переводчик текста компании ПРОМТ [Электронный ресурс]. – Режим доступа: http://translate.promt.by/– Дата доступа: 29.12.2010.

12. UrbanDictionary – the greatest on-line American slang dictionary [Электронный ресурс]. – Режим доступа: http:/www.urbandictionary.com/ – Дата доступа: 29.12.2010.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: