Отбор лексики для входного и подходящие эквиваленты для выходного словаря

Морфологический синтез переводного языка сводится к постановке слов переводного языка в нужной форме числа, рода, падежа, опираясь на автоматический словарь, в котором хранятся все лексико-грамматические формы слов.

Синтаксический анализ предложения исходного языка сводится к поиску основных членов предложения, определяет структуру предложения.

Системы машинного перевода облегчают просмотр web страниц в интернете

Значительно дешевле

Можно доверить перевод конфедициальной инфы

Позволяет ускорить перевод, освободив от необходимости повторного перевода того, что уже было переведено ранее (при использовании ТМ)

Имеют удобные возможности для поиска слов и выражений в электронных словарях

Возможность форматировать текст перевода

Удобны при обработке переводов (встроен модуль OCR, Fine Reader)

В последних версиях встроен модуль ТМ, который позволяет использовать ранее переведенные фрагменты.

Виды машинного перевода

Реально автоматический перевод возможен только в условиях искусственно ограниченного языка (как по словарному запасу, так и по грамматике)

Человек, как правило, участвует в процессе перевод (предредактор упрощает текст, постредактор – редактирует)

1. информативный – грубый, пословный перевод, достаточный для поверхностного ознакомления с содержанием текста

2. профессиональный – качество перевода сравнимо с качеством «человеческого» перевода и при небольшом редактировании является удовлетворительным

3. персональный (авторский) – где авторы подлежащих переводу текстов заранее избавляют их от неоднозначности и работают в режиме диалога с компом.

Наиболее популярные системы машинного перевода:

- Сократ

- SYSTRAN

- PROMT – семейство продуктов, включающих в себя возможность перевода с английского, французского, немецкого, испанского и итальянского языков на русский и наоборот.

Положительные факторы:

Структура системного машинного перевода и назначение ее основных блоков

Система МП (машинного перевода) является моделями, которые воспроизводят на ПК речевое поведение чела, переводящего текст с одного языка на другой язык.

Автоматический двуязычный словарь
Синтаксические соответствия

1. Процессы морфологического анализа слов/предложений исходного языка. Каждое слово получает набор лексико-грамматических признаков. ПК формирует эти наборы с опорой на автоматический словарь.

3. Синтаксический синтез переводного языка:

- создание предложения переводного языка определенной синтаксической структуры, определяемой правилами исходного и переводного языка

- замена слов исходного языка на их переводные эквиваленты

При создании автоматического словаря решаются следующие задачи:

1. выбор типа лексической единицы для словаря:

а) в виде словоформ, т.е. в автоматический словарь заносятся всевозможные формы лексической единицы, которые подаются гнездами

б) в виде квазиосновы (блок #...)

- числа, стоящие после решетки (001, 002) условно обозначают те наборы суффиксов и окончаний, которые необходимо присоединить к основе, чтобы получить соответствующие формы слова

2. выбор типа лексической единицы зависит от:

- от типа языка (для русского, немецкого, белорусского – квазиоснова, для английского, французского – словоформа)

- от объема словаря

- от типа системы машинного перевода (для информативного перевода – квазиоснова, для профессионального – словоформа)


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: