Rule-base machine translation (перевод по правилам)

Это была самая первая модель и технология машинного перевода, которая появилась в 1954 году в ходе джорджтаунского эксперимента в Массачусетском технологическом институте (США). Для работы была построена модель и реализована в три этапа, на каждом из которых решался ряд задач по обработке языка.

Оригинал (текст) -> анализ->трансфер->синтез перевод (текст)

На этапе I самого перевода еще не происходит, просто на этом этапе подключаются программы анализа текста на всех уровнях языка.

Например,

(Маша)(ела)(кашу)

Каждая единица анализируется на предмет того, какую информацию можно извлечь. Узнаем словоформы для поиска в словаре.

Ела – есть, глагол, прошедшее время, единственное число

Каша – женский род, единственное число, винительный падеж

Маша – женский род, именительный падеж

Падеж нужен для того, чтобы узнать будущую структуру предложения.

На этапе трансфера уже происходит поиск эквивалентов на выходном языке, т.е. подключается словарь межъязыковой, и каждой единице подыскивается эквивалент

Есть – to eat;

Каша – porridge;

На этом же этапе подключаются алгоритмы транскрипции или транслитерации:

Маша – Masha.

На III этапе происходит сборка готового предложения, т.е. перевода на основе данных из предыдущих этапов, т.е. для сборки предложения необходима специальная формальная грамматика.

To eat: ate, was eating, has been eating – будет выбрано самое частотное время (ate).

Должно быть некое правило:

S_RU = VN_vN_i

N_iVN_v

N_vN_iV

S_EN = N_iVN_v

S_RU => S_EN, т.е. все варианты русского преобразуются в один вариант на английском.

Masha ate porridge

На этой классической технологии работает множество компьютерных переводчиков, например, PROMT, SYSTRAN и др.