Задание 2.2.13. Выполните тест

Задание 2.1.1

Ответ на ученический вопрос

Общие принципы решения лингвистических задач методом моделирования.

Дистанционное обучение с помощью интернет, существует большое количество серверов от различных организаций, позволяющих по сети передавать задания, учебные материалы и в интерактивном режиме вести опрос.

Атомат. обучающие системы АОС, в рамках которых разрабатывается большое количество мультимедийных программ, которые используются при обучении языка.

Примеры ИТ в обучении языка:

· Синтезирование человеческой речи

· Порождение (построение) нового текста

· Понимание текста, произносимого вслух

· Автомат. перевод текста

· Автомат. чтение и распознавание текста

· Автомат. составление аннотации, реферата, текста

· Автомат. индексирование текста

· Автомат. синтаксический анализ предложения

· Автомат. определение значения многозначного слова

· Автомат. определение автора некоторого неизвестного текста

· Автоматизированное создание словаря, слов, текстов какого-либо автора

Безопасность:

· Альтернативность (возможность выбора наиболее рациональных ИТ на основе анализа нескольких аналогичных)

· Интерактивность, т.е. диалоговый режим обмена информацией с автономными или коллективными пользователями

Доступность:

 

· Безбумажные технологии

· Компьютерные технологии

· Основной целью создания современных ИТ является максимальная информатизация и компьютеризация современного общества, обеспечивающая значительный рост производительности труда, максимальное удовлетворение информационных запросов всех членов общества, непрерывное повышение знаний, умений, навыков работы с самым современным оборудованием, техническим обеспечением фирм, офисов и других учреждений.

· интернет и т.д.

 

 

Ответ

Алгоритм реферирования текстов на базе статистического подхода.

 

1. Согласно законам Зипфа определяются характеристики исходного текста, и строится строка ключевых слов, т. е. терминов текста.

 

2. Фиксируется первое ключевое слово, и в реферат добавляются предложения, содержащие данное ключевое слово. При этом сохраняется порядок предложений относительно исходного текста.

 

3. Если достигнут требуемый размер реферата, алгоритм закончен, иначе выбирается следующее ключевое слово и повторяются шаги 2 и 3.

 

4. Если обработана вся строка ключевых слов, а заданный размер реферата не достигнут, из области значимых выбирается первое необработанное слово, а затем выполняется переход на шаг 2.

 

 


Ответ

План:

1. Реферат и аннотация текста. Общее понятие

2. Методы автоматического аннотирования и реферирования текстов.

3. Составление аннотаций и реферата текста компом на основе статистического метода.

 

Реферат – связный текст, который кратко выражает не только центральную тему или предмет какого-либо документа, но ицель, применяемые методы, основные результаты описанного исследования или разработки.

Аннотация – краткое изложение содержания документа, дающее общее представление о его теме.

Это вторичные документы, которые составляются к научным книгам, статьям, патентам на изобретение.

Составление реферата (аннотации текста) с помощью ПК - автоматическое реферирование (аннотирование).

Машинный реферат – либо последовательность предложений исходного текста, либо таблица, в ячейках которой располагаются ключевые слова или словосочетания. Первый в 1958.

Этапы построения реферата человеком:

1) Подготовительный – референт читает текст и пытается понять и осмыслить его в целом.

2) Аналитический – референт выделяет основные смысловые единицы (предложения).составляет план.

3) Этап непосредственного построения реферата. Выделенные ранее смысловые единицы (их комбинации) располагаются в единый вторичный текст в соответствии с планом.

В качестве смысловых единиц реферата могут быть:

1) Полные (без изменения) ключевые предложения исходного текста.

2) Перефразированные ключевые предложения.

3) Предложения, составленные из ключевых слов или словосочетаний.

4) Предложения, обобщающие несколько предложений исходного текста.

Смысловые единицы аннотации:

1) Ключевые слова или словосочетания исходного текста с предшествующими им специальными словами-реляторами типа: книга посвящена следующей проблеме…

2) Специальные предложения исходного текста, содержащие оценочные элементы или слова-клише (специализированные словесные штампы типа: недостаток заключается, ставится задача).

Компьютер должен уметь:

1) Находить в тексте ключевые слова, словосочетания, предложения.

2) Находить в тексте менее значимые единицы.

3) Составлять из текстовых единиц смысловые единицы реферата или аннотации.

4) Составлять из таких единиц текст реферата.

Методы:

1) Статистический. В нем ключевое слово – знаменательное слово текста, которое с учетом его всех синонимов встречается в тексте наибольшее число раз. Принадлежность слова к числу ключевых определяется специальным коэффициентом важности.

2) Позиционный. Основной критерий этого метода – место и позиция предложения в исходном тексте. 2 метода:

1. Метод заглавия. Основное содержаниетекста, выраженноетекстом заголовка, подзаголовка. Поэтому составляется словарь ключевых слов на основе знаменательных слов-заголовков.

2. Метод локализации (местонахождение). Работает на текстах узкой тематики. Идея: в таких текстах предложение о цели. Результат исследования занимает фиксированное место. Пример: патенты на изобретение – 1-2 предложения второго абзаца. Используются комплексно

3) Логико-семантический.исследуют структуру и семантику текста. Ключ – предложение с наибольшим функциональным весом, на величину которого влияют разные факторы (связь с левым и правым окружением, наличие в предложении семантически значимых слов, выделение жирным шрифтом). Эти методы используются комбинированно в расчете на получение более удовлетворительных вариантов.Перечисленные методы относятся к направлению квазиреферирования. Они основанына выделении из текстов наиболее информативных предложений, предающих основной смысл текста. Текст, полученный путем соединения готовых фрагментов, лишен гладкости, его трудно читать. Сегодня появились методы второго направления, основанные на выделении изтекстов наиболее информативной информации и создания (генерирования) с ее помощью новых текстов.Такое реферирование приближается к интеллектуальному реферированию. Эти системы могут работать сразу с несколькими источниками и с видеоинформацией.

Статистический. Задача: используя для выделения ключевых слов текста один из вариантов статистического метода, аименно……. коэффициент важности будет считаться Кважн = f*m/n*m. m–число абзацев, в которых встретилось слово……….

Составить алгоритм, позволяющий получить: а) аннотацию текста в виде релятора со следующими за ним ключевыми словосочетаниями текста. Ключевое словосочетание – ключевоеимя существительное,со стоящим перед ним определением, выраженное прилагательным или причастием. Б) словесный рефераттекста в виде последовательной цепочки ключевого предложения–предложения содержащие 3 и более ключевых слова.

Словоупотребление – цепочка символов, заключенных между 2 знаками пробела.

Словоформа – словоупотребление вне текста или предложения. Словоформы, имеющие одинаковое лексическое значение образуют слово (лексему).

Алгоритм решения задач:

1) ПК покаждому абзацу текста составляет алфавитно-частотный словарь.

2) Алфавитно-частотные словари объединяются в единыйраспределительный АЧС словоформ всего текста.

3) ПК проводит чистку АЧС, сжимает его до словаря потенциальных опорных слов:

1. Удаляется вся служебная и общеупотребительная лексика.

2. Объединяются все грамматические формы одного и того же слова.

3. Объединяются синонимы.

4. Удаляются лексические единицы, которые встретились только в одном абзаце.

4) Словарь потенциально ключевых слов делится на 2 части:

а) главных опорных слов;
б) второстепенных слов, что осуществляется на основе Кважн.

5) Строится аннотация. Используютсятолько главные опорные слова. Берутся слова-реляторы со следующими за ними ключ словосочетаниями.

6) Строится реферат. Просматривая исходный текст, ПК извлекает из него предложения, содержащие 3 и более главных или второстепенных опорных слов.

 

Машинный перевод

1. Типы перевода по степени автоматизации

2. Структура системы машинного перевода. По 1-ой технологии.

Перевод – вид человеческой языковой деятельности, в результате которой текст на одном языке ставится в соответствие тексту на другом языке. При этом обеспечивается их смысловая эквивалентность.

Типы перевода по степени автоматизации:

1) Традиционный ручной перевод, выполняемый человеком

2) Автоматизированный перевод:

1. Комп выполняет перевод, а за справками обращается к человеку.

2. Перевод, выполняемый человеком с помощью ПК

I. В памяти ПК двуязычный словарь и текстовый редактор

II. Системы TM(Translation Memory)

В основе этих прог лежит принцип сбора и хранения фрагментов перведенных человеком текста на 2 языках. Хранятся вспец накопителе переводов и служат бесценным подспорьем при последующем выполнении переводов той же тематики. Для каждой тематики создается новый накопитель. Ими можно обмениваться. Около 10 программ по этой технологии. Лидер – Trados.

3) Машинный (автомат перевод). выполняемое ПК действие по преобразованию текста на одном естественном языке в текст на 2ом при сохранении эквивалентности содержания, также результат такого действия.

Первые теоритические разработки по МП относятся к 30-40 годам, но практическое применение теории автомат перевода в 50х. продемонстрирован в 54г.

Поскольку большинство слов имеют несколько значений, основная трудность при переводе – выбор нужного перевода, для чего человек исп контекст,, свой жизненный опыт. Кот практически невозможно формализовать и загрузить в ПК. Человек участвует в процессе перевода, предредактор, постредактор. Но на сегодняшний день 2 технологии маш перевода:

1. Машинный перевод, основанный на правилах языка (модель перевода человеком)

2. Статистический маш перевод. Основан на сопоставлении параллельных текстов больших объемов и вычислении наиболее вероятного перевода.

 


Ответ

Машинный перевод - вид деятельности, в результате которой некоторый текст на одном языке становится в соответствие тексту на другом, обеспечивая смысловую эквивалентность.

М.П. - технология связного перевода текста компьютерной программой с одного языка на другой.

Способы применения ПК в переводе текста:

1) Перевод текста человеком с использованием ПК. Текст переводит человек, а за переводимыми эквивалентами он обращается к электр.словарям (Lingvo).

2) Перевод текста компьютером с использованием человека. Человек подключается к процессу перевода.

 

Есть три варианта подключения: 1 - предварительная подготовка текста, 2 -определённое преобразование текста в процессе перевода 3 - редакторская правка текста после перевода. 3) Автоматический перевод, выполняется без вмешательства человека.

Стратегии перевода:

1) прямой бинарный перевод - эффективность стратегии обеспеч.путём изд.больш.автом.перевод.словарей.

2) Трансформация - перевод-исходн.текст должен пройти вид преобразований. 3) Перевод с помощью языка посредника - развитие систем искусств.интеллекта, с использ.смежных баз знаний.

4) В зависимости от переводного материала перевод характеризуется на художественный литературный, научно-технический. По форме представления перевода: письменный, устный. По цели перевода: практический, учебный, экспериментальный.

 

 


 

Ответ

 

Алгоритм перевода текста с английского языка на русский язык

1. Отсканировать текст

2. Открыть изображение на компьютере в PDF-Reader

3. Сделать распознавание текста с помощью программы ABBYY FormReader

4. Скопировать текст

5. Открыть браузер

6. Открыть любой онлайн-переводчик

7. Вставить текст в окно переводчика

8. Скопировать полученный текст на русском языке

9. Вставить в текстовый редактор

10. Сохранить.


 

Задание 2.2.13. Выполните тест.

1. Аннотирование – это:

а) запись совокупности дескрипторов, отражающих содержание текста;

б) связный текст, полно выражающий центральную тему документа;


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: