Основные задачи применения информационных технологий в лингвистике

Информационная лингвистика.

 

Выполнила: Полякова Ксения

На современной стадии формирования таких непересекающихся дисциплин как лингвистика и информационные технологии, с уверенностью можно заявлять о том, что лингвистика, с одной стороны, зависит от технических возможностей современной компьютерной науки. В свою очередь, информационные технологии также заимствуют определенные приемы лингвистики. Так, на стыке двух дисциплин возникла компьютерная лингвистика, кроме того была сформирована лингвистическая база знаний, формирующая основу «лингвистического компонента» определенных компьютерных концепций. К их числу можно отнести системы искусственного интеллекта, машинного перевода, автоматического порождения текстов и др. К сфере компьютерной лингвистики принадлежит почти все, без исключения, что связано с применением ПК в языкознании.

Немаловажную роль информационные технологии сейчас имеют в обучении иностранным языкам, в ходе алгоритмизации лингвистических задач, при обработке лингвистических текстов и т. д. (см. Зубов 2004). Применение информационных технологий в лингвистике является необходимостью. Однако в действительности, с целью решения лингвистических задач применяется только незначительная доля всего объема информационных технологий: электронные словари и справочники, определенные программы пакета Microsoft Office. Более распространенной лингвистической задачей у нас считается поиск информации в сети Интернет. К сожалению, значительный потенциал современных информационных технологий остается незадействованным, по причине недостатка компьютерной грамотности филологов, отсутствия финансирования научно-исследовательских проектов по вопросам прикладной лингвистики, узкоспециальных интересов ученых и многое другое.

Анализируя определение понятия «информационные технологии» в лингвистике, следует отметить что информационные технологии в лингвистике — это совокупность законов, способов и средств получения, хранения, передачи, распространения, преобразования информации о языке и законах его функционирования с помощью компьютеров. Если сопоставить данное определение с теми вопросами, какие решает современная прикладная лингвистика, можно сказать, что понятие «информационные технологии» в лингвистике принадлежит в основном к задачам прикладной лингвистики. К таковым следует отнести формирование:

1. Систем искусственного интеллекта.

2. Систем автоматического перевода.

3. Систем автоматического аннотирования и реферирования текстов.

4. Систем порождения текстов.

5. Cистем обучения языку.

6. Cистем понимания устной речи.

7. Cистем генерации речи.

8. Автоматизированных информационно – поисковых систем.

9. Создание систем атрибуции и дешифровки анонимных и псевдоанонимных текстов.

10. Разработка различных баз данных (словарей, карточек, каталогов, реестров и т.п.) для гуманитарных наук.

11. Разработка различного типа автоматических словарей.

12. Разработка систем передачи информации в сети Интернет и т.д.

Данные комплексные задачи содержат полный ряд наиболее мелких вопросов. В том числе к таковым принадлежит автоматизация следующих процессов:

1. Построение словарей текстов.

2. Морфологический анализ слова.

3. Определение значения многозначного слова.

4. Синтаксический анализ предложения.

5. Поиск слова в словаре.

6. Порождение предложения и т.д.

Решение рассмотренных выше задач невозможно при отсутствии репрезентативных и качественных информационных массивов. Такие массивы следует постоянно дополнять различными справочными материалами и ресурсами: библиографии, справочники, словари, энциклопедии, биографии и другую вспомогательную информацию, которая необходима для полноценной работы ученого-лингвиста и лингвиста-студента.

В настоящее время один из основных источников профессиональной информации для лингвиста считается сеть Интернет, где есть различные ресурсы в виде массивов (баз) информации:

1. Электронные энциклопедии (feb-web. ш).

2. Сети словесных ассоциаций (wordassociations.net).

3. Электронные библиотеки (eLIBRARY. RU, КиберЛенинка, Арбикон).

4. Базы данных университетов.

5. Авторские сайты.

6. Форумы.

7. Текстовые процессоры (MicrosoftWord, LotusWordPro OpenOffice Writer)

8. Ментальные карты (ultra outliner).

Достаточно существенную часть интернет-массива занимают образовательные и научные ресурсы. Они составлены в виде интернет-библиотек: словари, энциклопедии, базы данных, архивы и проч. В связи с мобильностью и доступностью представляемой информации они пользуются широким спросом в научном и образовательном сообществе. Основная их отличительная черта - абсолютная доступность электронного информационного ресурса: книги, учебники, пособия, сборники, исторические источники, статьи и авторские монографии. Подобные ресурсы упрощают и ускоряют работу в обучении и научном исследовании лингвистов. Базовой основой каждого лингвиста считается работа с энциклопедическими источниками с целью извлечения нужной информации. По этой причине, в век информационных технологий, многотомные энциклопедии немного утратили свое значение. Электронные энциклопедии сейчас дают возможность быстро получить необходимую в работе информацию. Так как речь идет цифровой информации, которая хранится на серверах, следует сказать, что значительное превосходство, имеют электронные энциклопедии: динамическое пополнение базы данных, ее доработка и корректировка в реальном времени. В то время как классические печатные издания лишены такой возможности.

Философы, психологи и прочие эксперты утверждают, что в будущем социально защищенным может являться только тот человек, который может хорошо изменять направление и содержание своей деятельности, вследствие смены технологий либо условий рынка. Чтобы привести в готовность такого человека, следует сменить традиционную технологию получения новых знаний на эффективную организацию познавательной деятельности учащихся в учебном процессе. Совершить это возможно при помощи использования современных информационных технологий. Именно они смогут показать учащимся, что информационный источник представляет настоящую значимость только в том случае, если у него имеется соответствующий доступ. С их помощью будущих специалистов, возможно, обучить правильной организации хранения информации и выбору адекватных форм ее представления. «Интеллектуальная собственность, представленная в цифровом формате, станет главной "валютой" XXI века».

Технология получения и распространения новых знаний уже сейчас

неотделима от Internet. Создается инфраструктура соединяющая в единое целое глобальные и местные телекоммуникационные каналы, радиовещание, телевидение, телефонные линии связи. Все это не просто формирует сверхинтеллект, а создает новые измерения сознания, феномен сверхпсихологических изменений в личности человека. Большое распространение приобретают видеоконференции и дистанционное обучение.

К концу XXI века служители науки исследуют принципы работы мозга на уровне отдельных нейронов и научатся обращаться с ним, как с непростым электронным объектом. Это обеспечит рывок к формированию систем искусственного интеллекта, систем автоматического порождения текстов, их перевода, реферирования и т.д.

В настоящее время сфера информационных технологий проходит сильнейший технологический подъем. Сами информационные технологии обретают новый статус и становятся инструментом в руках исследователя. Таким образом, почти все без исключения лингвистические исследования, в том числе и масштабные, такие работы как составление словарей и грамматик, так или иначе нацелены на применение представительных корпусов текстов. К примеру, словари издательства Collins формировались на основе электронного языкового корпуса Bank of English, насчитывающего более 2,5 миллиардов слов. В поле зрения лингвиста также огромное число сайтов, форумов, виртуальных библиотек. Вышеприведенный обзор дает определенное понимание о количестве источников информации и ресурсах, которые предоставляют интерес для исследователя. Интернет способен, как никакой другой ресурс, объединить исследователей из разных стран, организовать конференцию участников в Сети, сделать возможным их виртуальное общение. Абсолютно очевидно, что пройдет немного времени до момента, когда появятся заказы на компьютерные программы, призванные обеспечивать лингвистические цели и задачи. В частности, существенной остается проблема статистического подсчета и обработки лексических единиц, которая традиционно выполнялась вручную, но без чего немыслимо ни одно исследование в области языкознания.

Таким образом, на нынешней стадии формирования техники компьютерная грамотность для филолога считается уже не требованием, а необходимым условием и одной из составляющих профессионального успеха.

 

 

Список литературы:

1. Баранов, в прикладную лингвистику /. – М.: Эдиториал УРСС, 2001. – 360с.

2. Зубов, технологии в лингвистике: Учеб. пособие /,. – М.: Издательский центр «Академия», 2004. – 208с.

3. Зубов, лингвистика: возможности и проблемы / // Актуальные проблемы компьютерной лингвистики: Сб. научных ст. Отв. ред.. – Минск: МГЛУ, 2005. – С.68-77.

4. Могилев,. пособие для студ. пед. вузов /,,; Под ред.. – 3-е изд., перераб. и доп. – М.: Издательский центр «Академия», 2004. – 848 с.

5. Острейковский,: учеб. для вузов /. – Мн.: Высш. шк., 1999. – 511 с.

6. Кравченя, информатики, компьютерной графики и педагогические программные средства /. – Мн.: ТетраСистемс, 2004. – 319 с.

7. https://studwood.ru

8. https://cyberleninka.ru

9. Голубева, проблемы поиска информации в сети Интернет и способы из разрешения / // Вестник МГЛУ. Сер. 1, Филология. Мн.: МГЛУ, 2006б. – № 3 (23). – С. 239–249.

10. Зубов, перевода терминологических словосочетаний с использованием параллельных текстов / // Теория и практика перевода. – 2005. - №1. – С.64-66.

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: