Лінґвістичний аспект

Лінґвістичний (А2) аспект стосується досліджень мовних проблем, тому що мова - це основний засіб спілкування в процесі видобування знань. Область розроблення природно-мовних інтерфейсів і весь спектр проблем, пов'язаних з нею - лексичних, синтаксичних, семантичних, прагматичних і т.ін. [113], [114], [115], у цій книзі не розглядається.

В інженерії знань можна виділити три шари лінґвістичних проблем (рис. 5.8):

Рис. 5.8. Лінґвістичний аспект видобування знань.

«Загальний код» (S21)

«Загальний код» вирішує проблему мовних ножиць між професійною термінологією експерта і повсякденною літературною мовою інженера зі знань і включає наступні компоненти:

S21 = {s21_i}= {загальнонаукова термінологія; спеціальні поняття із професійної літератури; елементи побутової мови; неологізми, сформовані за час спільної роботи; професійний жаргон і ін.}.

Деталізація схеми спілкування (див. рис. 5.5) дозволяє зобразити засоби спілкування як два потоки [116], у яких нас цікавлять компоненти V1 і V2 — мови, якими говорять аналітик і експерт (V11, V21 — невербальні компоненти). Розходження мов V1 і V2 обумовлює «мовний бар'єр» або «мовні ножиці» у спілкуванні інженера зі знань і експерта.

Ці дві мови є відображенням «внутрішньої мови» експерта й аналітика, оскільки більшість психологів і лінґвістів вважають, що мова — це основний засіб мислення поряд з іншими знаковими системами «внутрішнього користування» (універсальний семантичний код – УСК [117], мови «змісту» [118], концептуальні мови [119] і ін.). Мова аналітика V1 складається із трьох компонентів:

· s21_l – загальнонаукової термінології з її «теоретичним багаже»;

· s21_2 – термінів предметної області, які аналітик почерпнув зі спеціальної літератури в період підготовки;

· s21_3 – побутової розмовної мови, якою користується аналітик.

Мова експерта V2 включає:

· s21_l – загальнонаукову термінологію;

· s21_2 – спеціальну термінологію, прийняту в предметній області;

· s21_3 – побутову мову;

· s21_4 – неологізми, створені експертом за час роботи, тобто його про­фесіональний жаргон.

Якщо вважати, що побутова й загальнонаукова мови у двох учасників спілкування приблизно збігаються (хоча реально обсяг другого компонента в експерта істотно більший), то деяка загальна мова або код, який необхідно виробити партнерам для успішної взаємодії, буде складатися з потоків, зображених на рис. 5.9.

Надалі цей загальний код перетвориться в деяку понятійну (семантичну) мережу, що є прообразом поля знань предметної області. Вироблення загального коду починається з виписуванням аналітиком всіх термінів, уживаних експертом, і уточнення їхнього змісту. Фактично це є складання словника предметної області. Потім випливає групування термінів і вибір синонімів (слів, що означають те саме). Розробка загального коду закінчується складанням словника термінів предметної області з попереднім угрупованням їх за змістом, тобто за понятійною близькістю (це вже перший крок структурування знань).

На цьому етапі аналітик повинен уважно віднестись до всіх спеціальних термінів, намагаючись максимально вникнути в суть розв'язуваних проблем і термінологію. Освоєння аналітиком мови предметної області - перший рубіж на підступах до створення адекватної бази знань.

Рис. 5.9. Структура загального коду.

Рис. 5.9 дає уявлення про процес неоднозначності інтерпретації термінів двома фахівцями. У семіотиці, науці про знакові системи, проблема інтерпретації є однією із центральних. Інтерпретація зв’язує «знак» і «означуваний предмет». Тільки в інтерпретації знак одержує зміст.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: