СТРУКТУРИРОВАНИЕ ЗНАНИЙ
Центральной проблемой при создании интеллектуальных информационных технологий
является адекватное отображение знаний специалиста в памяти компьютера. Это привело
к развитию нового направления в информатике — инженерии знаний, где определяется
соотношение человеческого знания и его формализованного (информационного) отображения в ЭВМ. Инженерия знаний изучает и разрабатывает вопросы, связанные с получением
знаний, их анализом и формализацией для дальнейшей реализации в интеллектуальной
системе.
Цель главы — дать обзор основных теоретических аспектов инженерии знаний
и познакомить с некоторыми практическими методами работы инженеров по
знаниям.
ПОСЛЕ ИЗУЧЕНИЯ ГЛАВЫ ВЫ ДОЛЖНЫ ЗНАТЬ:
> Подходы к получению знаний при разработке экспертных систем
> Теоретические проблемы, возникающие при извлечении знаний
> Особенности психологических и лингвистических факторов, которые необходимо
учитывать инженеру по знаниям
> Влияние философии познания на работу инженера по знаниям
|
|
> Методы инженера по знаниям при работе с источником знаний
> Методы извлечения знаний
> Суть экспертных игр
> Методы извлечения знаний из текстов
> Структурирование полученных знаний
> Формирование понятийной и функциональной структуры предметной области
> Каким образом формализуются знания и формируется база знаний
17.1. ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ
ПОЛУЧЕНИЯ ЗНАНИЙ
• Стратегии получения знаний
• Психологический аспект
• Лингвистический аспект
• Гносеологический аспект
СТРАТЕГИИ ПОЛУЧЕНИЯ ЗНАНИИ
Существует несколько стратегий получения знаний. Наиболее распространенные:
• приобретение;
• извлечение;
• формирование.
Под приобретением знаний понимается способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом
структура знаний заранее закладывается в программу). Эта стратегия требует существенной
предварительной проработки предметной области. Системы приобретения знаний действительно приобретают готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих инструментальных средств специально
ориентировано на конкретные экспертные системы с жестко обозначенной предметной областью и моделью представления знаний, т.е. не являются универсальными. Например, система TEIRESIAS [18], ставшая прародительницей всех инструментариев для приобретения
знаний, предназначена для пополнения базы знаний системы MYCIN или ее дочерних ветвей, построенных на "оболочке" EMYCIN [10] в области медицинской диагностики с использованием продукционной модели представления знаний.
|
|
Термин извлечение знании касается непосредственного живого контакта инженера по знаниям и источника знаний. Авторы склонны использовать этот термин как
более емкий и более точно выражающий смысл процедуры переноса компетентности эксперта через инженера по знаниям в базу знаний экспертной системы.
Термин формирование знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается раз-
работкой моделей, методов и алгоритмов анализа данных для получения знаний и обучения.
Эта область включает индуктивные модели формирования гипотез на основе обучающих
выборок, обучение по аналогии и другие методы.
Таким образом, можно выделить три стратегии проведения стадии получения знаний
при разработке экспертных систем (рис. 17.1).
На современном этапе разработки экспертных систем в нашей стране стратегия извлечения знаний, по-видимому, является наиболее актуальной, поскольку промышленных систем приобретения и формирования знаний на отечественном рынке программных средств практически нет.
Извлечение знаний — это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области.
Рис. 17.1. Три стратегии получения знаний
В настоящее время большинство разработчиков экспертных систем отмечают, что
процесс извлечения знаний остается самым "узким" местом при построении промышленных систем.
Процесс извлечения знаний — это длительная и трудоемкая процедура, в которой инженеру по знаниям, вооруженному специальными знаниями по когнитивной психологии [3], системному анализу, математической логике и пр., необходимо воссоздать модель
предметной области, которой пользуются эксперты для принятия решения. Часто начинающие разработчики экспертных систем, желая избежать этой мучительной процедуры, зада-
ют вопрос: может ли эксперт сам извлечь из себя знания? По многим причинам это
нежелательно.
Во-первых, большая часть знаний эксперта — это результат многочисленных наслоений, ступеней опыта. И часто зная, что из А следует В, эксперт не дает себе отчета, что цепочка его рассуждений была гораздо длиннее, например С —> D, D —> А, А — > В, или Л —> Q,
Q-*R,R^>B.
Во-вторых, как было известно еще древним (вспомним "Диалоги" Платона), мышление диалогично. И поэтому диалог инженера по знаниям и эксперта — наиболее естественная форма "раскручивания" лабиринтов памяти эксперта, в которых хранятся знания,
частью носящие невербальный характер, т.е. выраженные не в форме слов, в форме наглядных образов, например. Именно в процессе объяснения инженеру по знаниям эксперт на
эти размытые ассоциативные образы надевает четкие словесные ярлыки, т.е. вербализует
знания.
В-третьих, эксперту гораздо труднее создать модель предметной области вследствие
той глубины и необозримости информации, которой он обладает. Многочисленные причинно-следственные связи реальной предметной области образуют сложную систему, из которой выделить "скелет", или главную структуру, иногда доступнее аналитику, владеющему к
тому же системной методологией. Любая модель — это упрощение, а упрощать легче с
меньшим знанием деталей.
Чтобы разобраться в природе извлечения знаний, выделим три основных аспекта этой
процедуры (рис. 17.2): психологический, лингвистический, гносеологический, которые подробно описаны в [4].
Рис. 17.2. Основные аспекты
извлечения знаний