Дисциплина «Интеллектуальные ИС»

100. Классификация интеллектуальных информационных систем.

Интеллектуальные информационные системы (ИИС) – результат развития обычных информационных систем (ИС), которые сосредоточили в себе наиболее наукоемкие технологии с высоким уровнем автоматизации не только процессов подготовки информации для принятия решений, но и самих процессов выработки вариантов решений, опирающихся на полученные ИС данные.

ИИС можно классифицировать по разным основаниям, например:

- по областям применения (ИИС-менеджера, ИИС для анализа инвестиций, ИИС для налогообложения);

- по степени интеграции с другими программными средствами, используемыми на предприятии (автономные, сопрягаемые интерфейсом, интегрированные);

- по оперативности (статические, квазидинамические, реального времени);

- по адаптивности (обучаемые, настраиваемые);

- по используемой модели знаний (метод резолюций исчисления предикатов, фреймовые, продукционные, семантические сети, нейросетевые, нечеткие системы и выводы).

ИИС особенно эффективны в применении к слабоструктурированным задачам, в которых отсутствует строгая формализация и для решения которых применяются эвристические процедуры, позволяющие в большинстве случаев получить решение. По мере совершенствования принципов логического и правдоподобного вывода, применяемых в ИИС за счет использования нечеткой, модальной, временной логики, байесовских сетей вывода, ИИС начинают проникать в высокоинтеллектуальные области, связанные с разработкой стратегических решений по совершенствованию деятельности предприятий.

Включение в состав ИИС классических экономико-математических моделей, методов линейного, квадратичного и динамического программирования позволяет сочетать анализ объекта на основе экономических показателей с учетом факторов и рисков политических и внеэкономических факторов, оценивать последствия полученных решений.

Классификация ИИС может быть выполнена на основании признаков:

- по коммуникативным способностям (интеллектуальности интерфейса): интеллектуальные БЗ, естественно-языковой интерфейс, гипертекстовые системы, контекстные системы помощи, когнитивная графика;

- по решению сложных задач: классифицирующие системы, доопределяющие системы, трансформирующие системы, многоагентные системы;

- по способности к самообучению: индуктивные системы, нейронные сети, интеллектуальный анализ данных;

- по адаптивности: CASE- технология, компонентная технология.

Классификация ЭС (экспертных систем) может быть выполнена следующим образом:

- по решаемой задаче: интерпретация данных, диагностика, проектирование, прогнозирование, планирование, обучение, мониторинг, управление;

- по связи с реальным временем: статические, квазидинамические, динамические;

- по типу ЭВМ: супер-ЭВМ, ЭВМ на символьных процессорах, на рабочих станциях, на персональных компьютерах;

- по степени интеграции: автономные и гибридные.

Интерпретация данных является традиционной задачей для ЭС. Под интерпретацией понимается процесс определения смысла данных, результаты которого должны быть согласованными и корректными. Обычно предусматривается многовариантный анализ данных.

Под диагностикой понимается процесс соотнесения объекта с некоторым классом объектов или обнаружение неисправности в некоторой системе.

Проектирование состоит в подготовке спецификаций на создание объекта с заранее заданными свойствами. Прогнозирование позволяет предсказывать последствие некоторых событий или явлений на основании анализа имеющихся данных.

Под планированием понимается нахождение планов действий, относящихся к объектам, способным выполнять некоторые функции.

Обучение предполагает использование компьютера для усвоения материала по некоторой дисциплине.

Основная задача мониторинга – непрерывная интерпретация данных в реальном масштабе времени и сигнализация о выходе тех или иных параметров за допустимые пределы.

Под управлением понимается функция организованной системы, поддерживающая определенный режим деятельности.

Приведенные классификации ИИС не являются исчерпывающими и в процессе развития теории и практики построения систем могут модифицироваться и дополняться.

101. Модели представления знаний.

Важное место в теории искусственного интеллекта занимает проблема представления знаний, являющаяся, по мнению многих исследователей, ключевой. В общем виде модели представления знаний могут быть условно разделены на следующие классы:

1. Концептуальные модели используют эвристический метод, что позволяет при распознавании проблемы уменьшать время для ее предварительного анализа. Концептуальное описание не дает гарантии того, что метод может быть применен во всех соответствующих практических ситуациях. Практическое использование концептуальной модели влечет за собой необходимость преобразования ее в эмпирическую модель.

2. Эмпирические модели – это модели, как правило, описательного характера. Они могут варьировать от простого набора правил до полного описания.

3. Декларативные модели представления знаний основываются на предположении, что проблема представления некоей предметной области решается независимо от того, как эти знания потом будут использоваться. Поэтому модель как бы состоит из двух частей: статических описательных структур знаний и механизма вывода, оперирующего этими структурами и практически независимого от их содержательного наполнения. При этом в какой-то степени оказываются раздельными синтаксические и семантические аспекты знания, что является определенным достоинством указанных форм представления из-за возможности достижения их определенной универсальности. Эти модели представляют собой обычно множество утверждений. Предметная область представляется в виде синтаксического описания ее состояния. Вывод решений основывается в основном на процедурах поиска в пространстве состояний.

4. Процедурные модели представляют собой модели, в которых знания содержатся в процедурах небольших программ, которые определяют, как выполнять характерные действия. При этом можно не описывать все возможные состояния среды или объекта для реализации вывода. Достаточно хранить некоторые начальные состояния и процедуры, генерирующие необходимые описания ситуаций и действий.

При процедурном представлении знаний семантика заложена в описание элементов базы знаний, за счет чего повышается эффективность поиска решений. Статическая база знаний содержит только утверждения, приемлемые в данный момент, которые могут быть изменены или удалены. Общие знания и правила вывода представлены в виде специальных целенаправленных процедур, активизирующихся по мере надобности. Для повышения эффективности генерации вывода в систему добавляются знания о том, каким образом использовать накопленные знания для решения конкретной задачи.

Преимущества процедурных моделей: имеют большую эффективность механизмов вывода за счет введения дополнительных знаний, способны смоделировать практически любую модель представления знаний, имеют большую выразительную силу, которая проявляется в расширенной системе выводов.

Представление знаний в экспертных системах производится с помощью специально разработанных моделей.

1. Логические модели. Классическим механизмом представления знаний в системах является исчисление предикатов. Предикатом или логической функцией называется функция от любого числа аргументов, принимающая истинные значения 1 и 0. В исследованиях по искусственному интеллекту данная модель стала использоваться начиная с 50-х годов.

В системах, основанных на исчислении предикатов, знания представляются с помощью перевода утверждений об объектах некоторой предметной области в формулы логики предикатов и добавления их как аксиом в систему. Знания отображаются совокупностью таких формул, а получение новых знаний сводится к реализации процедур логического вывода. Однако действительность не укладывается в рамки классической логики, потому что человеческая логика, применяемая при работе с неструктурированными знаниями – это интеллектуальная модель с нечеткой структурой. При использовании нечеткой логики часто применяются два метода логического вывода: прямой и обратный метод.

Достоинство логических моделей:

– модель базируется на классическом аппарате математической логики, методы которой хорошо изучены и обоснованы;

– имеются достаточно эффективные процедуры вывода;

– база знаний предназначена для хранения большого количества аксиом, из которых по правилам вывода можно получать другие знания.

Основной недостаток: логики, адекватно отражающей человеческое мышление, еще не создано

2. Продукционные модели. Впервые были предложены Постом в 1943 г., применены в системах искусственного интеллекта в 1972 г. При исследовании процессов рассуждения и принятия решений человеком пришли к выводу, что человек в процессе работы использует продукционные правила. Правило продукций (англ. Production) – это правило вывода, порождающее правило.

Суть правила продукции для представления знаний состоит в том, что в левой части ставится в соответствие некоторое условие, а в правой части действие: если <перечень условия>[90], то <перечень действий>. Если это действие соответствует значению «истина», то выполняется действие, заданное в правой части продукции. В общем случае под условием понимается некоторое предложение, по которому осуществляется поиск в базе знаний, а под действием – действия, выполняемые при успешном исходе поиска.

Продукционные модели – это набор, правил вида «условия – действие», где условиями являются утверждения о содержимом некой базы данных, а действия представляют собой процедуры, которые могут изменять содержимое базы данных. Например: Если коэффициент соотношения заемных и собственных средств превышает единицу при низкой оборачиваемости, то финансовая автономность и устойчивость критическая.

Правила (в них выражены знания) и факты (их оценивают с помощью правил) являются основным структурным элементом систем искусственного интеллекта. Часто в практики управления правила выводятся эмпирически из совокупности фактов, а не путем математического анализа или алгоритмического решения. Такие правила называют эвристиками.

В продукционной модели база знаний состоит из набора правил. Программа, управляющая перебором правил – машина вывода, связывает знание воедино и выводит из последовательности знаний заключение.

В процессе обработки информации часто применяются два метода: прямой и обратный. В случае прямого подхода – метода сопоставления для поиска решений образцом служит левая часть продукционного правила – условие и задача решается в направлении от исходного состояния к целевому. В случае обратного подхода обработка информации осуществляется по методу генерации или выдвижения гипотезы[91] и ее проверки. Проверяются правые части продукционных правил с целью обнаружения в них искомого утверждения. Если такие продукционные правила существуют, то проверяется, удовлетворяет ли левая часть продукционного правила. Если да, то гипотеза подтверждается, если нет – отвергается.

В продукционных системах выделяют три основные компоненты:

– неструктурированная или структурированная БД;

– набор продукционных правил или продукций, каждая продукция состоит из двух частей:

a) условий (антецендент); в этой части определяются некоторые условия, которые должны выполняться в БД для того, чтобы были выполнены соответствующие действия;

b) действий (консеквент); эта часть содержит описание действий, которые должны быть совершены над БД в случае выполнения соответствующих условий. В простейших продукционных системах они только определяют, какие элементы следует добавить (или иногда удалить) в БД.

– интерпретатор, который последовательно определяет, какие продукции могут быть активированы в зависимости от условий, в них содержащихся; выбирает одно из применимых в данной ситуации правил продукций; выполняет действие из выбранной процедуры.

Продукционные модели близки к логическим моделям, но более наглядно отражают знания, поэтому являются наиболее распространенными средствами представления знаний. Чаще всего они применяются в промышленных экспертных системах, в качестве решателей или механизмов выводов.

Достоинства продукционных моделей:

– наглядность;

– высокая модульность – отдельные логические правила могут быть добавлены в базу знаний, удалены или изменены независимо от других, модульный принцип разработки систем позволяет автоматизировать их проектирование;

– легкость внесения дополнений и изменений;

– простота логического вывода.

Недостатки продукционных моделей:

– при большом количестве продукционных правил в базе знаний, изменение старого правила или добавления нового приводит к непредсказуемым побочным эффектам;

– затруднительна оценка целостного образа знаний, содержащего в системе.

3. Семантические сети[92]. Способ представления знаний с помощью сетевых моделей наиболее близок к тому, как они представлены в текстах на естественном языке. В его основе лежит идея о том, что вся необходимая информация может быть описана как совокупность троек: объекты или понятия и бинарное отношение между ними.

Наиболее общей сетевой моделью представления знаний являются семантические сети, в которых узлы и связи представляют собой объекты или понятия и их отношения, таким образом, что можно выяснить их значение. Это связано с тем, что в данной модели имеются средства реализации всех характерных для знаний свойств: внутренней интерпретации, стуктурированности, семантической метрики[93] и активности. Впервые понятие семантических сетей было введено в 60-х годах для представления семантических связей между концепциями слов.

Семантические сети применительно к задачам проектирования структуры баз данных экспертных систем используются в сравнительно узком диапазоне – для отражения структуры понятий и структуры событий. Они представляют собой модель, основой которой является формализация знаний в виде ориентированных графов с помеченными дугами, которая позволяют структурировать имеющуюся информацию и знания. Вершины графа соответствуют конкретным объектам, а дуги, их соединяющие, отражают имеющиеся между ними отношения. Построение сети способствует осмыслению информации и знаний, поскольку позволяет установить противоречивые ситуации, недостаточность имеющейся информации и т.п.

В семантических сетях, используются следующие отношения:

– лингвистические, включающие в себя отношения типа «объект», «агент», «условие», «место», «инструмент», «цель», «время» и др.;

– атрибутивные, к которым относят форму, размер, цвет и т.д.;

– характеризации глаголов, т. е. род, время, наклонение, залог, число;

– логические, обеспечивающие выполнение операций для исчисления высказываний (дизъюнкция, конъюнкция, импликация, отрицание);

– квантифицированные, т. е. использующие кванторы общности и существования;

– теоретико-множественные, включающие понятия «элемент множества», «подмножество», «супермножество» и др.

Различают:

– интенсиональную семантическую сеть, которая описывает предметную область на обобщенном, концептуальном уровне;

– экстенсиональную семантическую сеть, в которой производится конкретизация и наполнение фактическими данными.

Статические базы знаний, представленные с помощью семантических сетей, могут быть объектом действий, производимых активными процессами. Стандартные операции включают в себя процессы поиска и сопоставления, с помощью которых определяется, представлена ли в семантической модели (и где именно) специфическая информация.

Достоинство семантической сети:

– описание объектов и событий производится на уровне очень близком к естественному языку;

– обеспечивается возможность соединения различных фрагментов сети;

– отношения между понятиями и событиями образуют небольшое, хорошо организованное множество;

– для каждой операции над данными или знаниями можно выделить некоторый участок сети, который охватывает необходимые в данном запросе характеристики;

– обеспечивается наглядность системы знаний, представленной графически:

– близость структуры сети, представляющей знания, семантической структуре фраз на естественном языке;

– соответствие сети современным представлениям об организации долговременной памяти человека.

Недостатки семантической сети:

– сетевая модель не дает ясного представления о структуре предметной области, поэтому формирование и модификация такой модели затруднительны;

– сетевые модели представляют собой пассивные структуры, для обработки которых необходим специальный аппарат формального вывода и планирования.

Семантические сети нашли применение в основном в системах обработки естественного языка, частично в вопросно-ответных системах, а также в системах искусственного видения. В последних семантические сети используются для хранения знаний о структуре, форме и свойствах физических объектов. В области обработки естественного языка с помощью семантических сетей представляют семантические знания, знания о мире, эпизодические знания (т.е. знания о пространственно-временных событиях и состояниях).

Пример: Поставщик отгрузил товар из склада автотранспортом. На рис. 3.14. представлена интенсиональная семантическая модель, а на рис. 3.15. – экстенсиональная семантическая сеть. Факты обозначены овалом, понятия и объекты прямоугольником.

4. Фреймовые модели. Фреймы были впервые предложены в качестве аппарата для представления знаний М. Минским в 1975 г. Фреймовые модели представляют собой систематизированную в виде единой теории технологическую модель памяти человека и его сознания. Под фреймом понимают минимальные структуры информации, необходимые для представления класса объектов, явлений или процессов.

Фрейм можно представить в виде сети, состоящей из вершин и дуг (отношений), в которых нижние уровни фрейма заканчиваются слотами (переменными), которые заполняются конкретной информацией при вызове фрейма. Значением слота может быть любая информация: текст, числа, математические соотношения, программы, ссылки на другие фреймы. На заполнение слотов могут быть наложены ограничения, например цена не может быть отрицательной. Ниже приведены основные свойства фреймов.

– Наследование свойств. Все фреймы взаимосвязаны и образуют единую фреймовую структуру, поэтому достаточно просто производить композицию и декомпозицию информационных структур. Например: слот более низкого уровня указывает на слот более высокого уровня иерархии, откуда неявно наследуются (переносятся) значения аналогичных слотов, причем наследование свойств может быть частичным.

– Базовый тип. При эффективном использовании фреймовой системы, можно добиться быстрого понимания сущности данного предмета и его состояния, однако для запоминания различных позиций в виде фреймов необходимы большие объемы памяти. Поэтому только наиболее важные объекты данного предмета запоминаются в виде базовых фреймов, на основании которых строятся фреймы для новых состояний. При этом каждый фрейм содержит слот, оснащенный указателем подструктуры, который позволяет различным фреймам совместно использовать одинаковые части.

– Процесс сопоставления – процесс, в ходе которого проверяется правильность выбора фрейма, осуществляется в соответствии с текущей целью и информацией, содержащийся в данном фрейме. Фрейм содержит условия, ограничивающие значения слота, а цель используется для определения, какое из этих условий, имея отношение к данной ситуации, является существенным.

– Иерархическая структура, особенность которой заключается в том, что информация об атрибутах, которую содержит фрейм верхнего уровня, совместно используются всеми связанными с ним фреймами нижних уровней.

– Сети фреймов. Поиск фрейма, подобного предыдущему, осуществляется с использованием указателей различия. Поиск возможен благодаря соединению фреймов, описывающих объекты с небольшими различиями, с данными указателями и образованию сети подобных фреймов.

– Отношения «абстрактное – конкретное» и «целое – часть». Иерархическая структура фреймов основывается на отношениях «абстрактное – конкретное». На верхних уровнях расположены абстрактные объекты, на нижних уровнях – конкретные объекты. Объекты нижних уровней наследуют атрибуты объектов верхних уровней. Отношение «целое – часть» касается структурированных объектов и показывает, что объект нижнего уровня является частью объекта верхнего уровня. Наибольшее практическое применение получили отношения «абстрактное – конкретное».

Схема фрейма приведена на рис. 3.16. Теория фреймов послужила толчком к разработке языков представления знаний. Например, концепция объектно-ориентированного программирования в традиционных языках программирования использует понятия, близкие к фрейму. Модели фреймов имеют следующие достоинства:

– способность отображать концептуальную основу организации памяти человека;

– естественность и наглядность представления, модульность;

– поддержку возможности использования значений слотов по умолчанию.

– универсальность, так как позволяют отобразить все многообразие знаний.

В отличие от моделей других типов во фреймовых моделях более жесткая структура, которая называется протофреймом. Основной недостаток: отсутствие механизмов управления выводом, который частично устраняется при помощи присоединенных процедур, реализуемый силами пользователя системы.

В системах искусственного интеллекта могут использоваться одновременно несколько моделей представления знаний. Например, фрейм можно рассматривать как фрагмент семантической сети, предназначенной для описания объекта (ситуации) проблемной области со всей совокупностью присущих ему свойств. Значением некоторых слотов фрейма может быть продукция. В продукционных моделях используются некоторые элементы логических и сетевых моделей. Поэтому появляется возможность организовывать эффективные процедуры вывода и наглядное отображение знаний в виде сетей; отсутствие жестких ограничений позволяет изменять интерпретацию элементов продукции.

5. Нейронные сети. В настоящее время сформировалось новое научно-практическое направление – создание нейрокомпьютера, ЭВМ нового поколения, который способен к самоорганизации, обучению и имитирует некоторые способности человеческого мозга по обработке информации. Результатами явились представления знаний, основанные на массированной параллельной обработке, быстром поиске больших объемов информации и способности распознавать образцы. Технологии, направленные на достижение этих результатов относятся к нейронным вычислениям или искусственным нейронным сетям.

102. РОЦ-технология для построения экономических советующих систем.

103. Структура статической экспертной системы.

Структура экспертных систем состоит из следующих основных компонентов: решателя (интерпретатора); рабочей памяти (РП), называемой также базой данных (БД); базы знаний (БЗ); компонентов приобретения знаний; объяснительного компонента; диалогового компонента.

База данных (рабочая память) предназначена для хранения исходных и промежуточных данных решаемой в текущий момент задачи. Этот термин совпадает по названию, но не по смыслу с термином, используемым в информационно-поисковых системах (ИПС) и системах управления базами данных (СУБД) для обозначения всех данных (в первую очередь долгосрочных), хранимых в системе.

Рисунок 1.2 Основные компоненты ЕС

База знаний (БЗ) в экспертных системах предназначена для хранения долгосрочных данных, описывающих рассматриваемую область (а не текущих данных), и правил, описывающих целесообразные преобразования данных этой области.

Решатель, используя исходные данные из рабочей памяти и знания из БЗ, формирует такую последовательность правил, которая приводит к решению задачи.

Компонент приобретения знаний автоматизирует процесс наполнения экспертных систем знаниями, осуществляемый пользователем-экспертом.

Объяснительный компонент объясняет, как система получила решение задачи (или почему она не получила решение) и какие знания она при этом использовала, что облегчает эксперту тестирование системы и повышает доверие пользователя к полученному результату.

Диалоговый компонент ориентирован на организацию дружественного общения с пользователем как в ходе решения задач, так и в процессе приобретения знаний и объяснения результатов работы.

В разработке экспертных систем участвуют представители следующих специальностей:

· эксперт проблемной области, задачи которой будет решать экспертные системы;

· инженер по знаниям - специалист по разработке экспертных систем (используемые им технологию, методы называют технологией (методами) инженерии знаний);

· программист по разработке инструментальных средств, предназначенных для ускорения разработки экспертных систем.

Необходимо отметить, что отсутствие среди участников разработки инженеров по знаниям (т. е. их замена программистами) либо приводит к неудаче процесс создания экспертных систем, либо значительно удлиняет его.

Эксперт определяет знания (данные и правила), характеризующие проблемную область, обеспечивает полноту и правильность введенных в экспертные системы знаний.

Инженер по знаниям помогает эксперту выявить и структурировать знания, необходимые для работы экспертных систем; осуществляет выбор того инструментального средства, которое наиболее подходит для данной проблемной области, и определяет способ представления знаний в этом инструментальных средств; выделяет и программирует (традиционными средствами) стандартные функции (типичные для данной проблемной области), которые будут использоваться в правилах, вводимых экспертом.

Программист разрабатывает инструментальные средства (если инструментальные средства разрабатывается заново), содержащее в пределе все основные компоненты экспертных систем, и осуществляет его сопряжение с той средой, в которой оно будет использовано.

Экспертная система работает в двух режимах: режиме приобретения знаний и в режиме решения задачи (называемом также режимом консультации или режимом использования экспертных систем).

В режиме приобретения знаний общение с экспертными системами осуществляет (через посредничество инженера по знаниям) эксперт. В этом режиме эксперт, используя компонент приобретения знаний, наполняет систему знаниями, которые позволяют экспертным системам в режиме решения самостоятельно (без эксперта) решать задачи из проблемной области. Эксперт описывает проблемную область в виде совокупности данных и правил. Данные определяют объекты, их характеристики и значения, существующие в области экспертизы. Правила определяют способы манипулирования с данными, характерные для рассматриваемой области.
Отметим, что режиму приобретения знаний в традиционном подходе к разработке программ соответствуют этапы алгоритмизации, программирования и отладки, выполняемые программистом. Таким образом, в отличие от традиционного подхода в случае экспертных систем разработку программ осуществляет не программист, а эксперт (с помощью экспертных систем), не владеющий программированием.

В режиме консультации общение с экспертными системами осуществляет конечный пользователь, которого интересует результат и (или) способ его получения. Необходимо отметить, что в зависимости от назначения экспертных систем пользователь может не быть специалистом в данной проблемной области (в этом случае он обращается к экспертным системам за результатом, не умея получить его сам), или быть специалистом (в этом случае пользователь может сам получить результат, но он обращается к экспертным системам с целью либо ускорить процесс получения результата, либо возложить на экспертную систему рутинную работу). В режиме консультации данные о задаче пользователя после обработки их диалоговым компонентом поступают в рабочую память. Решатель на основе входных данных из рабочей памяти, общих данных о проблемной области и правил из БЗ формирует решение задачи. Экспертные системы при решении задачи не только исполняет предписанную последовательность операции, но и предварительно формирует ее. Если реакция системы не понятна пользователю, то он может потребовать объяснения: "Почему система задает тот или иной вопрос?", "как ответ, собираемый системой, получен?".

Рисунок 1.3 Классификация экспертных систем

Структуру (Рисунок 1.3) называют структурой статической экспертной системы. Экспертные системы данного типа используются в тех приложениях, где можно не учитывать изменения окружающего мира, происходящие за время решения задачи. Первые экспертные системы, получившие практическое использование, были статическими.

В архитектуру динамической экспертной системы по сравнению со статической экспертной системы вводятся два компонента: подсистема моделирования внешнего мира и подсистема связи с внешним окружением. Последняя осуществляет связи с внешним миром через систему датчиков и контроллеров. Кроме того, традиционные компоненты статической экспертной системы (база знаний и машина вывода) претерпевают существенные изменения, чтобы отразить временную логику происходящих в реальном мире событий.

104. Коммуникационные методы извлечения знаний.

Коммуникативные методы извлечения знаний охватывают методы и процедуры контактов инженера по знаниям с непосредственным источником знаний – экспертом.

В свою очередь коммуникативные методы можно разделить на активные и пассивные. Пассивные методы подразумевают, что ведущую роль в процедуре извлечения знаний играет эксперт, а инженер по знаниям только протоколирует высказывания эксперта во время его работы. В активных методах инициативой владеет инженер по знаниям, который контактирует с экспертом различными способами: в играх, диалогах, беседах за круглым столом. Следует отметить, что активные и пассивные методы могут чередоваться даже в рамках одного сеанса извлечения знаний.

Активные методы

Активные методы можно разделить на две группы, в зависимости от числа экспертов, отдающих свои знания. Если их число больше одного, то целесообразно кроме индивидуальных контактов с каждым применять и методы групповых обсуждений предметной области. Групповые методы обычно активизируют мышление участников дискуссий и позволяют выявлять различные аспекты их знаний. И тем не менее индивидуальные методы извлечения знаний являются наиболее продуктивными, поскольку деликатная процедура передачи знаний не терпит лишних свидетелей.

Игровые методы широко используются в социологии, экономике, менеджменте и педагогике для подготовки руководителей, учителей, врачей и других специалистов. В игре человек раскрепощается и чувствует себя намного свободнее, чем в обычной трудовой деятельности.

На выбор метода извлечения знаний влияют три фактора:

  • личностные особенности инженера по знаниям;
  • личностные особенности эксперта;
  • характеристика предметной области.

Существуют три типа классификации людей по психологическим характеристикам:

  • мыслитель (познавательный тип);
  • собеседник (эмоционально-коммуникативный тип);
  • практик (практический тип).

Мыслители ориентированы на интеллектуальную работу, теоретические обобщения. Собеседники – это общительные, открытые люди, готовые к сотрудничеству. Практики предпочитают действия разговорам, хорошо реализуют замыслы других.

Предметные области можно классифицировать следующим образом:

  • хорошо документированные;
  • среднедокументированные,
  • слабодокументированные.

Остановимся подробнее на пассивных методах извлечения знаний. В пассивных методах ведущая роль при извлечении знаний передается эксперту, а инженер по знаниям только фиксирует рассуждения эксперта во время принятия решений.

Пассивные методы

Реализуются в виде:

  • наблюдений;
  • анализа протоколов «мыслей вслух»;
  • лекций.

Во время наблюдений инженер по знаниям находится рядом с экспертом во время его профессиональной деятельности или имитации этой деятельности и фиксирует все действия эксперта, его реплики и объяснения. Полезна видеозапись всего процесса в реальном масштабе времени. Следует отметить, что именно этот метод извлечения знаний является наиболее «чистым» методом, исключающим навязывание инженером по знаниям своих представлений эксперту.

В случае протоколирования «мыслей вслух» эксперта просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, представить всю цепочку своих рассуждений. Во время рассуждения эксперта все его слова, паузы и междометия протоколируются инженером по знаниям. Использование магнитофона не всегда возможно, так как его применение в некоторых случаях негативно действует на эксперта и разрушает атмосферу доверительности. Основной проблемой в этом методе является принципиальная сложность для любого человека объяснить, как он думает.

Лекция является самым испытанным способом передачи знаний. Необходимо сформулировать эксперту тему и задачу лекции. Искусство ведения конспекта заключается в выделении главного, фиксировании фрагментов, записи только осмысленных предложений и помехоустойчивости инженера по знаниям. Рекомендуется стандартная продолжительность лекции – 40 – 50 минут и после перерыва (5 – 10 минут) вновь проводится лекция такой же продолжительности. Курс обычно содержит от двух до пяти лекций.

Активные индивидуальные методы извлечения знаний

Являются самыми распространенными. К ним относятся:

  • анкетирование;
  • интервью;
  • свободный диалог;
  • игры с экспертом.

В активных методах инженер по знаниям пишет сценарий и режиссирует сеансы извлечения знаний.

Анкетирование является наиболее стандартизованным методом. В этом случае инженер по знаниям составляет анкету, размножает ее и использует для опроса нескольких экспертов. Это основное преимущество анкетирования.

Свободный диалог – это метод извлечения знаний в форме беседы инженера по знаниям и эксперта, в котором нет жестко регламентированного плана и вопросника. Квалифицированная подготовка к диалогу помогает инженеру по знаниям стать сценаристом будущих сеансов и запланировать плавную процедуру извлечения знаний: от приятного впечатления в начале беседы переходят к профессиональному контакту через пробуждение интереса и завоевание доверия эксперта. Чтобы разговорить эксперта, желательно вначале рассказать ему о себе, о своей работе.

К активным групповым методам извлечения знаний относятся ролевые игры, дискуссии за «круглым столом» с участием нескольких экспертов и «мозговые штурмы». Преимущество групповых методов состоит в одновременном извлечении знаний от нескольких экспертов и возможности генерации экспертами новых идей в процессе взаимодействия друг с другом.

Перед началом дискуссии ведущему необходимо:

  • убедиться, что все правильно понимают задачу (сеанс извлечения знаний);
  • установить регламент;
  • четко сформулировать тему.

Активные групповые методы

Обычно применяют как дополнительные к традиционным индивидуальным методам для активизации мышления и поведения экспертов.

Мозговой штурм является одним из наиболее распространенных методов активизации творческого мышления. Впервые этот метод был использован в 1939 г. в США А. Осборном как способ получения новых идей в условиях запрещения критики. Установлено, что критика мешает творческому мышлению, поэтому основная идея штурма – это отделение процедуры генерирования идей в замкнутой группе специалистов от процесса анализа и оценки высказанных идей.

Представляет интерес остановиться еще на одном методе извлечения знаний – экспертных играх. Игрой называется такой вид человеческой деятельности, который отражает (воссоздает) другие ее виды. Понятие экспертной игры или игры с экспертами в целях извлечения знаний формировалось на основе трех разновидностей игр:

  • деловых игр, широко используемых при подготовке специалистов и моделировании;
  • диагностических игр;
  • компьютерных игр, применяемых в обучении.

105. Многоагентная система «Электронный магазин».

Многоагентная cистема (МАС, англ. Multi-agent system) — это система, образованная несколькими взаимодействующими интеллектуальными агентами. Многоагентные системы могут быть использованы для решения таких проблем, которые сложно или невозможно решить с помощью одного агента или монолитной системы (англ.). Примерами таких задач являются онлайн-торговля, ликвидация чрезвычайных ситуаций[2], и моделирование социальных структур.

В многоагентной системе агенты имеют несколько важных характеристик:

- Автономность: агенты, хотя бы частично, независимы

- Ограниченность представления: ни у одного из агентов нет представления о всей системе, или система слишком сложна, чтобы знание о ней имело практическое применение для агента.

- Децентрализация: нет агентов, управляющих всей системой

Обычно в многоагентных системах исследуются программные агенты. Тем не менее, составляющими мультиагентной системы могут также быть роботы, люди или команды людей. Также, многоагентные системы могут содержать и смешанные команды.

В многоагентных системах может проявляться самоорганизация и сложное поведение даже если стратегия поведения каждого агента достаточно проста. Это лежит в основе так называемых муравьиных алгоритмов.

Агенты могут обмениваться полученными знаниями, используя некоторый специальный язык и подчиняясь установленным правилам «общения» (протоколам) в системе. Примерами таких языков являются Knowledge Query Manipulation Language (KQML) и FIPA’s Agent Communication Language (ACL).

Изучение многоагентных систем связано с решением достаточно сложных проблем искусственного интеллекта.

Темы для исследования в рамках МАС:

- знания, желания и намерения (BDI),

- кооперация и координация,

- организация,

- коммуникация,

- согласование,

- распределенное решение,

- распределенное решение задач,

- мультиагентное обучение

- надежность и устойчивость к сбоям

Многие МАС имеют компьютерные реализации, основанные на пошаговом имитационном моделировании. Компоненты МАС обычно взаимодействуют через весовую матрицу запросов и матрицу ответов,

Модель «Запрос — Ответ — Соглашение» — обычное явление для МАС. Схема реализуется за несколько шагов:

сначала всем задаётся вопрос наподобие: «Кто может мне помочь?»

на что только «способные» отвечают «Я смогу, за такую-то цену»

в конечном итоге, устанавливается «соглашение»

Для последнего шага обычно требуется ещё несколько (более мелких) актов обмена информацией. При этом принимаются во внимание другие компоненты, в том числе уже достигнутые «соглашения» и ограничения среды.

Другой часто используемой парадигмой в МАС является «феромон», где компоненты «оставляют» информацию для следующих в очереди или ближайших компонентов. Такие «феромоны» могут испаряться со временем, т. е. их значения могут изменяться со временем.

МАС также относятся к самоорганизующимся системам, так как в них ищется оптимальное решение задачи без внешнего вмешательства. Под оптимальным решением понимается решение, на которое потрачено наименьшее количество энергии в условиях ограниченных ресурсов.

Главное достоинство МАС — это гибкость. Многоагентная система может быть дополнена и модифицирована без переписывания значительной части программы. Также эти системы обладают способностью к самовосстановлению и обладают устойчивостью к сбоям, благодаря достаточному запасу компонентов и самоорганизации.

Многоагентные системы применяются в нашей жизни в графических приложениях, например, в компьютерных играх. Агентные системы также были использованы в фильмах. Теория МАС используется в составных системах обороны. Также МАС применяются в транспорте, логистике, графике, геоинформационных системах и многих других. Многоагентные системы хорошо зарекомендовали себя в сфере сетевых и мобильных технологий, для обеспечения автоматического и динамического баланса нагруженности, расширяемости и способности к самовосстановлению

106. Нейронная сеть с прямой связью.

Мы будем рассматривать два вида нейронных сетей: статические, которые также часто называют сетями с прямой связью (feed-forward), и динамические, или рекуррентные сети. В этом разделе мы займемся статическими сетями. Сети других видов будут кратко рассмотрены позднее.

Нейронные сети с прямой связью состоят из статических нейронов, так что сигнал на выходе сети появляется в тот же момент, когда подаются сигналы на вход. Организация (топология) сети может быть различной. Если не все составляющие ее нейроны являются выходными, говорят, что сеть содержит скрытые нейроны. Наиболее общий тип архитектуры сети получается в случае, когда все нейроны связаны друг с другом (но без обратных связей). В конкретных задачах нейроны обычно бывают сгруппированы в слои.

На рис. 13.2 показана типовая схема нейронной сети с прямой связью с одним скрытым слоем.

Выходные элементы

Скрытые элементы

Входные элементы

Рис. 13.2. Нейронная сеть с прямой связью с одним скрытым слоем (пopoгu не отмечены)

Интересно отметить, что, согласно теоретическим результатам, нейронные сети с прямой связью и с сигмоидными функциями являются универсальным средством для приближения (аппроксимации) функций. Говоря точнее, любую вещественнозначную функцию нескольких переменных на компактной области определения можно сколь угодно точно приблизить с помощью трехслойной сети. При этом правда, мы не знаем ни размеров сети, которая для этого потребуется, ни значений весов. Более того, из доказательства этих результатов видно, что число скрытых элементов неограниченно возрастает при увеличении точности приближения. Сети с прямой связью, действительно, могут служить универсальным средством для аппроксимации, но нет никакого правила, позволяющего найти оптимальную топологию сети для данной задачи.

Таким образом, задача построения нейронной сети является нетривиальной. Вопросы о том, сколько нужно взять скрытых слоев, сколько элементов в каждом из них, сколько связей и какие обучающие параметры, в имеющейся литературе, как правило, трактуются облегченно.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: