Коллективное поведение агентов

Классификация агентов

Для классификации агентных программ используются два основных признака: 1) степень развития внутреннего представления о внешнем мире; 2) способ принятия решения.

Простейшим видом агента является простой рефлексный агент. Подобные агенты выбирают действия на основе текущего восприятия состояния среды, игнорируя всю остальную историю восприятия. Простые рефлексные агенты чрезвычайно просты, но обладают ограниченным интеллектом.

Рисунок 11.1 – Структура простого рефлексного агента.

В условиях частичной наблюдаемости необходимо, чтобы агент отслеживал изменение среды. Это означает, что агент должен обладать множеством внутренних состояний, смена которых зависит от истории восприятия.

На рис. 11.2 приведена структура агента, действующего с учетом внутреннего состояния. Текущее восприятие комбинируется с прежним внутренним состоянием, в результате совершаются действия и происходит смена внутреннего состояния.

Рисунок 11.2 – Агент, действующий с учётом внутреннего состояния.

Знаний о текущем состоянии среды не всегда достаточно для принятия решения. Тогда агенту требуется не только описание текущего состояния, но и информация о цели, которая описывает желаемые ситуации. Структура агента, действующего на основе цели, показана на рисунке 11.3. Он следит за состоянием среды, а также за множеством целей, которых он пытается достичь, и выбирает действие, направленное на достижение этих целей.

Рисунок 11.3 – Структура агента, действующего на основе целей.

Часто имеют место ситуации, когда для принятия решения недостаточно информации только о целях. Во-первых, если имеются конфликтующие цели, такие, что могут быть достигнуты только некоторые из них (например, или скорость, или безопасность). Во-вторых, если имеется несколько целей, к которым может стремиться агент, но каждая из них может быть достигнута с некоторой вероятностью успеха. В этом случае в программу агента вводится функция полезности которая ставит в соответствие состояниям агента вещественное число, имеющее смысл ожидаемой полезности данного состояния. Агент выбирает действие, которое ведет к наилучшей ожидаемой полезности.

Рисунок 11.4 – Структура агента, основанного на модели и на полезности.

В особый класс выделяют обучающихся агентов. Обучение имеет важное преимущество: оно позволяет агенту функционировать в первоначально неизвестных ему вариантах среды и становиться более компетентным по сравнению с тем, что могли бы позволить только его начальные знания.

В структуре обучающегося агента выделяют на четыре концептуальных компонента, как показано на рисунке 11.5. Производительным компонентом может являться любая из рассмотренных ранее структур агентных программ. Обучающий компонент использует информацию обратной связи от критика с оценкой того, как действует агент, и определяет, каким образом должен быть модифицирован производительный компонент для того, чтобы он успешнее действовал в будущем.

Рисунок 11.5 – Структура обучающегося агента.

Критик сообщает обучающему компоненту, насколько хорошо действует агент с учетом постоянного стандарта производительности, поскольку сами результаты восприятия не дают никаких указаний на то, успешно ли действует агент. Этот стандарт следует рассматривать как полностью внешний по отношению к агенту, поскольку агент не должен иметь возможности его модифицировать. Например, шахматная программа может получить результаты восприятия укатывающие на то, что она поставила мат своему противнику, но ей требуется стандарт производительности, который позволил бы определить, что это – хороший результат, так как сами данные восприятия ничего об этом не говорят.

Последним компонентом обучающегося агента является генератор проблем. Его задача состоит в том, чтобы предлагать действия, которые должны привести к получению нового и информативного опыта. Дело в том, что если производительный компонент предоставлен самому себе, то продолжает выполнять действия, которые являются наилучшими с точки зрения того, что он знает. Но если агент готов к тому, чтобы немного поэкспериментировать и в краткосрочной перспективе выполнять действия, которые, возможно, окажутся не совсем оптимальными, то он может обнаружить лучшие действия в перспективы.

Взаимодействие между агентами – главная черта MAC, отличающая их от других интеллектуальных систем. Главными характеристиками любого взаимодействия являются направленность, избирательность, интенсивность и динамичность. В контексте MAC эти понятия можно интерпретировать следующим образом:

• направленность – положительная или отрицательная; кооперация или конкуренция; сотрудничество или конфронтация; координация или субординация и т. п.;

• избирательность – взаимодействие происходит между агентами, которые каким-либо образом соответствуют друг другу и поставленной задаче. При этом агенты могут быть связаны в одном отношении и независимы в другом;

• интенсивность – взаимодействие между агентами не сводится к наличию или отсутствию, а характеризуется определенной силой;

• динамичность – наличие, сила и направленность взаимодействий могут изменяться с течением времени.

К базовым видам взаимодействия между агентами относятся:

• кооперация (сотрудничество);

• конкуренция (конфронтация, конфликт);

• компромисс (учет интересов других агентов);

• конформизм (отказ от своих интересов в пользу других);

• уклонение от взаимодействия.

Взаимодействие агентов обусловлено рядом причин, важнейшими среди которых являются следующие.

Совместимость целей (общая цель). Эта причина обычно порождает взаимодействие по типу кооперации или сотрудничества. При этом следует выяснить, не ведет ли взаимодействие к снижению жизнеспособностиотдельных агентов. Несовместимость целей или убеждений обычно порождает конфликты, позитивная роль которых заключается в стимулировании процессов развития. Известная модель хищник-жертва представляет собой пример одновременного взаимодействия по двум типам кооперация-конфронтация.

Общие ресурсы. Ресурсами будем называть любые средства, используемые для достижения агентами своих целей. Ограниченность ресурсов, которые используются многими агентами, обычно порождает конфликты. Одним их самых простых и эффективных способов разрешения подобных конфликтов является право сильного:сильный агент отбирает ресурсы у слабых. Более тонкие способы разрешения конфликтов обеспечивают переговоры, направленные на достижение компромиссов, в которых учитываются интересы всех агентов. Задачи распределения долей рынка, затрат и прибылей совместных предприятий можно рассматривать как примеры взаимодействия, обусловленного общими ресурсами.

Необходимость привлечения недостающего опыта. Каждый агент обладает ограниченным набором знаний, необходимых ему для реализации собственных и общих целей. В связи с этим ему приходится взаимодействовать с другими агентами. При этом возможны различные ситуации: а) агент способен выполнить задачу самостоятельно; б) агент может обойтись без посторонней помощи, но кооперация позволит решить задачу более эффективным способом; в) агент не способен решить задачу в одиночку. В зависимости от ситуации агенты выбирают тип взаимодействия и могут проявлять разную степень заинтересованности в сотрудничестве.

Взаимные обязательства. Обязательства являются одним из инструментов, позволяющих упорядочить хаотические взаимодействия агентов. Они позволяют предвидеть поведение других агентов, прогнозировать будущее и планировать собственные действия. Можно выделить следующие группы обязательств: а) обязательства перед другими агентами; б) обязательства агента перед группой; в) обязательства группы перед агентом; г) обязательства агента перед самим собой. Формальное представление целей, обязательств, желаний и намерений, а также всех остальных характеристик составляет основу ментальной модели интеллектуального агента, которая обеспечивает его мотивированное поведение в автономном режиме.

Перечисленные причины в различных сочетаниях могут приводить к разным формам взаимодействия между агентами, например:

• простое сотрудничество, которое предполагает интеграцию опыта отдельных агентов (распределение задач, обмен знаниями и т. п.) без специальных мер по координации их действий;

• координируемое сотрудничество, когда агенты вынуждены согласовывать свои действия (иногда привлекая специального агента-координатора) для того, чтобы эффективно использовать ресурсы и собственный опыт;

• непродуктивное сотрудничество, когда агенты совместно используют ресурсы или решают общую проблему, не обмениваясь опытом и мешая друг другу (как лебедь, рак и щука в басне И.А. Крылова).

22 23 24 25 26 27 28

Подборка статей по вашей теме: