Критерии выбора оптимальной стратегии в условиях неопределенности

2.1. Критерий Вальда

В Теории игр выработаны различные критерии для выбора оптимальной стратегии в зависимости от психологии ЛПР (СЕО).

Критерий Вальда - это критерий осторожного человека, рассуждающего, что надо рассчитывать на худшее. Формула критерия выглядит так:

 
 

.

Пример. Дана платёжная матрица, в которой справа записываем минимальное число каждой строки,считая, что игрок В создает для А наихудшие условия. При этом индекс строки по-очереди зафиксирован, изменяется лишь индекс столбца. Далее, из этих чисел выбираем максимальное.

А В y1 y2 y3  
x1        
x2   -5   -5  

Ответ: по критерию Вальда оптимально выбрать первую стратегию.

Этот критерий обеспечивает гарантированный минимум, поэтому он называется критерием крайнего пессимизма. Таким критерием обычно руководствуется ЛПР, которое при выборе альтернативы поведения придерживается принципа наибольшей осторожности в расчёте на худшие исходы по каждой альтернативе.

Задача. Дана платёжная матрица. Выберите оптимальную стратегию по критерию Вальда.

А В Y1 Y2 Y3 Y4

X1 1 2 4 6

X2 5 7 3 1

X3 -4 0 5 3

2.2. Критерий Сэвиджа

Пользуясь этим критерием надо работать с матрицей рисков по формуле

В каждой строке записывается максимальное число (опять же исходя из того, что условия игры для нас самые плохие) и из этих чисел выбирается минимальное.

Дана матрица рисков (числа условные)

А В y1 y2 y3  
x1        
x2          

Ответ: по критерию Сэвиджа оптимальна первая стратегия.

По этому критерию минимизируются упущенные возможности, т.е. недовыигрыши.

Здесь избегаем больших потерь (хотя выигрыша «приличного» не получаем). В этом критерии используются не результаты платёжной матрицы, а так называемые «сожаления» от неиспользованных возможностей. Этот критерий «стремится» несколько смягчить критерий Вальда. Он для того кто боится мало выиграть.

2.3. Критерий Гурвица

Позволяет реализовать более гибкий, более творческий подход при выборе оптимальной стратегии.

Коэффициент λ называется показателем оптимизма и характеризует субъективное представление ЛПР о состоянии игровой ситуации. Если условия игры самые неблагоприятные принимается, что λ=1, тогда - становится критерием Вальда, т.е. критерием осторожного человека. Если условия самые благоприятные считаем, что λ=0,

тогда получаем критерий крайнего оптимизма. Обычно выбирается какое-то промежуточное значение по отношению к риску. Выбранное число показывает отношение ЛПР к риску в данной ситуации, это его экспертная оценка применительно к условиям конкретной игровой ситуации.

Пример.

Дана платёжная матрица (2*2). Принимаем значение λ=0,7. Вычисления проводятся так:

Платежная матрица

А В y1 y2 0,7 0,3  
x1       0,7   1,5 2,2  
x2       2,1   1,2 3,3

Ответ: по критерию Гурвица оптимальна вторая стратегия (альтернатива).

Как видим, различные критерии приводят к различным выводам относительно оптимального решения. Фактически предлагаются лишь формальные схемы, легко реализуемые и представляющие ЛПР количественные ориентиры для окончательного выбора. Возможность выбора критерия даёт свободу ЛПР и зависит от их склонности к риску. Любой выбираемый критерий должен соответствовать намерениям ЛПР, его характеру знаниям и убеждениям.

3. Игры в смешанных стратегиях, т.е. в условиях вероятности (в условиях, когда известен выигрыш и вероятность этого выигрыша. Это игра в условиях классического определения риска).

Дана платёжная матрица и заданы вероятности выбора стратегий игроком В (из статистики или экспертно) В данном примере числа условные. В каждой строке рассчитано математическое ожидание. Если требуется определить, например, наибольший доход, то выбираем первую стратегию

А В y1 Р1=0,2 y2 Р2=0,5 y3 Р3=0,3  
x1       2,1
x2   -5   -0,1  

Этим критерием нельзя пользоваться формально. Почему?

Это видно из следующего примера.

Дана платежная матрица:

А В y1 Р1=0,5 y2 Р2=0,5  
x1 -2000      
x2 -40000    

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: