Случай стохастической неопределенности

В случае стохастической неопределенности предполагаются известными вероятности qj состояний «природы» П j, j = 1, …, n. Для поиска оптимального решения применяется критерий Лапласа, согласно которому оптимальной для ЛПР является та стратегия, которая максимизирует средний выигрыш ai:

Легко показать, что эта же стратегия будет минимизировать средний риск ri:

В качестве примера рассмотрим игру, матрицы выигрышей и рисков которой представлены табл. 5.2 и табл. 5.3 соответственно.

Пусть заданы вероятности qj: q 1=0,1; q 2=0,5; q 3= q 4=0,2.

Тогда:

a 1 = 1·0,1+4·0,5+14·0,2 = 4,9;

a 2 = 3·0,1+8·0,5+7·0,2 = 5,7;

a 3= 4·0,1+6·0,5+8·0,2 = 5.

Согласно критерию Лапласа оптимальной является стратегия А 2.

Расчет относительно рисков также приведет к стратегии А 2:

r 1= 3·0,1+4·0,5+1·0,2 = 2,5;

r 2 = 1·0,1+0·0,5+8·0,2 = 1,7;

r 3 = 0·0,1+2·0,5+7·0,2 = 2.4.

5.2.2. Случай с неизвестными вероятностями
состояний «природы»

Если вероятности состояний «природы» не известны, то для поиска решения ЛПР может применять различные критерии оптимальности. Рассмотрим наиболее используемые критерии.

Критерий Вальда – наиболее осторожный критерий (критерий крайнего пессимизма), согласно которому оптимальной для ЛПР является стратегия, максимизирующая минимальный выигрыш:

.

Критерий Сэвиджа – также осторожный критерий, согласно которому оптимальной для ЛПР является стратегия, минимизирующая максимальный риск:

.

Компромиссный критерий Гурвица – компромиссный критерий, согласно которому в качестве оптимальной для ЛПР выбирается стратегия, максимизирующая следующее выражение:

,

где k – коэффициент осторожности (пессимизма), 0 £ k £ 1. Заметим, что при k = 1 критерий Гурвица переходит в критерий Вальда, а при k = 0 имеем так называемый критерий «крайнего оптимизма», предлагающий ЛПР в качестве оптимальной стратегию, максимизирующую максимальный выигрыш.

Естественно, чем ответственнее выбор и чем меньше склонен рисковать ЛПР, тем ближе к 1 следует выбирать коэффициент k. При отсутствии у ЛПР информации для выбора или «по умолчанию» рекомендуется выбирать k» 0,6.

Если ЛПР сомневается при выборе критерия оптимальности, то рекомендуется применить несколько критериев и выбрать ту стратегию, которую рекомендует большинство из них.

В качестве примера рассмотрим игру с «природой», матрицы G (3´4)и R (3´4)которой с некоторыми дополнительными столбцами представлены соответственно табл. 5.4 и табл. 5.5.

Таблица 5.4

G (3´4)

П j Ai П1 П2 П3 П4 a i wi hi
A 1 19 30 41 49 19 49 31
A 2 51 38 10 20 10 51 26,4
A 3 73 718 81 11 11 81 39

 

Таблица 5.5

G (3´4)

П j Ai П1 П2 П3 П4 si
A 1 54 8 0 0 54
A 2 22 0 71 29 71
A 3 0 30 40 38 40

 

Дополнительные столбцы таблиц содержат следующую информацию, определяемую по соответствующим матрицам выигрышей и рисков: , , , .

Применение соответствующих критериев приведет к следующим результатам:

· согласно критерию Вальда оптимальной для ЛПР стратегией будет A 1;

· согласно критерию Сэвиджа оптимальной для ЛПР стратегией будет A 3;

· согласно критерию Гурвица (с k = 0,6) оптимальной для ЛПР стратегией будет A 3.

Два критерия из трех рекомендуют ЛПР выбрать стратегию A 3., что и следует сделать, если ЛПР не боится риска получить очень маленький выигрыш 11, возможный при выборе этой стратегии. Если такой риск не приемлем для ЛПР, то следует выбрать наиболее осторожную стратегию A 1, рекомендуемую критерием Вальда и гарантирующую минимальный выигрыш 19.

Заметим, что в играх с «природой», как правило, не используются смешанные стратегии по следующим причинам:

· в антагонистических играх смешанные стратегии применяются часто для того, чтобы обмануть, запутать противника, что в играх с «природой» не имеет смысла;

· аппарат смешанных стратегий ориентирован на получение максимального среднего выигрыша, т.е. выигрыша, который будет получен при многократном повторении игры, но в таком случае накапливается статистика и выявляются вероятности qi состояний «природы», при наличии которых может быть применен критерий Лапласа, дающий решение в чистых стратегиях.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: