В случае стохастической неопределенности предполагаются известными вероятности qj состояний «природы» П j, j = 1, …, n. Для поиска оптимального решения применяется критерий Лапласа, согласно которому оптимальной для ЛПР является та стратегия, которая максимизирует средний выигрыш ai:
Легко показать, что эта же стратегия будет минимизировать средний риск ri:
В качестве примера рассмотрим игру, матрицы выигрышей и рисков которой представлены табл. 5.2 и табл. 5.3 соответственно.
Пусть заданы вероятности qj: q 1=0,1; q 2=0,5; q 3= q 4=0,2.
Тогда:
a 1 = 1·0,1+4·0,5+14·0,2 = 4,9;
a 2 = 3·0,1+8·0,5+7·0,2 = 5,7;
a 3= 4·0,1+6·0,5+8·0,2 = 5.
Согласно критерию Лапласа оптимальной является стратегия А 2.
Расчет относительно рисков также приведет к стратегии А 2:
r 1= 3·0,1+4·0,5+1·0,2 = 2,5;
r 2 = 1·0,1+0·0,5+8·0,2 = 1,7;
r 3 = 0·0,1+2·0,5+7·0,2 = 2.4.
5.2.2. Случай с неизвестными вероятностями
состояний «природы»
Если вероятности состояний «природы» не известны, то для поиска решения ЛПР может применять различные критерии оптимальности. Рассмотрим наиболее используемые критерии.
|
|
Критерий Вальда – наиболее осторожный критерий (критерий крайнего пессимизма), согласно которому оптимальной для ЛПР является стратегия, максимизирующая минимальный выигрыш:
.
Критерий Сэвиджа – также осторожный критерий, согласно которому оптимальной для ЛПР является стратегия, минимизирующая максимальный риск:
.
Компромиссный критерий Гурвица – компромиссный критерий, согласно которому в качестве оптимальной для ЛПР выбирается стратегия, максимизирующая следующее выражение:
,
где k – коэффициент осторожности (пессимизма), 0 £ k £ 1. Заметим, что при k = 1 критерий Гурвица переходит в критерий Вальда, а при k = 0 имеем так называемый критерий «крайнего оптимизма», предлагающий ЛПР в качестве оптимальной стратегию, максимизирующую максимальный выигрыш.
Естественно, чем ответственнее выбор и чем меньше склонен рисковать ЛПР, тем ближе к 1 следует выбирать коэффициент k. При отсутствии у ЛПР информации для выбора или «по умолчанию» рекомендуется выбирать k» 0,6.
Если ЛПР сомневается при выборе критерия оптимальности, то рекомендуется применить несколько критериев и выбрать ту стратегию, которую рекомендует большинство из них.
В качестве примера рассмотрим игру с «природой», матрицы G (3´4)и R (3´4)которой с некоторыми дополнительными столбцами представлены соответственно табл. 5.4 и табл. 5.5.
Таблица 5.4
G (3´4)
П j Ai | П1 | П2 | П3 | П4 | a i | wi | hi |
A 1 | 19 | 30 | 41 | 49 | 19 | 49 | 31 |
A 2 | 51 | 38 | 10 | 20 | 10 | 51 | 26,4 |
A 3 | 73 | 718 | 81 | 11 | 11 | 81 | 39 |
Таблица 5.5
G (3´4)
П j Ai | П1 | П2 | П3 | П4 | si |
A 1 | 54 | 8 | 0 | 0 | 54 |
A 2 | 22 | 0 | 71 | 29 | 71 |
A 3 | 0 | 30 | 40 | 38 | 40 |
|
|
Дополнительные столбцы таблиц содержат следующую информацию, определяемую по соответствующим матрицам выигрышей и рисков: , , , .
Применение соответствующих критериев приведет к следующим результатам:
· согласно критерию Вальда оптимальной для ЛПР стратегией будет A 1;
· согласно критерию Сэвиджа оптимальной для ЛПР стратегией будет A 3;
· согласно критерию Гурвица (с k = 0,6) оптимальной для ЛПР стратегией будет A 3.
Два критерия из трех рекомендуют ЛПР выбрать стратегию A 3., что и следует сделать, если ЛПР не боится риска получить очень маленький выигрыш 11, возможный при выборе этой стратегии. Если такой риск не приемлем для ЛПР, то следует выбрать наиболее осторожную стратегию A 1, рекомендуемую критерием Вальда и гарантирующую минимальный выигрыш 19.
Заметим, что в играх с «природой», как правило, не используются смешанные стратегии по следующим причинам:
· в антагонистических играх смешанные стратегии применяются часто для того, чтобы обмануть, запутать противника, что в играх с «природой» не имеет смысла;
· аппарат смешанных стратегий ориентирован на получение максимального среднего выигрыша, т.е. выигрыша, который будет получен при многократном повторении игры, но в таком случае накапливается статистика и выявляются вероятности qi состояний «природы», при наличии которых может быть применен критерий Лапласа, дающий решение в чистых стратегиях.