Предположим, что - матрица потерь первого игрока. Предполагается, что известны вероятности, с которыми второй игрок применяет свои стратегии:
qj = P (θ = θj), j=1,2,…, m,.
Для каждой стратегии δi считаются средние потери
.
Байесовской называется та стратегия, для которой средние потери минимальны:
δ*: а (δ*) =.
Пример 1. Пусть первый игрок имеет 106 руб.; он может хранить их дома (стратегия δ 1) либо поместить в банк под 10% годовых (стратегия δ 2). Его противник (банк) имеет тоже две стратегии: θ 1 – нормальная работа банка в течении года; θ 2 – в течении года банк лопнет и вкладчик потеряет свои деньги. Матрица потерь первого игрока имеет вид:
Поскольку а * = а * = 0, то игра имеет цену а = 0 и оптимальная (чистая) стратегия первого игрока в этой А -игре существует. Это δ 1, т.е. первый игрок, следующий минимаксной стратегии, должен хранить свои деньги дома.
Рассмотрим теперь байесовскую постановку данной задачи. Пусть априорное распределение имеет вид
q 1 = P (θ = θ 1) = 0,9999, q 2 = P (θ = θ 2) = 0,0001.
|
|
Иначе говоря, вероятность разорения банка в течении года равна 0,0001, т.е. достаточно мала. Тогда средние (байесовские) потери первого игрока равны соответственно
а (δ 1) = 0 q 1 + 0 q 2 = 0, a (δ 2) = q 1(-105) + q 2106 = -99890.
Поэтому байесовская стратегия в этой задаче равна δ 2. Иначе говоря, банки разоряются очень редко (в странах с нормальной банковской системой), поэтому деньги хранить выгоднее в банке, чем дома.
Задачи к § 10
10.1. Рассмотрите игру с матрицей потерь первого игрока
Найти: а) байесовскую стратегию первого игрока, если известно априорное распределение стратегий второго игрока;
б) подобрать такое априорное распределение (q 1, q 2, q 3), чтобы байесовская стратегия, отвечающая ему, имела вид (0,1,0).
10.2. Молодой бизнесмен М планирует посетить Объединенные Арабские Эмираты и с этой целью планирует занять в банке $5000. Если его дела пойдут успешно (стратегия θ 1), он обещает через 3 месяца вернуть своему кредитору взятые деньги плюс 10%; в противном случае (стратегия θ 2) он не сможет вернуть деньги.
У банка есть тоже две стратегии:
δ 1 = {дать бизнесмену М деньги}; δ 2 = {не дать бизнесмену М деньги}.
а) Найти минимаксную стратегию банка; б) допустим известны q j, при каких значениях q2 байесовской стратегией банка будет δ 1.