Байесовский подход в теории игр

Предположим, что - матрица потерь первого игрока. Предполагается, что известны вероятности, с которыми второй игрок применяет свои стратегии:

qj = P (θ = θj), j=1,2,…, m,.

Для каждой стратегии δi считаются средние потери

.

Байесовской называется та стратегия, для которой средние потери минимальны:

δ*: а (δ*) =.

Пример 1. Пусть первый игрок имеет 106 руб.; он может хранить их дома (стратегия δ 1) либо поместить в банк под 10% годовых (стратегия δ 2). Его противник (банк) имеет тоже две стратегии: θ 1 – нормальная работа банка в течении года; θ 2 – в течении года банк лопнет и вкладчик потеряет свои деньги. Матрица потерь первого игрока имеет вид:

Поскольку а * = а * = 0, то игра имеет цену а = 0 и оптимальная (чистая) стратегия первого игрока в этой А -игре существует. Это δ 1, т.е. первый игрок, следующий минимаксной стратегии, должен хранить свои деньги дома.

Рассмотрим теперь байесовскую постановку данной задачи. Пусть априорное распределение имеет вид

q 1 = P (θ = θ 1) = 0,9999, q 2 = P (θ = θ 2) = 0,0001.

Иначе говоря, вероятность разорения банка в течении года равна 0,0001, т.е. достаточно мала. Тогда средние (байесовские) потери первого игрока равны соответственно

а (δ 1) = 0 q 1 + 0 q 2 = 0, a (δ 2) = q 1(-105) + q 2106 = -99890.

Поэтому байесовская стратегия в этой задаче равна δ 2. Иначе говоря, банки разоряются очень редко (в странах с нормальной банковской системой), поэтому деньги хранить выгоднее в банке, чем дома.

Задачи к § 10

10.1. Рассмотрите игру с матрицей потерь первого игрока

Найти: а) байесовскую стратегию первого игрока, если известно априорное распределение стратегий второго игрока;

б) подобрать такое априорное распределение (q 1, q 2, q 3), чтобы байесовская стратегия, отвечающая ему, имела вид (0,1,0).

10.2. Молодой бизнесмен М планирует посетить Объединенные Арабские Эмираты и с этой целью планирует занять в банке $5000. Если его дела пойдут успешно (стратегия θ 1), он обещает через 3 месяца вернуть своему кредитору взятые деньги плюс 10%; в противном случае (стратегия θ 2) он не сможет вернуть деньги.

У банка есть тоже две стратегии:

δ 1 = {дать бизнесмену М деньги}; δ 2 = {не дать бизнесмену М деньги}.

а) Найти минимаксную стратегию банка; б) допустим известны q j, при каких значениях q2 байесовской стратегией банка будет δ 1.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: