Игра в смешанных стратегиях

Если платежная матрица не имеет седловой точки, то если игрок будет пользоваться смешанными стратегиями, т.е. при каждом ходе менять стратегию случайным образом, то игрок А выигрывает больше, чем a, а игрок В проигрывает больше, чем b.

Рассмотрим платежную матрицу (7.1). Пусть игрок А использует чистые стратегии А1, А2, … Аi,…Аm с вероятностями p1, p2, … pi,…pm, причем =1, а игрок В использует свои чистые стратегии В1, В2, … Вj,…Bn с вероятностями q1, q2, … qj,… qn, причем = 1.

Тогда набор SA = (p1, p2, … pi,…pm) называется смешанной стратегией игрока А, а набор SB = (q1, q2, … qj,… qn) - смешанной стратегией игрока В.

Поскольку игроки выбирают свои стратегии случайным образом, то вероятность выбрать комбинацию АiВj по теории вероятности равна (Pi × qj). При использовании смешанных стратегий игра становится случайной, тогда говорят о среднем значении выигрыша, который определяется платежной функцией

f(SA, SB) = . (7.2)

Смешанные стратегии = (, ,… ) и = (, ,… ) называются оптимальными, т.е. дающими каждой стороне максимальный возможный для нее средний выигрыш (для А) или минимальный средний проигрыш (для В), если они образуют седловую точку для платежной функции (7.2), т.е. если выполняется следующее условие:

f(SA, ) £ f(, ) £ f(, SB).

Величина u = f(, SB) называется ценой игры.

Теорема 2. В смешанных стратегиях любая матричная игра имеет седловую точку, или каждая матричная игра с нулевой суммой имеет решение в смешанных стратегиях.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: