Решение матричных игр в смешанных стратегиях

Обозначим через р1,..., рm вероятности, с которыми игрок А использует в ходе игры свои чистые стратегии A1,..., Аm. Для вероятностей рi выполняются условия:

. (7.3)

Упорядоченное множество , элементы кото­рого удовлетворяют условиям (7.3), полностью определяет ха­рактер игры игрока А и называется его смешанной стратеги­ей. Таким образом, смешанной стратегией игрока А является полный набор вероятностей применения его чистых страте­гий. Механизм случайного выбора чистых стратегий, которым пользуется игрок А, обеспечивает ему бесконечное множество смешанных стратегий. Любая его чистая стратегия Аi может рассматриваться как частный случай смешанной стратегии, i -я компонента которой равна 1, а остальные равны 0, т. е. р = (0;...; 1;...; 0).

Аналогично, упорядоченное множество , эле­менты которого удовлетворяют соотношениям

, (7.4)

является смешанной стратегией игрока В. Игрок В, как и иг­рок А, располагает бесконечным множеством смешанных стра­тегий.

Итак, пусть игроки А и В применяют смешанные стратегии р и q. Это означает, что игрок А использует стратегию Ai с вероятностью pi, а игрок В - стратегию Вj с вероятностью qj. Поскольку игроки выбирают свои чистые стратегии случайно и независимо друг от друга, то вероятность выбора комбина­ции (Аi; Вj) будет равна произведению вероятностей pi и qj. При использовании смешанных стратегий игра приобрета­ет случайный характер, случайной становится и величина вы­игрыша игрока А (проигрыша игрока В). В связи с этим мож­но вести речь лишь о средней величине (математическом ожи­дании) выигрыша (проигрыша). Ясно, что эта величина явля­ется функцией от смешанных стратегий р и q и определяется по формуле

. (7.5)

Функция (7.5) называется платежной функцией игры с матрицей, заданной таблицей 7.2.

Таблица 7.2 - Платежная матрица игры

Аi Вj pi
В1 Вn
А1 а11 a1п p1
Am am1 amn pm
qj q1 qn  

Нижней ценой игры будем называть число α, определяемое по формуле , a верхней ценой игры – число β, определяемое по формуле .

Оптимальными являются смешанные стратегии р* и q* игроков А и В, удовлетворяющие равенству

= = (7.6)

Величину , полученную по формуле (7.6), называют ценой игры v.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: