double arrow

ПРИМЕР

Пусть имеется некоторая игра с матрицей A=

A+5 A1=

Предположим, что все стратегии рабочие. Составляем систему уравнений:

7t1 + 2t2 + 9t3 - z1 = 1

2t1 + 9t2 - z2 = 1

9t1+11t3 - z3 = 1

Решение этих уравнений при условии t1 + t2 + t3 min :

t1 = 0,05

t2 = 0,1

t3 = 0,05

v(A1) == 5 p1=0,05*5=0,25

p2=0,1*5=0,5

p3=0,05*5=0,25

v(A)=v(A1) - 5=0 игра справедливая. Найдём стратегию второго игрока:

q1* + q2* + q3* = 1

2q1 + 9q2 = 5 q1=q3=0,25

9q1 + 11q3 =5 q2=0,5

Графическое решение игр 2*n и m*2

Рассмотрим игру (2*n) с матрицей

A=

Выигрыш 1-го игрока H(p,yk)=p1a1k + p2a2k = p1a1k + (1-p1)a2k,

На плоскости такая зависимость изображается отрезком прямой, причем при p=0 H(p,yk)=a2k, p=1 H(p,yk)=a1k

Таким образом, получаем семейство из n прямых:

Исходя из условия гарантированного выигрыша, его величина при разных значениях р будет определяться нижней границей множества этих прямых. Очевидно, что оптимальная стратегия соответствует той точке полученного множества, в которой значение функции максимально, а само это максимальное значение есть значение игры.

Рабочими стратегиями 2-ого игрока являются в данном случае 3я и 4я, а значит, оптимальная стратегия 1-ого игрока определяется из системы уравнений:

q3 + q4 = 1

a23q3 + a24q4 = v

Рассмотрим теперь игру (m*2) с матрицей

Эту игру удобно рассматривать для второго игрока. Как и в предыдущем случае, строится семейство из m отрезков прямых, отображающих зависимость величины функции выигрыша 2го игрока от выбираемой им стратегии:

Н(xi,q)= ai1q + ai2(1-q), ,

Исходя из разумности поведения 1-ого игрока, проигрыш 2-ого определяется верхней огибающей семейства этих прямых. Значения q* и v находятся как абсцисса и ордината нижней вершины огибающей, а затем оптимальная стратегия 2-ого игрока определяется исходя из его рабочих стратегий (в данном случае рабочими стратегиями 2-ого игрока являются xr и xe), аналогично предыдущему случаю.

Во всех этих случаях число рабочих стратегий обоих игроков одинаково.


Сейчас читают про: