Число стратегий конечно.
Игрок A: {Ai} i=1…m
Игрок B: {Bj} j=1…n
Ai \Bj | B1 | … | Bj | … | Bn |
A1 | a11 | … | a1j | … | a1n |
… | … | … | … | … | … |
Ai | ai1 | … | aij | … | ain |
… | … | … | … | … | |
Am | am1 | … | amj | … | amn |
aij – это выигрыш игрока A при выборе им стратегии Ai, и игрок B отвечает ему стратегией Bj.
Пример.
Построим матрицу игры. Возможны два случая:
1. Ситуация с неполной информацией. (Игроку В не сообщается о выборе игрока А).
2. Ситуация с полной информацией.
|
B3(+) -игрок В действует также, как и игрок А.
Вводятся две величины:
max min aij = a нижняя оценка цены игры
i j
min max aij = b верхняя оценка цены игры
i j
Докажем, что a <= b
Ai \Bj | B1 | … | Bj’ | … | Bj | … | Bn |
A1 | a11 | … | a1j | … | a1j | … | a1n |
… | … | … | … | … | … | … | … |
Ai’ | ai1 | … | ai’j’ | … | ai’j | … | ain |
… | … | … | … | … | … | … | … |
Ai | ai1 | … | aij’ | … | aij | … | ain |
… | … | … | … | … | … | ||
Am | am1 | … | amj | … | amj | … | amn |
aij’ = a <= aij <= ai’j’ = b
|
|
Если a = b = V, то говорят, что игра имеет седловую точку, а решением игры является пара чистых стратегий Ai*,Bj*, дающая максимальный выигрыш и минимальный проигрыш равный V равный цене игры.
Теорема 1.
Всякая парная антагонистическая игра с полной информацией решается в чистых стратегиях, причём это решение обладает свойством устойчивости.
Пример:
max min aij = -5 max min aij = -5
i j i j
min max aij = 4 min max aij = -5
i j i j
Седловой точки нет (A1,B4) = (A2,B4) = V = 5
Если нет седловой точки:
1) Однократно, следовательно, необходимо использовать наиболее осторожный метод maxmin.
2) Многократно – используются смешанные стратегии.
то есть каждой стратегии соответствует вероятноть:
Ai, pi pi
Bj, qj qj
Решением будет смешанная стратегия
SA =(p1, p2…, pN)
SB =(q1, q2…, qN)
Теорема 2. (Основная теорема теории игр)
Всякая парная антагонистическая игра имеет хотя бы одно решение, то есть пару стратегий SA*, SB* в общем случае смешанных, дающих устойчивый выигрыш равный цене игры V. И в этом случае можно доказать, что:
|
|
a <= V <= b
SA - чистая стратегия, следовательно SA = (0, …, 0, 1, 0, ….,0)