Наличие седловой точки

 

Определение 3.1.

Нижней оценкой цены игры называется величина ;    верхней оценкой цены игры называется величина .

Лемма 3.1. Справедливо соотношение a b.

Для доказательства леммы представим игру G (m ´ n)в матричной формев виде табл. 3.4.

Таблица 3.4

Bj Ai B 1 Bj Bk Bn
A 1 a 11 a 1 j a 1 k a 1 n
Ai ai 1 aij aik ain
Al a 11 alj alk ain
   
Am am 1 amj amk amn

 

Пустьa= ajk, b= alj. Из определения верхней и нижней границ следует, что элемент ajk является минимальным в i -й строке, т.е. a= ajk ≤ ajj, а элемент alj является максимальным в j -м столбце, т.е. ajj ≤ alj =b. Лемма доказана.

Определение 3.2. Если a=b= V, то игра имеет седловую точку, стратегии Ai, Bj, при которых достигается выигрыш V, называются оптимальными чистыми стратегиями, а пара стратегий (Ai, Bj) называется решением игрыG (m ´ n).

Решение игры обладает свойством устойчивости (равновесия), т.е. если один из игроков придерживается своей оптимальной стратегии, то другому игроку не выгодно отходить от своей, так как его положение при этом может только ухудшиться. Из леммы 3.1 непосредственно следует, что признаком наличия седловой точки является нахождение в матрице игры такого элемента aij, который является одновременно минимальным в i -й строке и максимальным в j -м столбце. Если такой элемент не единственный, то игра имеет не единственное решение, но все решения равнозначны, т.е. дают выигрыш, равный цене игры V.

Теорема 3.1 [6]. Антагонистическая игра с полной информацией имеет седловую точку.

Таким образом, для любой антагонистической игры с полной информацией существует решение – пара чистых стратегий , дающих игроку А устойчивый выигрыш aij = V. Наличие нескольких седловых точек означает существование нескольких решений, но все они дают один и тот же выигрыш, равный цене игры V.

Рассмотрим в качестве примера матричную игру G (2´4)с полной информацией, представленную табл. 3.3. Дополним данную таблицу новыми строкой и столбцом, получив табл. 3.5.

Таблица 3.5

Bj Ai  
A 1 4 –5 4 –5 –5
A 2 –5 6 6 –5 –5
4 6 6 –5  

 

Из таблицы видно, что , .

Имеем две седловые точки a 14и a 24,соответствующие решениям(A 1, B 4)и(A 2, B 4)с ценой игры V = –5.

Вернемся теперь к матричной игре G (2´2)с неполной информацией, представленной в табл. 3.2. Аналогично предыдущему примеру дополним табл. 3.2 до табл. 3.6.

Таблица 3.6

Bj Ai
A 1 4 –5 –5
A 2 –5 6 –5
4 6  

 

Для данной таблицы , , т.е. a< b.Седловая точка, а, следовательно, и решение в чистых стратегиях, отсутствуют.

3.3. Методы решения матричных игр
при отсутствии седловой точки


Смешанные стратегии

В случае отсутствия седловой точки, в качестве решения игры используются так называемые смешанные стратегии

,

где pi и qj – вероятности выбора стратегий Ai и Bj игроками A и B соответственно. Решением игры в данном случае является пара оптимальных смешанных стратегий (SA*, SB*), максимизирующих математическое ожидание цены игры (средний выигрыш).

Теорема 3.2 [6]. Любая антагонистическая игра имеет хотя бы одно оптимальное решение, т.е., пару в общем случае смешанных стратегий (SA*, SB*), дающих игроку А устойчивый выигрыш, равный цене игры V≤ V ≤ β.

Чистую стратегию можно рассматривать как частный случай смешанной стратегии, когда одна вероятность имеет единичное значение, а все остальные – нулевое.

Рассмотрим матричную игру G (m ´ n), не имеющую седловой точки, для которой необходимо найти решение – пару оптимальных смешанных стратегий SA =(p 1, p 2, , pmSB =(q 1, q 2, , qn) и соответствующую цену игры V.

Предварительно следует попытаться упростить матрицу игры. Для этого вводятся отношения предпочтения (доминирования) и безразличия (дублирования) на множестве стратегий.

Определение 3.3:

· стратегия Ai предпочтительнее стратегии Ak (доминирует Ak) (обозначается ), если все выигрыши, указанные в i -й строке матрицы игры, не меньше соответствующих выигрышей k -й строки, или формально ;

· стратегии Ai и Ak находятся в отношении безразличия (дублирования) (обозначается Ai» Ak), если все выигрыши, указанные в i -й строке матрицы игры, совпадают с соответствующими выигрышами k -й строки, или формально ;

· стратегия Bj предпочтительнее стратегии Br (доминирует Br) (обозначается ), если все выигрыши, указанные в j -м столбце матрицы игры, не меньше соответствующих выигрышей r -го столбца, или формально ;

· отношение безразличия для стратегий игрока B вводится аналогично игроку A, т.е. .

Можно доказать следующую лемму [5].

Лемма 3.2. Для игры G (m ´ n)число активных стратегий игроков равно min { m, n }. Другими словами, если, например, m>n, то в оптимальной стратегии SA =(p 1, p 2, , pm) игрока A будет не более n отличных от нуля вероятностей pi.

Таким образом, предварительным этапом решения матричной игры является ее упрощение, т.е. удаление из матрицы доминируемых и дублируемых стратегий.

Рассмотрим данный этап на примере матричной игры G (5´5), представленной табл. 3.7.

Таблица 3.7

Bj Ai B 1 B 2 B 3 B 4 B 5
A 1 4 7 2 3 4
A 2 3 5 6 8 9
A 3 4 4 2 2 8
A 4 3 6 1 2 4
A 5 3 5 6 8 9

 

Так как справедливы соотношения , , , , , то удалим доминируемые и дублируемые стратегии A 4, A 5, B 2, B 4, B 5.

В полученной матрице снова проведём удаление, так как . Получим упрощенную игру G (2´2), представленную табл. 3.8.

Таблица 3.8

Bj Ai B 1 B 3
A 1 4 2
A 2 3 6

 

Нетрудно убедиться, что данная игра не имеет седловой точки и необходимо искать решение в смешанных стратегиях.

После упрощения игры следующим (основным) этапом является поиск оптимального решения в виде смешанных стратегий (SA, SB), применяя точные или приближенные методы.

Метод Лагранжа

Метод Лагранжа относится к точным методам решения матричных игр G (m ´ m), т.е. имеющим квадратные матрицы (или приведенные к такому виду после упрощения).

Допустим, что игрок A использует смешанную стратегию SA =(p 1, , pm), а игрок B отвечает своей чистой стратегией Bi (i =1, 2, , m). Цена игры в таком случае равна . Если же игрок B также будет применять смешанную стратегию SB =(q 1, , qm), то итоговая цена игры будет равна

.       (3.1)

Для нахождения оптимального решения необходимо максимизировать значение V при ограничениях .

Составим функцию Лагранжа L = V + l1(p 1 + … + pm – 1) + l2(q 1 + … + qm – 1) и приравняем к нулю частные производные по всем аргументам: .

В результате получим следующую систему из (2 m + 2)уравнений с (2 m + 2) неизвестными:

Решение этой системы и даёт смешанные стратегии для обоих игроков.

Нетрудно заметить, что исходная система уравнений включает две независимые подсистемы (для pi, i =1, , m, l1 и qj, j =1, , m, l2 соответственно), состоящие из (m + 1)уравнений с (m + 1)неизвестными, решение которых и даст искомые вероятности pi и qj, а также после подстановки этих вероятностей в формулу (3.1) цену игры V.

В качестве примера рассмотрим игру G (2´2), представленную в общем виде табл. 3.9.

Таблица 3.9

Bj Ai B 1 B 2
A 1 a 11 a 12
A 2 a 21 a 22

 

V 1 = a 11 p 1 + a 21 p 2, V 2 = a 12 p 1 + a 22 p 2,

V = V 1 q 1 + V 2 q 2 = (a 11 p 1 + a 21 p 2) q 1 + (a 12 p 1 + a 22 p 2) q 2.

L = V + l1(p 1 + p 2 – 1) + l2(q 1 + q 2 – 1).

Приравняв к нулю частные производные функции Лагранжа по всем аргументам, получим следующую систему уравнений:

Решив данную систему получим следующие значения вероятностей:

.

Подставив полученные значения в выражение для V, получим цену игры.

Например, для игры G (2´2), представленной табл. 3.8, получим:

p 1=0,6; p 2=0,4; q 1=0,8; q 3=0,2; V =3,6.

Можно также найти решение в общем виде для игры G (3´3)и т.д.

Приведем более универсальный и достаточно легко компьютеризируемый способ решения матричных игр методом Лагранжа.

Рассмотрим игру игры G (3´3) в общем виде, представленную табл. 3.10.

Таблица 3.10

Bj Ai B1 B 2 B 3
A 1 a 11 a 12 a 13
A 2 a 21 a 22 a 23
A 3 a 31 a 32 a 33

 

Для нахождения решения в смешанных стратегиях необходимо решить следующую систему уравнений:

Эту систему можно представить следующим образом:

.

Решением в общем виде представляется системой

Более конкретно:

 

Обозначив

k = – a 11 a 22 + a 11 a 32 + a 11 a 23a 11 a 33 + a 21 a 12a 21 a 32

 – a 21 a 13 + a 21 a 33a 31 a 12 + a 31 a 22 + a 31 a 13a 31 a 23

 – a 12 a 23 + a 12 a 33 + a 22 a 13a 22 a 33a 32 a 13 + a 32 a 23,

получим итоговое решение:

p 1 = (– a 21 a 32 + a 21 a 33 + a 31 a 22a 31 a 23a 22 a 33 + a 32 a 23) / k

p 2 = (   a 11 a 32a 11 a 33a 31 a 12 + a 31 a 13 + a 12 a 33a 32 a 13) / k

p 3 = (– a 11 a 22 + a 11 a 23 + a 21 a 12a 21 a 13a 12 a 23 + a 22 a 13) / k

q 1 = (– a 12 a 23 + a 12 a 33 + a 22 a 13a 22 a 33a 32 a 13 + a 32 a 23) / k

q 2 = (   a 11 a 23a 11 a 33a 21 a 13 + a 21 a 33 + a 31 a 13a 31 a 23) / k

q 3 = (– a 11 a 22 + a 11 a 32 + a 21 a 12a 21 a 32a 31 a 12 + a 31 a 22) / k

V = – |A| / |A 1 |,

где А — исходная матрица игры.

Данный подход легко применим для произвольной игры G (m ´ m): строится матрица A 1, далее, используя определители, записываются выражения для pi и qj, множитель знака для них будет равен ( 1) m + i + 1.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: