Сведение нахождения оптимальных смешанных стратегий игроков к задаче линейного программирования

Обозначим . Из определения нижней цены игры следует, что - наибольшее из тех чисел , для которых есть хотя бы один допустимый набор удовлетворяющий неравенствам

Будем считать, что все элементы платежной матрицы неотрицательны (для этого их достаточно увеличить на одно и то же положительное число, оптимальные стратегии при этом не изменятся). Поделим все неравенства системы на и обозначим . Тогда, с учетом соотношения , получаем . Таким образом, задача по определению смешанных стратегий первого игрока сводится к следующей задаче линейного программирования.

,

.

Если есть решение задачи, то цена игры равна , а оптимальная стратегия игрока определяется из соотношений .

Несколько более удобно решать задачу по определению верхней цены игры и максиминной стратегии второго игрока. По определению нижней цены получаем, что есть наименьшее значение из тех , для которых выполняются неравенства

хотя бы для одного допустимого набора . Обозначая , получаем следующую задачу линейного программирования

,

.

Если решение задачи, то , .

Задачи по определению максиминной стратегии перового игрока и минимаксной стратегии второго игрока являются двойственными по отношению друг к другу, поэтому, решив одну из задач, из соответствующей симплекс таблицы мы можем одновременно определить решение второй задачи.

Задача 6.4. Рассматривается антагонистическая игра двух лиц с нулевой суммой и платежной матрицей (первый игрок - получатель платежа, - выбирает строку платежной матрицы, второй - плательщик, - выбирает столбец). Требуется: 1) определить верхнюю и нижнюю цену игры в чистых стратегиях; 2) найти цену игры и оптимальные смешанные стратегии игроков графическим способом; 3) свести нахождение смешанных стратегий второго игрока к задаче линейного программирования и найти цену игры.

Решение. Найдем сначала верхнюю и нижнюю цену игры в чистых стратегиях. Для нахождения верхней цены (привелигирован первый игрок) подчеркнем максимум в каждом из столбцов платежной матрицы, а затем выберем наименьшее значение из этих максимумов.

Следовательно, , а минимаксной стратегией второго игрока является либо первая, либо третья. Для нахождения нижней цены игры подчеркнем наименьшее значение из чисел платежной матрицы в каждой строке и выберем наибольшее из этих минимумов.

Следовательно, , а максиминной стратегией первого игрока является любая из двух, первая или вторая. Поскольку , цены игры и решения в чистых стратегиях нет.

Найдем оптимальные смешанные стратегии игроков и цену игры графическим способом. Для этого нам надо построить графики четырех функций

,

,

,

,

на отрезке , определить

,

а затем найти .

(4) 16

11 (2)

9 (1) 9

7 7

2 (3) 2

0 1

Из рисунка видно, что точка максимина соответствует пересечению графиков второй и третьей функции, то есть

,

откуда

Û , .

Для определения смешанной стратегии второго игрока следует решить уравнение

,

откуда

, .

Таким образом, оптимальные стратегии игроков определены однозначно - это стратегия для первого игрока, и стратегия для второго. Цена игры в смешанных стратегиях равна .

Сведем теперь задачу нахождения оптимальной стратегии второго игрока задаче линейного программирования. Получаем:

,

, .

Приведем задачу к стандартной форме

Запишем условия задачи в виде симплекс-таблицы.

Б    
             
           
-1 -1 -1 -1        

Ö

Б    
   
   
     

Ö

Б  
 
   
   

Найдено следующее решение задачи линейного программирования:

, , , .

Переходя к вероятностям, получим

, , .

Одновременно мы нашли решение двойственной задачи: оптимальные значения двойственных переменных , содержатся в -строке в столбцах, отвечающих вспомогательным переменным и соответственно. Таким образом, , , . Окончательно, , . Ответы совпали с ответами, полученными графическим способом.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: