Сведение задач теории игр к задачам линейного

Программирования

 

Предположим, что цена игры положительна (u > 0). Если это не так, то согласно свойству 6 всегда можно подобрать такое число с, прибавление которого ко всем элементам матрицы выигрышей даёт матрицу с положительными элементами, и следовательно, с положительным значением цены игры. При этом оптимальные смешанные стратегии обоих игроков не изменяются.

Свойство 1. Тройка (хо, yо, u) является решением игры G = (Х,Y,А) тогда и только тогда, когда (хо, yо, кu +а) является решением игры G(Х,Y,кА+а), где а – любое вещественное число, к > 0.

Свойство 2. Для того, чтобы хо = () была оптимальной смешанной стратегией матричной игры с матрицей А и ценой игры u, необходимо и достаточно выполнение следующих неравенств

 

 (j = )

 

Аналогично для игрока 2: чтобы yо = (,..., ,..., ) была оптимальной смешанной стратегией игрока 2 необходимо и достаточно выполнение следующих неравенств:

 

 (i = )

 

Из последнего свойства вытекает: чтобы установить, является ли предполагаемые (х, y) и u решением матричной игры, достаточно проверить, удовлетворяют ли они неравенствам (*) и (**). С другой стороны, найдя неотрицательные решения неравенств (*) и (**) совместно со следующими уравнениями

 

,

 

получим решение матричной игры.

Итак, пусть дана матричная игра с матрицей А порядка m х n. Согласно свойству 7 оптимальные смешанные стратегии х = (х1,..., хm), y = (y1,..., yn) соответственно игроков 1 и 2 и цена игры u должны удовлетворять соотношениям.

 

 

 

Разделим все уравнения и неравенства в (4.4) и (4.5) на u (это можно сделать, т.к. по предположению u > 0) и введём обозначения:

 

, ,

 

Тогда (1) и (2) перепишется в виде:

, , , ,

 

, , , .

 

Поскольку первый игрок стремится найти такие значения хi и, следовательно, pi, чтобы цена игры u была максимальной, то решение первой задачи сводится к нахождению таких неотрицательных значений pi , при которых

 

, .

 

Поскольку второй игрок стремится найти такие значения yj и, следовательно, qj, чтобы цена игры u была наименьшей, то решение второй задачи сводится к нахождению таких неотрицательных значений qj, , при которых

 

, .

 

Формулы (3) и (4) выражают двойственные друг другу задачи линейного программирования (ЛП).

Решив эти задачи, получим значения pi , qj  и u.Тогда смешанные стратегии, т.е. xi и yj получаются по формулам:

 



Решение задач

 

Пример 5: Найти решение игры, определяемой матрицей.

 

Решение.

Составим теперь пару взаимно-двойственных задач:

 

 

Решим вторую из них

 

Б.п.  q1  q2  q3  q4  q5  q6 Решение  å Отношение
 -1  -1  -1  0  0  0  0  -3  
 q4  1  2  0  1  0  0  1  5  —
 q5  1  0  1  0  1  0  1  4
 q6  2  1  0  0  0  1  1  5  —

 

Б.п.  q1  q2  q3  q4  q5  q6 Решение  å Отношение
 0  -1  0  0  1  0  1  1  
 q4  1  2  0  1  0  0  1  5
 q3  1  0  1  0  1  0  1  4  —
 q6  2  1  0  0  0  1  1  5

 


 

Б.п.  q1  q2  q3  q4  q5  q6 Решение  å Отношение
 0  0  1  0  
 q2  1  0  0  0  
 q3  1  0  1  0  1  0  1  4  
 q6  0  0  0  1  

 

Из оптимальной симплекс-таблицы следует, что

 

(q1, q2, q3) = (0; ; 1),

 

а из соотношений двойственности следует, что

 

(p1, p2, p3) = (; 1; 0).

 

Следовательно, цена игры с платёжной матрицей А1 равна

 

. ,

 

а игры с платёжной матрицей А:

 

.

 

При этом оптимальные стратегии игроков имеют вид:

 

Х = (х1, х2, х3) = (uр1; uр2; uр3) = =


Y = (y1, y2, y3) = (uq1; uq2; uq3) = = .

 






Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: