Сведение матричной игры к задаче линейного программирования

Теория игр находится в тесной связи с линейным программированием, так как каждая конечная игра двух лиц с нулевой суммой может быть представлена как задача линейного программирования и решена симплексным методом и, наоборот, каждая задача линейного программирования может быть представлена как конечная игра двух лиц с нулевой суммой.

Рассмотрим игру двух лиц с нулевой суммой, заданную платежной матрицей

.

Если платежная матрица не имеет седловой точки, т.е. a <b и , то решение игры представлено в смешанных стратегиях (x 1, x 2,..., xm) и (y 1, y 2,..., yn).

Применение первым игроком оптимальной стратегии опт должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры.

, .

Рассмотрим задачу отыскания оптимальной стратегии игрока А, для которой имеют место ограничения

Величина v неизвестна, однако можно считать, что цена игры v > 0. Последнее условие выполняется всегда, если все элементы платежной матрицы неотрицательны, а этого можно достигнуть, прибавив ко всем элементам матрицы некоторое положительное число. Преобразуем систему ограничений, разделив все члены неравенств на v.

(1)

где

, . (2)

По условию x 1 + x 2 + … + x m = 1. Разделим обе части этого равенства на v.

.

Оптимальная стратегия (x 1, x 2,..., xm) игрока А должна максимизировать величину v, следовательно, функция

(3)

должна принимать минимальное значение.

Таким образом, получена задача линейного программирования: найти минимум целевой функции (3) при ограничениях (1), причем на переменные наложено условие неотрицательности (2). Решая ее, находим значения , и величину1/ v, затем отыскиваются значения x i = vt i.

Аналогично для второго игрока оптимальная стратегия опт должна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры.

, .

Рассмотрим задачу отыскания оптимальной стратегии игрока B, для которой имеют место ограничения

Преобразуем систему ограничений, разделив все члены неравенств на v.

(4)

где

, . (5)

По условию y 1 + y 2 + … + y n = 1. Разделим обе части этого равенства на v.

.

Оптимальная стратегия (y 1, y 2,..., yn) игрока В должна минимизировать величину v, следовательно, функция

(6)

должна принимать максимальное значение.

Получена задача линейного программирования: найти максимум целевой функции (6) при ограничениях (4), причем на переменные наложено условие неотрицательности (5).

Таким образом, для нахождения решения игры имеем симметричную пару двойственных задач линейного программирования. Можно найти решение одной из них, а решение второй находится с использованием теории двойственности.

Пример. Найти решение игры, заданной матрицей

.

a = max (2, 3, 1) = 3, b = min (4, 5, 6, 5) = 4, a ¹ b, .

Игра не имеет седловой точки. Оптимальное решение следует искать в области смешанных стратегий.

Для определения оптимальной стратегии игрока А имеем следующую задачу линейного программирования:

,

, .

Для нахождения оптимальной стратегии игрока В имеем следующую задачу линейного программирования:

,

, .

Оптимальные решения пары двойственных задач имеют вид

, , .

Учитывая соотношения между x i и t i, y j и sj, а также равенство

,

можно найти оптимальные стратегии игроков и цену игры:

(1/2, 1/2, 0), (3/4, 0, 0, 1/4), v =7/2.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: