Лекция №17

Рассмотрим парную конечную игру с нулевой суммой с игрокам А и В, которые имеют конечное число стратегий соответственно А1, А2,... Аm и В1, В2,... Вn. Такая игра называется игрой m x n. Исход каждой партии завершается выигрышем одного из игроков.

Обозначим aij - выигрыш игрока А, если он использует стратегию Аi, а игрок В стратегию Вj. Тогда выигрыш игрока В очевидно равен bij=- aij, так как игра с нулевой суммой. Поэтому в дальнейшем будем рассматривать лишь выигрыш одного из игроков. Если игра содержит кроме личных и случайные ходы, то выигрыш aij есть величина случайная, зависящая от исходов всех случайных ходов. В этом случае оценкой ожидаемого выигрыша является математическое ожидание случайного выигрыша. В дальнейшем будем обозначать aij как сам выигрыш (в игре без случайных ходов), так и его мат. ожидание (в игре со случайными ходами).

Предположим, что известны aij для любой пары (Аi Вj). Эти значения записываются в таблицу, называемую ПЛАТЕЖНОЙ МАТРИЦЕЙ.

Аi Вj В1 ... Вn
А1 a11   a1n
...      
Аm am1   amn

Построение такой матрицы для игр с большим числом стратегий представляет собой очень сложную задачу. Например, для шахматной игры построение платежной матрицы является невозможным даже для современных ЭВМ. однако в принципе любая конечная парная игра с нулевой суммой может быть приведена к матричной форме.

Пример 1. Игра «поиск».

Имеется два игрока А и В, игрок А прячется, а В его ищет. В распоряжении игрока А имеется два убежища (I и II), любое из которых он может выбрать по своему усмотрению. Условия игры таковы: если В найдет А в том убежище, где А спрятался, то А платит ему штраф 1 руб.; если В не найдет А (т. е. будет искать в другом убежище), то он сам должен заплатить А такой же штраф. Требуется построить платежную матрицу.

Решение. Игра состоит всего из двух ходов, оба - личные. У нас (А) две стратегии:

А1 прятаться в убежище I, А2 прятаться в убежище II. У противника (В) тоже две стратегии:

В1 искать в убежище I, В2,— искать в убежище II. Модель этой задачи представляется игрой 2х2. Ее матрица имеет, вид табл. 7.1.

Таблица 1

  B1 B2
A1 -1  
A2   -1

На примере этой игры, как она ни элементарна, можно уяснить себе некоторые важные идеи теории игр.

Предположим сначала, что данная игра выполняется только один раз (играется единственная «партия»). Тогда, очевидно, нет смысла говорить о преимуществах тех или других стратегий - каждый из игроков может с равным основанием принять любую из них. Однако при многократном повторении игры положение меняется.

Действительно, допустим, что мы (игрок А) выбрали какую-то стратегию (скажем, А 1 ) и придерживаемся ее. Тогда, уже по результатам первых нескольких партий, противник догадается о нашей стратегии, начнет всегда искать в убежище I и выигрывать. То же будет, если мы выберем стратегию А 2. Нам явно невыгодно придерживаться одной какой-то стратегии; чтобы не оказаться в проигрыше, мы должны чередовать их. Однако, если мы будем чередовать убежища I и II в какой-то определенной последовательности (скажем, через одну партию), противник тоже догадается об этом и ответит наихудшим для нас образом. Очевидно, надежным способом, гарантирующим нас от верного проигрыша, будет такая организация выбора в каждой партии, когда мы сами его наперед не знаем. Например, можно бросить монету, и, если выпадет герб, выбрать убежище I, а если решка - убежище II.

Оригинальное положение, в котором оказался игрок А (чтобы не проигрывать, выбирать убежище случайным образом), очевидно, присуще не только ему, но и его противнику В, для которого справедливы все вышеприведенные рассуждения. Оптимальной стратегией каждого оказывается «смешанная» стратегия, в которой возможные стратегии игрока чередуются случайным образом, с одинаковыми вероятностями.

Таким образом, мы подошли к одному из существенных понятий теории игр - к понятию смешанной стратегии, то есть такой, в которой отдельные «чистые» стратегии чередуются случайным образом с какими-то вероятностями. В данном примере из соображений симметрии ясно, что стратегии А 1 и А 2 должны применяться с одинаковыми вероятностями; в более сложных примерах решение может быть далеко не тривиальным.

Пример 2. Игра «вооружение и самолет».

В нашем распоряжении имеются три вида вооружения: А 1, А 2 ., А 3; у противника - три вида самолетов: В 1, В 2, В3. Наша задача - поразить самолет; задача противника - сохранить его непораженным. Наш личный ход - выбор типа вооружения; личный ход противника - выбор самолета для боевых действий. В данной игре имеется еще и случайный ход - применение вооружения. Вооружением А 1 самолеты В 1, В 2, В 3 поражаются соответственно с вероятностями 0,5, 0,6, 0,8; вооружением А 2. - с вероятностями 0,9, 0,7, 0,8; вооружением А 3, - с вероятностями 0,7, 0,5, 0,6. Построить матрицу игры и проанализировать ситуацию.

Решение. Матрица игры 3х3 имеет следующий вид.

Таблица 2

  В1 В2 В3
А1 0.5 0.6 0.8
А2 0.9 0.7 0.8
А3 0.7 0.5 0.6

где выигрыш - вероятность поражения самолета (мы стремимся его максимизировать, а противник - минимизировать). Станем сначала на точку зрения игрока А и переберем одну за другой все его стратегии. На А 1 противник ответит нам В 1, и мы выиграем 0,5; на А3В 2, и мы выиграем 0,7; на А 3 - снова В 2, и мы выиграем1ё 0,5. Очевидно, некоторое преимущество над другими имеет стратегия А 2 - при ней мы выиграем больше, а именно 0,7.

Станем теперь на точку зрения противника. Пусть он выбирает В 1 - мы отвечаем ему А 2 ., и он отдает 0,9; на В 2 мы отвечаем ему А 2 ., и он отдает 0,7; на В 3 – А 3, и он отдает 0,8. Естественно, он предпочтет В 2, чтобы отдать только 0,7.

Мы видим, что в данном примере стратегии А 2. и В2 с выигрышем 0,7 являются наивыгоднейшими сразу для обеих сторон; игроку А выгоднее всего выбирать стратегию А 2, игроку В - стратегию В 2, и максимальный выигрыш А совпадает с минимальным проигрышем В. Достигнуто как бы положение равновесия: если А выберет стратегию А 2 ., то В не может найти лучшего выхода, чем В 2, и наоборот: если В выберет стратегию В 2, то А не может найти лучшего выхода, чем А 2.

В дальнейшем мы увидим, что пара стратегий, обладающих таким свойством, являются оптимальными стратегиями сторон и образуют так называемое решение игры.

Лекция №17.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: