S-игра
Основная теорема антагонистических игр.
Играм, в которых у первого игрока конечное число стратегий, можно дать полезную геометрическую интерпретацию. Пусть задана игра с матрицей платежей
.
Можно рассмотреть множество векторов:
…..
.
Игра, заданная множеством точек , получила название S-игры.
Правила S-игры следующие: второй игрок выбирает одну из точек , а первый игрок выбирает i-ую координату этой точки
. При этом выигрыш первого игрока, соответственно проигрыш второго, будет равен значению i-ой координаты точки
, т.е.
:
.
Нетрудно видеть, что S-игра эквивалентна обычной игре в нормальной форме , т.к. выбор точки из множества эквивалентен выбору стратегии
, а выбор координаты этой точки эквивалентен выбору стратегии
.
Если число стратегий первого игрока равно двум, то S-игра имеет наглядное геометрическое изображение, т.к. точки множества будут в этом случае точками плоскости (платежная матрица будет иметь вид:
, в которой столбцы заменяются на точки
с координатами
).
Пример:
Рассмотрим игру . Эквивалентная S - игра содержит 5 точек:
,
,
,
,
. Геометрическое изображение этой игры приведено на рисунке.
Обозначим через выпуклую оболочку конечного множества точек
. S-игра эквивалентна обычной игре в чистых стратегиях. Доказывается, что эта эквивалентность сохраняется и для смешанных стратегий.
Теорема. Любая смешанная стратегия второго игрока может быть представлена точкой, принадлежащей выпуклой оболочке , и наоборот, любая точка
может рассматриваться как некоторая смешанная стратегия второго игрока.
Доказательство. Рассмотрим смешанные стратеги игроков и
. При использовании этих смешанных стратегий проигрыш второго игрока
, где
.
Обозначим через S точку в m-мерном пространстве с координатами :
;
………………………….
.
Учитывая, что , это выражение можно записать в виде векторного соотношения
.
Видим, что S есть не что иное, как средневзвешенное точек с весами
, а следовательно, S есть некоторая точка, принадлежащая выпуклой оболочке
. Таким образом, каждой стратегии второго игрока будет соответствовать некоторая точка, принадлежащая выпуклой оболочке
, и задание этой точки равносильно заданию смешанной стратегии второго игрока.
Справедливо и обратное. Так как любая точка S, принадлежащая выпуклой оболочке , может быть представлена как средневзвешенное точек
, определяющих выпуклую оболочку
, то для каждой точки
найдутся такие веса
, задание которых определит смешанную стратегию второго игрока. Теорема доказана.
Следствие. Поскольку смешанная стратегия первого игрока остается в S-игре той же самой, что и в обычной игре, из доказанной теоремы следует, что S – игра полностью эквивалентна обычной игре, т.е. любая игра может быть представлена в виде эквивалентной S-игры.
Дальше будем обозначать S-игру через . Для перехода от игры
к S-игре вместо пространства смешанных стратегий второго игрока
необходимо использовать пространство S-стратегий, т.е. выпуклую оболочку
. Обозначим потери второго игрока в S-игре через
, тогда S — игра зависит от P,
и
, причем потери
должны быть найдены на скалярном произведении
. Таким образом выражение
определяет S-игру. Функция потерь определяется выражением:
.
Рассмотрим процедуру оценки верхних и нижних цен в S-игре. Если первый игрок применяет смешанную стратегию , то значение его гарантированного выигрыша
.
Обозначим через такую стратегию первого игрока, при которой
достигает максимума:
(эта нижняя цена игры совпадает с ценой игры в обычной форме в силу эквивалентности S-игры с обычной игрой). Стратегию
называют максиминной стратегией первого игрока.
Предположим теперь, что второй игрок применяет некоторую стратегию . При этом значение его проигрыша
. Тогда второго игрока будет интересовать стратегия:
. Стратегию
называют минимаксной стратегией второго игрока.
Таким образом, максиминная стратегия первого игрока определяет нижнюю цену в S-игре:
.
Аналогично стратегия определяет верхнюю цену в S-игре:
.
Выражения для и
можно представить в более удобном виде, если воспользоваться теоремой.
Теорема. Если S — произвольная точка m-мерного пространства и — многомерная переменная, то имеет место соотношение
.
Доказательство. Пусть . Рассмотрим частное значение p, соответствующее случаю
при
и
при
. В этом случае
. Таким образом,
является частным значением скалярного произведения
, а значит, подмножеством множества значений
, получающихся при всевозможных значениях p. На основании теоремы о верхней границе подмножества находим
.
С другой стороны, заменяя в выражении для значения
на максимальное значение
, получаем
.
Это выражение справедливо при любом p. Сопоставляя два последних выражения приходим к соотношению:
. Теорема доказана.
Если воспользоваться доказанной теоремой, то выражение для B(S) можно переписать в виде
.
Из этого равенства вытекают два следствия:
1. , т.е. любая точка
имеет по крайней мере одну координату, не меньшую, чем верхняя цена игры;
2. Если в качестве S взять , то получим:
. Верхняя цена игры равна максимальной из координат точки
, определяющей минимаксную стратегию второго игрока.