double arrow

Верхние и нижние цены в S-игре


S-игра

Основная теорема антагонистических игр.

Играм, в которых у первого игрока конечное число стратегий, можно дать полезную геометрическую интерпретацию. Пусть задана игра с матрицей платежей .

Можно рассмотреть множество векторов:

….. .

Игра, заданная множеством точек , получила название S-игры.

Правила S-игры следующие: второй игрок выбирает одну из точек , а первый игрок выбирает i-ую координату этой точки . При этом выигрыш первого игрока, соответственно проигрыш второго, будет равен значению i-ой координаты точки , т.е. :

.

Нетрудно видеть, что S-игра эквивалентна обычной игре в нормальной форме , т.к. выбор точки из множества эквивалентен выбору стратегии , а выбор координаты этой точки эквивалентен выбору стратегии .

Если число стратегий первого игрока равно двум, то S-игра имеет наглядное геометрическое изображение, т.к. точки множества будут в этом случае точками плоскости (платежная матрица будет иметь вид:

, в которой столбцы заменяются на точки с координатами ).

Пример:

Рассмотрим игру . Эквивалентная S - игра содержит 5 точек: , , , , . Геометрическое изображение этой игры приведено на рисунке.




Обозначим через выпуклую оболочку конечного множества точек . S-игра эквивалентна обычной игре в чистых стратегиях. Доказывается, что эта эквивалентность сохраняется и для смешанных стратегий.

Теорема. Любая смешанная стратегия второго игрока может быть представлена точкой, принадлежащей выпуклой оболочке , и наоборот, любая точка может рассматриваться как некоторая смешанная стратегия второго игрока.

Доказательство. Рассмотрим смешанные стратеги игроков и . При использовании этих смешанных стратегий проигрыш второго игрока

, где .

Обозначим через S точку в m-мерном пространстве с координатами :

;

………………………….

.

Учитывая, что , это выражение можно записать в виде векторного соотношения

.

Видим, что S есть не что иное, как средневзвешенное точек с весами , а следовательно, S есть некоторая точка, принадлежащая выпуклой оболочке . Таким образом, каждой стратегии второго игрока будет соответствовать некоторая точка, принадлежащая выпуклой оболочке , и задание этой точки равносильно заданию смешанной стратегии второго игрока.

Справедливо и обратное. Так как любая точка S, принадлежащая выпуклой оболочке , может быть представлена как средневзвешенное точек

, определяющих выпуклую оболочку , то для каждой точки найдутся такие веса , задание которых определит смешанную стратегию второго игрока. Теорема доказана.

Следствие. Поскольку смешанная стратегия первого игрока остается в S-игре той же самой, что и в обычной игре, из доказанной теоремы следует, что S – игра полностью эквивалентна обычной игре, т.е. любая игра может быть представлена в виде эквивалентной S-игры.



Дальше будем обозначать S-игру через . Для перехода от игры к S-игре вместо пространства смешанных стратегий второго игрока необходимо использовать пространство S-стратегий, т.е. выпуклую оболочку . Обозначим потери второго игрока в S-игре через , тогда S — игра зависит от P, и , причем потери должны быть найдены на скалярном произведении . Таким образом выражение определяет S-игру. Функция потерь определяется выражением:

.

Рассмотрим процедуру оценки верхних и нижних цен в S-игре. Если первый игрок применяет смешанную стратегию , то значение его гарантированного выигрыша

.

Обозначим через такую стратегию первого игрока, при которой достигает максимума:

(эта нижняя цена игры совпадает с ценой игры в обычной форме в силу эквивалентности S-игры с обычной игрой). Стратегию называют максиминной стратегией первого игрока.

Предположим теперь, что второй игрок применяет некоторую стратегию . При этом значение его проигрыша . Тогда второго игрока будет интересовать стратегия:

. Стратегию называют минимаксной стратегией второго игрока.

Таким образом, максиминная стратегия первого игрока определяет нижнюю цену в S-игре:

.

Аналогично стратегия определяет верхнюю цену в S-игре:

.

Выражения для и можно представить в более удобном виде, если воспользоваться теоремой.

Теорема. Если S — произвольная точка m-мерного пространства и — многомерная переменная, то имеет место соотношение



.

Доказательство. Пусть . Рассмотрим частное значение p, соответствующее случаю

при и при . В этом случае . Таким образом, является частным значением скалярного произведения , а значит, подмножеством множества значений , получающихся при всевозможных значениях p. На основании теоремы о верхней границе подмножества находим

.

С другой стороны, заменяя в выражении для значения на максимальное значение , получаем

.

Это выражение справедливо при любом p. Сопоставляя два последних выражения приходим к соотношению:

. Теорема доказана.

Если воспользоваться доказанной теоремой, то выражение для B(S) можно переписать в виде

.

Из этого равенства вытекают два следствия:

1. , т.е. любая точка имеет по крайней мере одну координату, не меньшую, чем верхняя цена игры;

2. Если в качестве S взять , то получим:

. Верхняя цена игры равна максимальной из координат точки , определяющей минимаксную стратегию второго игрока.







Сейчас читают про: