double arrow

Платежная матрица в общем виде

План

1. Основные понятия

2. Критерии выбора оптимальной стратегии в условиях полной неопределенности

2.1. Критерий Вальда

2.2. Критерий Сэвиджа

2.3. Критерий Гурвица

3. Игры в смешанных стратегиях

4. Алгоритм решения задач Теории игр

5. Задачи для самостоятельного решения

Основные понятия теории игр

Теория игр - это теория математических моделей, которые первоначально разрабатывались для поиска оптимального решения в условиях конфликта (в условиях игры на деньги). В дальнейшем оказалось, что теория игр применима для поиска оптимального решения везде, где есть конфликтная ситуация и в том числе в экономике.

Конфликтная ситуация возникает при столкновении интересов двух и более участников в процессе их экономического взаимодействия.

Игра - совокупность правил, определяющих возможные действия ее участников.

Стратегия - вариант поведения участника игры. При ограниченном числе стратегий у участников игры, игра называется конечной.

Чистая стратегия - это стратегия, которой все время придерживается игрок в течение игры (вариант поведения все время одинаков).

Смешанная стратегия - набор разных стратегий, которые использует игрок.

Игра двух лиц с нулевой суммой - игра, по окончании которой, алгебраическая сумма выигрышей всех участников равна О: сколько выиграл один, столько проиграл другой. Это предположение значительно упрощает анализ игр, т.к. в этом случае достаточно рассчитать выигрыши лишь одного участника.

Рассмотрим конечную игру двух лиц с нулевой суммой. Обозначения

А - первый игрок; (игры будут решаться с позиций этого игрока);

В - второй игрок;

Игрок А имеет m стратегий, т.е. вариантов поведения:

x12;...xi;...xm.;i – индекс строки

Игрок В имеет n стратегий: y1; 2;...yj;...yn.; j – индекс столбца

Значения выигрышей игрока А задают таблицей, которая называется платежной матрицей и имеет вид:

Платежная матрица в общем виде

Таблица 1

A B y1 y2 yi yn
x1 α11 α12 α 1j α 1n
х2 α 21 α 22 α 2j α 2n
xi α i1 α i2 α ij α in
xm α m1 α m2 α mj α mn

где α ij - элемент платежной матрицы для игрока А, т.е. его выигрыши. Хотя принято говорить выигрыши на самом деле это могут быть и проигрыши, т.е. отрицательные числа.

Для игрока В - элементы платежной матрицы βij равны по абсолютной величине и противоположны по знаку

Цель игрока А или В - выбрать оптимальную стратегию по какому-то критерию.

В качестве примера применения теории игр рассмотрим ситуацию, в которой два универсальных магазина имеют примерно равную долю сбыта товаров в относительно обособленном микрорайоне. С ростом местного населения возможны следующие альтернативы (варианты) развития этих магазинов.

x1, y1 - без расширения;

x2, y2 - расширение магазинов;

x3, уз - строительство филиала.

Предположим платежная матрица для магазина А имеет вид (числа условные):

Таблица 2

А В y1 y2 y3
x1   -25 -15
x2      
x3   -10  

По экономическим условиям здесь два реальных игрока. И значит, поведение партнера можно прогнозировать в том смысле, что он будет стремиться сделать лучше себе, а значит хуже мне.

Это игра в условиях явного конфликта интересов.

Возможен другой вариант, когда явного конфликта интересов нет, т.к. второй игрок нереальный. Игры с нереальным игроком называются Игры с «природой». Природой чаще всего бывает покупательский спрос (не всегда).

Пример Игры с «природой». Годовой доход от использования каждого вагона в поезде с сезонными пассажирами, равен 200 ед., а расходы на эксплуатацию каждого вагона составляют 80 ед. Составим платежную матрицу, считая, что требуемое число вагонов (спрос) может быть 0, 1, 2, 3 – это стратегии нереального игрока, т.е. «природы».

Платежная матрица

Таблица 3

A В B 0 1 2 3
0        
1 -80      
2 -160      
3 -240 -40    

Если есть три вагона, и они все задействованы 3(200) - 3(80) = 360

Специфика игры с природой.

1. В случае игры с «природой» неопределенность больше, т.к. поведение реального игрока можно легко прогнозировать - он стремится создать партнеру худшие условия, а в игре с «природой» конфликта интересов нет.

2. Состояние «природы» можно описывать вероятностями, получаемыми из статистики наблюдений или экспертно.

Кроме платёжной матрицы в игровых задачах часто строят матрицы рисков. Матрица рисков - это преобразованная платежная матрица. Преобразования осуществляются так:

rijj - α ij, где βj- max выигрыш при данном (j-ом) состоянии природы, т.е. максимальное число каждого столбца платежной матрицы.

Пример построения матрицы рисков. Дана платёжная матрица (числа условные), к ней пристроена еще одна строка, в которой записаны максимальные числа столбцов. Строим матрицу рисков, т.е. в каждом столбце из этого максимального числа вычитаем число каждой клетки и разность записываем в эту же клетку. Например, для клетки с координатами 1,1 риск равен 6-1=5 и т.д.

Платежная матрица

A В В B y1 y2 y3
x1      
x2      
     

Матрица рисков

А В y1 y2 y3
x1      
x2      

Так как βj - max столбца, очевидно, что rij ≥ 0

Здесь риском называется разность между максимально возможным выигрышем при данном состоянии природы и выигрышем при выбранной стратегии. Это «недовыигрыш» - или по-другому упущенные возможности при выбранной стратегии игроком А.

Задача. Дана платёжная матрица (числа условные). Постройте матрицу рисков.

А В Y1 Y2 Y3 Y4
X1        
X2        
X3 -4      

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: