Платежная матрица в общем виде

25 26 27 28 29 30 31

План

1. Основные понятия

2. Критерии выбора оптимальной стратегии в условиях полной неопределенности

2.1. Критерий Вальда

2.2. Критерий Сэвиджа

2.3. Критерий Гурвица

3. Игры в смешанных стратегиях

4. Алгоритм решения задач Теории игр

5. Задачи для самостоятельного решения

Основные понятия теории игр

Теория игр - это теория математических моделей, которые первоначально разрабатывались для поиска оптимального решения в условиях конфликта (в условиях игры на деньги). В дальнейшем оказалось, что теория игр применима для поиска оптимального решения везде, где есть конфликтная ситуация и в том числе в экономике.

Конфликтная ситуация возникает при столкновении интересов двух и более участников в процессе их экономического взаимодействия.

Игра - совокупность правил, определяющих возможные действия ее участников.

Стратегия - вариант поведения участника игры. При ограниченном числе стратегий у участников игры, игра называется конечной.

Чистая стратегия - это стратегия, которой все время придерживается игрок в течение игры (вариант поведения все время одинаков).

Смешанная стратегия - набор разных стратегий, которые использует игрок.

Игра двух лиц с нулевой суммой - игра, по окончании которой, алгебраическая сумма выигрышей всех участников равна О: сколько выиграл один, столько проиграл другой. Это предположение значительно упрощает анализ игр, т.к. в этом случае достаточно рассчитать выигрыши лишь одного участника.

Рассмотрим конечную игру двух лиц с нулевой суммой. Обозначения

А - первый игрок; (игры будут решаться с позиций этого игрока);

В - второй игрок;

Игрок А имеет m стратегий, т.е. вариантов поведения:

x₁;х₂;...x_i;...x_m.;i – индекс строки

Игрок В имеет n стратегий: y₁; ₂;...y_j;...y_n.; j – индекс столбца

Значения выигрышей игрока А задают таблицей, которая называется платежной матрицей и имеет вид:

Платежная матрица в общем виде

Таблица 1

A B	y₁	y₂	…	y_i	…	y_n
x₁	α₁₁	α₁₂	…	α_1j	…	α_1n
х₂	α₂₁	α₂₂	…	α_2j	…	α_2n
…	…	…	…	…	…	…
x_i	α_i1	α _i2	…	α_ij	…	α_in
…	…	…	…	…	…	…
x_m	α_m1	α_m2	…	α_mj	…	α_mn

где α _ij - элемент платежной матрицы для игрока А, т.е. его выигрыши. Хотя принято говорить выигрыши на самом деле это могут быть и проигрыши, т.е. отрицательные числа.

Для игрока В - элементы платежной матрицы βij равны по абсолютной величине и противоположны по знаку

Цель игрока А или В - выбрать оптимальную стратегию по какому-то критерию.

В качестве примера применения теории игр рассмотрим ситуацию, в которой два универсальных магазина имеют примерно равную долю сбыта товаров в относительно обособленном микрорайоне. С ростом местного населения возможны следующие альтернативы (варианты) развития этих магазинов.

x₁, y₁- без расширения;

x₂, y₂ - расширение магазинов;

x₃, у_з - строительство филиала.

Предположим платежная матрица для магазина А имеет вид (числа условные):

Таблица 2

А В	y₁	y₂	y₃
x₁		-25	-15
x₂
x₃		-10

По экономическим условиям здесь два реальных игрока. И значит, поведение партнера можно прогнозировать в том смысле, что он будет стремиться сделать лучше себе, а значит хуже мне.

Это игра в условиях явного конфликта интересов.

Возможен другой вариант, когда явного конфликта интересов нет, т.к. второй игрок нереальный. Игры с нереальным игроком называются Игры с «природой». Природой чаще всего бывает покупательский спрос (не всегда).

Пример Игры с «природой». Годовой доход от использования каждого вагона в поезде с сезонными пассажирами, равен 200 ед., а расходы на эксплуатацию каждого вагона составляют 80 ед. Составим платежную матрицу, считая, что требуемое число вагонов (спрос) может быть 0, 1, 2, 3 – это стратегии нереального игрока, т.е. «природы».

Платежная матрица

Таблица 3

A В B	0	1	2	3
0
1	-80
2	-160
3	-240	-40

Если есть три вагона, и они все задействованы 3(200) - 3(80) = 360

Специфика игры с природой.

1. В случае игры с «природой» неопределенность больше, т.к. поведение реального игрока можно легко прогнозировать - он стремится создать партнеру худшие условия, а в игре с «природой» конфликта интересов нет.

2. Состояние «природы» можно описывать вероятностями, получаемыми из статистики наблюдений или экспертно.

Кроме платёжной матрицы в игровых задачах часто строят матрицы рисков. Матрица рисков - это преобразованная платежная матрица. Преобразования осуществляются так:

r_ij =β_j - α _ij, где β_j- max выигрыш при данном (j-ом) состоянии природы, т.е. максимальное число каждого столбца платежной матрицы.

Пример построения матрицы рисков. Дана платёжная матрица (числа условные), к ней пристроена еще одна строка, в которой записаны максимальные числа столбцов. Строим матрицу рисков, т.е. в каждом столбце из этого максимального числа вычитаем число каждой клетки и разность записываем в эту же клетку. Например, для клетки с координатами 1,1 риск равен 6-1=5 и т.д.

Платежная матрица

A В В B	y₁	y₂	y₃
x₁
x₂

Матрица рисков

А В	y₁	y₂	y₃
x₁
x₂

Так как β_j - max столбца, очевидно, что r_ij ≥ 0

Здесь риском называется разность между максимально возможным выигрышем при данном состоянии природы и выигрышем при выбранной стратегии. Это «недовыигрыш» - или по-другому упущенные возможности при выбранной стратегии игроком А.

Задача. Дана платёжная матрица (числа условные). Постройте матрицу рисков.