План
1. Основные понятия
2. Критерии выбора оптимальной стратегии в условиях полной неопределенности
2.1. Критерий Вальда
2.2. Критерий Сэвиджа
2.3. Критерий Гурвица
3. Игры в смешанных стратегиях
4. Алгоритм решения задач Теории игр
5. Задачи для самостоятельного решения
Основные понятия теории игр
Теория игр - это теория математических моделей, которые первоначально разрабатывались для поиска оптимального решения в условиях конфликта (в условиях игры на деньги). В дальнейшем оказалось, что теория игр применима для поиска оптимального решения везде, где есть конфликтная ситуация и в том числе в экономике.
Конфликтная ситуация возникает при столкновении интересов двух и более участников в процессе их экономического взаимодействия.
Игра - совокупность правил, определяющих возможные действия ее участников.
Стратегия - вариант поведения участника игры. При ограниченном числе стратегий у участников игры, игра называется конечной.
Чистая стратегия - это стратегия, которой все время придерживается игрок в течение игры (вариант поведения все время одинаков).
Смешанная стратегия - набор разных стратегий, которые использует игрок.
Игра двух лиц с нулевой суммой - игра, по окончании которой, алгебраическая сумма выигрышей всех участников равна О: сколько выиграл один, столько проиграл другой. Это предположение значительно упрощает анализ игр, т.к. в этом случае достаточно рассчитать выигрыши лишь одного участника.
Рассмотрим конечную игру двух лиц с нулевой суммой. Обозначения
А - первый игрок; (игры будут решаться с позиций этого игрока);
В - второй игрок;
Игрок А имеет m стратегий, т.е. вариантов поведения:
x1;х2;...xi;...xm.;i – индекс строки
Игрок В имеет n стратегий: y1; 2;...yj;...yn.; j – индекс столбца
Значения выигрышей игрока А задают таблицей, которая называется платежной матрицей и имеет вид:
Платежная матрица в общем виде
Таблица 1
A B | y1 | y2 | … | yi | … | yn |
x1 | α11 | α12 | … | α 1j | … | α 1n |
х2 | α 21 | α 22 | … | α 2j | … | α 2n |
… | … | … | … | … | … | … |
xi | α i1 | α i2 | … | α ij | … | α in |
… | … | … | … | … | … | … |
xm | α m1 | α m2 | … | α mj | … | α mn |
где α ij - элемент платежной матрицы для игрока А, т.е. его выигрыши. Хотя принято говорить выигрыши на самом деле это могут быть и проигрыши, т.е. отрицательные числа.
Для игрока В - элементы платежной матрицы βij равны по абсолютной величине и противоположны по знаку
Цель игрока А или В - выбрать оптимальную стратегию по какому-то критерию.
В качестве примера применения теории игр рассмотрим ситуацию, в которой два универсальных магазина имеют примерно равную долю сбыта товаров в относительно обособленном микрорайоне. С ростом местного населения возможны следующие альтернативы (варианты) развития этих магазинов.
x1, y1 - без расширения;
x2, y2 - расширение магазинов;
x3, уз - строительство филиала.
Предположим платежная матрица для магазина А имеет вид (числа условные):
Таблица 2
А В | y1 | y2 | y3 |
x1 | -25 | -15 | |
x2 | |||
x3 | -10 |
По экономическим условиям здесь два реальных игрока. И значит, поведение партнера можно прогнозировать в том смысле, что он будет стремиться сделать лучше себе, а значит хуже мне.
Это игра в условиях явного конфликта интересов.
Возможен другой вариант, когда явного конфликта интересов нет, т.к. второй игрок нереальный. Игры с нереальным игроком называются Игры с «природой». Природой чаще всего бывает покупательский спрос (не всегда).
Пример Игры с «природой». Годовой доход от использования каждого вагона в поезде с сезонными пассажирами, равен 200 ед., а расходы на эксплуатацию каждого вагона составляют 80 ед. Составим платежную матрицу, считая, что требуемое число вагонов (спрос) может быть 0, 1, 2, 3 – это стратегии нереального игрока, т.е. «природы».
Платежная матрица
Таблица 3
A В B | 0 | 1 | 2 | 3 |
0 | ||||
1 | -80 | |||
2 | -160 | |||
3 | -240 | -40 |
Если есть три вагона, и они все задействованы 3(200) - 3(80) = 360
Специфика игры с природой.
1. В случае игры с «природой» неопределенность больше, т.к. поведение реального игрока можно легко прогнозировать - он стремится создать партнеру худшие условия, а в игре с «природой» конфликта интересов нет.
2. Состояние «природы» можно описывать вероятностями, получаемыми из статистики наблюдений или экспертно.
Кроме платёжной матрицы в игровых задачах часто строят матрицы рисков. Матрица рисков - это преобразованная платежная матрица. Преобразования осуществляются так:
rij =βj - α ij, где βj- max выигрыш при данном (j-ом) состоянии природы, т.е. максимальное число каждого столбца платежной матрицы.
Пример построения матрицы рисков. Дана платёжная матрица (числа условные), к ней пристроена еще одна строка, в которой записаны максимальные числа столбцов. Строим матрицу рисков, т.е. в каждом столбце из этого максимального числа вычитаем число каждой клетки и разность записываем в эту же клетку. Например, для клетки с координатами 1,1 риск равен 6-1=5 и т.д.
Платежная матрица
A В В B | y1 | y2 | y3 |
x1 | |||
x2 | |||
Матрица рисков
А В | y1 | y2 | y3 |
x1 | |||
x2 |
Так как βj - max столбца, очевидно, что rij ≥ 0
Здесь риском называется разность между максимально возможным выигрышем при данном состоянии природы и выигрышем при выбранной стратегии. Это «недовыигрыш» - или по-другому упущенные возможности при выбранной стратегии игроком А.
Задача. Дана платёжная матрица (числа условные). Постройте матрицу рисков.
А В | Y1 | Y2 | Y3 | Y4 |
X1 | ||||
X2 | ||||
X3 | -4 |