Рассмотрим задачу.
Предприятие может выпускать три вида продукции – П1, П2 и П3, получая при этом прибыль, зависящую от спроса, который может быть в одном из четырех состояний – B1, B2, B3, B4. Дана матрица, ее элементы aij характеризуют прибыль, которую получит предприятие при выпуске i-й продукции при j-м состоянии спроса.
Продукция | Состояние спроса | |||
B1 | B2 | B3 | B4 | |
П1 | ||||
П2 | ||||
П3 |
Определить оптимальные объемы выпускаемой продукции, гарантирующие среднюю величину прибыли при любом состоянии спроса, считая его неопределенным.
Ознакомимся с основными понятиями теории игр.
Математическая модель конфликтной ситуации называется игрой, стороны, участвующие в конфликте, – игроками, а исход конфликта – выигрышем.
Для каждой формализованной игры вводятся правила, т.е. система условий, определяющая:
1) варианты действий игроков;
2) объем информации о поведении партнеров, которой владеет каждый игрок;
3) выигрыш, к которому приводит каждая совокупность действий. Как правило, выигрыш (или проигрыш) может быть задан количественно.
|
|
Игра называется парной, если в ней участвуют два игрока, и множественной, если число игроков больше двух. Мы будем рассматривать только парные игры. В них участвуют два игрока: А и В, интересы которых противоположны, а под игрой будем понимать ряд действий со стороны игроков А и В.
Игра называется игрой с нулевой суммой или антагонистической, если выигрыш одного из игроков равен проигрышу другого, т.е. для полного "задания" игры достаточно указать величину выигрыша первого игрока. Выбор и осуществление одного из предусмотренных правилами действий называется ходом игрока.
Стратегией игрока называется совокупность принципов, определяющих выбор его действий при каждом личном ходе в зависимости от сложившейся ситуации. Игра называется конечной, если у каждого игрока имеется конечное число шагов.
Для того чтобы найти решение игры, следует для каждого игрока выбрать стратегию, которая удовлетворяет условию оптимальности, т.е. один из игроков должен получать максимальный выигрыш, когда второй игрок придерживается своей стратегии. В то же время второй игрок должен иметь минимальный проигрыш, если первый придерживается своей стратегии. Такие стратегии называются оптимальными. Оптимальные стратегии должны также удовлетворять условию устойчивости, т.е. любому из игроков должно быть невыгодно отказаться от своей стратегии в этой игре.
Целью теории игр является определение оптимальной стратегии для каждого игрока. При выборе оптимальной стратегии естественно полагать, что оба игрока ведут себя разумно с точки зрения своих интересов.
|
|
Матрица, элементы которой характеризуют прибыль первого игрока при всех возможных стратегиях, называется платежной матрицей игры.
Рассматриваемая задача сводится к игровой модели, в которой игра предприятия А против спроса В задана платежной матрицей
B1 | B2 | B3 | B4 | αi | |
A1 | |||||
A2 | |||||
A3 | |||||
βj |
Обозначим через ai наименьший выигрыш игрока А при выборе им стратегии А. для всех возможных стратегий игрока В (наименьшее число в i-й строке платежной матрицы), т.е. ai = min aij.
Среди всех чисел ai (i = 1, 2,..., m) Выберем наибольшее: α = max αi. Назовем α нижней ценой игры или максимальным выигрышем (максими-ном). Это гарантированный выигрыш игрока А при любой стратегии игрока В. Следовательно, α = max min aij.
Стратегия, соответствующая максимину, называется максиминной стратегией. Игрок В заинтересован в том, чтобы уменьшить выигрыш игрока А. Выбирая стратегию Bj, он учитывает максимально возможный при этом выигрыш для игрока А. Обозначим βj = max aij
Среди всех чисел βj выберем наименьшее: β = min βj и назовем β верхней ценой игры или минимаксным выигрышем. Это гарантированный проигрыш игрока В.
Следовательно, β = min max aij. Стратегия, соответствующая минимаксу, называется минимаксной стратегией.
Принцип, диктующий игрокам выбор наиболее "осторожных" минимаксной и максиминной стратегий, называется принципом минимакса. Этот принцип следует из разумного предположения, что каждый игрок стремится достичь цели, противоположной цели противника. Определим нижнюю и верхнюю цену игры и соответствующие стратегии в задаче: α = 4, β = 6. Так как , то седловая точка отсутствует и оптимальное решение следует искать в смешанных стратегиях игроков.
Смешанной стратегией SA игрока А называется применение чистых стратегий A1, A2, …, Ai, …, Am c вероятностями p1, p2, …, pi, …, pm, причем
сумма вероятностей равна 1: . Смешанные стратеги игрок А записываются в виде строки SA = (p1, p2, …, pi, …, pm).
Аналогичн смешанные стратегии игрока В обозначаются в виде строки SB = (q1, q2, …, qi, …, qm), где сумма вероятностей появления стратегий равна 1: .
Итак, SA* = (p1, p2, p3) и SB*= (q1, q2, q3, q4).
Обозначив xi = pi /v, i= 1, 2, 3, 4 и yj = pj,/v, j = 1, 2, 3, 4, составим пару двойственных задач линейного программирования:
Например:
прямая задача | двойственная задача |
Приведем математическую модель задачи к каноническому (стандартному) виду и решим симплексным методом. Из симплексной таблицы с оптимальным решением возмем значения параметров (-Z), xi и вычислим цену игры v, и вероятности применения стратегий pi. Сделать анализ решения.