Это самый универсальный критерий, который позволяет управлять степенью «оптимизма - пессимизма». Введем некоторый коэффициент , который назовем коэффициентом доверия или коэффициентом оптимизма. Наихудший вариант можно ожидать с вероятностью (1- ). Так как коэффициент нам не задан, то следует его принять .
Для реализации критерия определяются наилучшие и наихудшие значение каждой альтернативе. Далее, вычисляется функции полезности по формуле:
Выбираем ту альтернативу, для которой функция полезности максимальна. Выбираем А2.
Принятие решений в условиях противодействия
Решение биматричных игр.
Вариант 7.
Условие:
Платёжные матрицы
,
Решение:
В каждом столбце матрицы A найдем максимальный элемент. Эти элементы подчеркнуты в матрице A. Их положение соответствует приемлемым ситуациям 1-го игрока, когда второй игрок выбрал стратегию j соответственно. Аналогично для второго игрока.
,
Т.к. равновесных точек нет, то ищем решение в смешанных стратегиях.
|
|
Вероятности р1=р, р2=1-р, q1=q, q2=1-q, а средние выигрыши вычисляются по формулам:
Ha(p,q) = a11p q + a12 p(1-q) + a21(1-p)q + a22(1-p)(1-q),
Hb(p,q) = b11pq + b12 p(1-q) + b21(1-p)q + b22(1-p)(1-q),
где 0 ≤ p ≤ 1, 0 ≤ q ≤ 1,
Полагая p = 1, а потом p = 0, получаем, что
HA(1,q) = (a11 - a12 - a21 + a22)q + a12 + (a21 - a22)q,
HA(0,q) = (a21 - a22)q + a22
Рассмотрим разности
HA(p,q) - HA(1,q) = (a11 - a12 - a21 + a22)pq + (a12 - a22)p – (a11 - a12 - a21 + a22)q + a22 – a12,
HA(р,q) - HA(0,q) = (a11 - a12 - a21 + a22)pq + (a12 - a22)p
Полагая C = a11 - a12 - a21 + a22, α = a22- a12, получим
C = -2 - 1 - 4 -10 = -17
α = -10 - 1 = -11
HA(p,q) - HA(1,q) = Cpq – αp – Cq + α = (p–1)(Cq-α)
HA(p,q) - HA(0,q) = Cpq – αp = p(Cq-α)
В случае, если пара (p,q) определяет точку равновесия, эти разности неотрицательны, поэтому:
(p–1)(Cq-α) ≥ 0, p(Cq-α) ≥ 0
(p–1)(-17q+11) ≥ 0
p(-17q+11) ≥ 0
получаем, что:
|
p=0, q ≤ 11/17
β = b22-b21
D = 2 - (-1) - (-4) + 5 = 12
β = 5 - (-4) = 9
|
q(12p-9) ≥ 0
q=1,p ≥ 3/4
q=0, p ≤ 3/4
0 ≤ q ≤ 1, p=3/4