X — множество стратегий статистика, аналогичное множеству стратегий в антагонистических играх. Если множество X — дискретное, X = (x,…, x), тогда можно рассматривать множество ситуаций и множество выигрышей статистика в этих ситуациях: (x, z), i = , j =
П = (a) n*m
Эта функция П называется функцией потерь. Значение функции потерь позволяет игроку 1 (статистику) принимать предпринимать правильные действия.
Пример: Задача о яйцах и креме.
Состояние яйца | ||
Действие | Z1 - хорошее | Z2- испорченное |
долить в остальные 5 яиц, x1 | крем из 6 яиц | крема нет, загублено 5 хороших яиц |
вылить разбитое яйцо на блюдце для контроля, x2 | крем из 6 яиц, но надо мыть посуду (блюдце) | крем из 5 яиц, надо мыть блюдце "с отвращением" |
выбросить яйцо, не глядя, x3 | крем из пяти яиц, загублено 1 яйцо | крем из 5 яиц |
Если каким-либо образом оцифровать описание ситуации в виде значений функций потерь, то получим игру с природой.
В описании игры с природой наблюдается полная аналогия с антагонистической игрой. Статистик может принимать чистые стратегии xX и их вероятностные оценки p= p(x)P, (X, P) — пространство стратегий статистика.
|
|
А = (a), i = ; j =
X = ,…,, m — чистые стратегии статистика;
n — чистые состояния природы;
Z = ,…,
Если используются смешанные стратегии, то каждому из состояний чистой стратегии сопоставляется значение p, i = . Определим вероятность использования смешанных стратегий.
x~,…,
q~,…, — вероятность состояний природы.
Если эти вероятности известны, то можно определить математическое ожидание выигрыша статистика статистика в этой игре:
M[S, S] = a*p*q
S— множество (X*P)
S— множество (Z*Q)
p = ; q =
M[S, S] = p*A*q
Задачу статистика в этой игре можно определить как нахождение такого S, при котором его выигрыш M[S, S] max. Эта стратегия Sможет быть как чистой, так и смешанной.
Исходя из этого, в матрице платежей (a) можно рассматривать доминирующие и доминируемые стратегии.
Доминирование по строкам выполняется также, как в антагонистических играх. Доминирование по столбцам теряет смысл, т. к. природа не выиграет и не проиграет, её безразлично её состояние.
С учётом этого матрица платежей А =(а) не в полной мере характеризует достоинства и недостатки каждой стратегии игроков.
Используют другую форму описания игры, которая более полно отражает степень удачливости в выборе игроков. Одним из таких показателей является матрица рисков:
A =
Номер столбца матрицы совпадает с состоянием природы, номер строки характеризует стратегию игрока. B= max a— максимальный выигрыш статистика при данном состоянии природы j.
R = (r), i = , j =
r= B- a— разница между максимальным выигрышем и выигрышем, который получит статистик, выбирая стратегию x.
|
|
Матрица рисков: R = . В матрице рисков хотя бы один из элементов в каждом столбце должен равняться нулю.
Пример: А = ; R =
Если условием выбора стратегии является максимум среднего выигрыша, то по матрице рисков Rmin. Если же вероятности состояния природы известны (q), то условие максимума среднего выигрыша и условие минимума среднего риска дают одни и те же стратегии.
Если V= ; V= maxVили r= ; r=minr, то решение будут одинаковыми.
Пример: Матрица платежей: А = ; q = (0,2; 0,5; 0,3)
V= 1*0,2+ 3*0,5+ 1*0,3 = 2
V= 2*0,2+ 0,5+ 1,2 = 2,1
V= 2,1; хявляется предпочтительной стратегией: она даёт больший средний выигрыш V=V
R = r= 0,2+ 0,9 = 1,1
r= 1x— риск минимален.
О вероятностях состояния природы в лучшем случае известны их некоторые оценки q’. На практике достоверность этих оценок является слишком низкой для того, чтобы использовать их при оценке качества выбора решений статистика.
В таких условиях лучше:
1. Не пользоваться этими оценками и для выбора решения использовать критерий, который не пользуется понятием вероятности состояния природы;
2. Cчитать все состояния природы равновероятными q= 1/n, i=.
Критерий, позволяющий принять задачу выбора решения, называется критерием выбора решений при неопределённости.