Статистические игры

Во многих практических ситуациях приходится рассчитывать случаи, когда один из игроков нейтрален, т.е. не стремится извлечь max выгоду или обратить в свою пользу ошибки противника. К таким играм относят ситуации в которых в качестве одного из игроков выступает природа (вся совокупность внешних обстоятельств, которые не имеют злого умысла, а развиваются и действуют по своим законам).

У человека есть возможность, наблюдая сложившиеся обстоятельства изучать противника посредством проведения эксперимента. Если этот эксперимент не ограничен, то знания можно сделать сколь угодно полными и принимать решения в условиях неопределенности, однако это может быть невозможно в силу обстоятельств. Проведение эксперимента требует больших затрат времени, затраты средств могут быть больше чем выгода от добавочных знаний, поэтому возникает необходимость принять решение о целесообразности проведения эксперимента и если эксперимент проводится, то необходимо принять решение об его завершении и действиях после его окончания. Игры, в которых один игрок природа другой человек называются статистическими. Стратегии природы это полная совокупность внешних условий, в которых приходится принимать решения, называются состояниями природы.

Пространство состояний . Множество A={a1, a1, …, ak,}- пространство частых стратегий статистика. ai – возможные действия статистика. Оценка действий статистика определяется функцией потерь для всех возможных комбинаций элементов множества . Оценка может быть задана аналитически или при помощи матрицы потерь .

Знание априорного распределения вероятности позволяет определить средние потери, которые несет статистик, выполняя свои действия.

Наилучшим для статистика считается байесовское действие a­*­, которое обеспечивает min потери

Кроме чистых стратегий у статистика бывают смешанные стратегии, задаваемые распределением вероятностей, которые определены как вероятности использования чистых стратегий a1, a2,... ak для статистика.

Множество H={η(a1), η(a2), …, η(ak)} – пространство смешанных стратегий статистика. Смешанные стратегии статистика и природы обуславливают средние потери статистика. .

При этом задача статистика состоит в выборе такой стратегии η*(a) при которой средние потери будут минимальны. .

Пример: Задача о замене оборудования.

Установленное на предприятии оборудование может оказаться в одном из 3 состояний: θ1 – оборудование работоспособно и требует небольшого текущего ремонта.

θ2 – некоторые детали требуют большого ремонта или замены.

θ3 – основные детали износились на столько, что дальнейшая эксплуатация оборудования невозможна.

Для предприятия возможны 3 способа действия:

а1 – оставить оборудование еще на 1 год проведя ремонт своими силами.

а2 – провести капитальный ремонт с вызовом специальной бригады ремонтников.

а3 – замена оборудования новым.

Потери предприятия, при различных способах действия включая стоимость ремонта, замены оборудования убытки, связанные с ухудшением качества продукции с простоями вызванными неисправностью оборудования указаны в таблице. Из опыта работы предприятия известно, что состояние θi встречается соответственно в 20%, 50%, 30% случаев.

L(θi,a) a1 a2 a3
θ1      
θ2      
θ3      

Тогда, применяя байесовский подход, вычислим средние потери, чтобы определить оптимальную чистую стратегию статистика.

L1 =0,2*1+0,5*5+0,3*7=4,8

L2=0,2*3+0,5*2+0,3*7=3,4=

L3=0,2*5+0,5*4+0,3*3=3,9

а2*

Статистическая игра может быть представлена в виде обычной игры(S – игры) заданной множеством точек C1, C1, …, Cn в m мерном пространстве. Координатами этих точек являются потери статистика(2-го игрока), при всевозможных чистых стратегиях 1-го игрока.

Не существует универсального правила позволяющего выбрать определенный образ действий независимо от сложившейся ситуации. При рассмотрении смешанной стратегии статистика η(а) можно лишь указать следующие характерные ситуации:

1. Нельзя найти ни одной стратегии лучшей стратегии η(а), т.е

η(а) – допустимая стратегия.

2. Если η(а) недопустимая стратегия, то , тогда стратегия η(а) исключается в пользу стратегии η/(а).

Например, для двумерного пространства, когда множество стратегий описывается областью S, мы находим самую левую, самую нижнюю точку.

AB – допустимое множество стратегий статистика.

A

B

3. Принципом выбора называется правило позволяющее определить наилучшую смешанную стратегию статистика. Выделяют следующие принципы выбора:

1) Принцип минимакса. Выбор стратегии η* обеспечивает минимальные потери при наихудшем состоянии природы.

Этот принцип исходит из предположения, что природа действует наихудшим для статистика образом. Является оправданным в стратегических играх, но в статистических играх выражает точку зрения крайнего пессимизма и не учитывает априорную информацию о состоянии природы, поэтому рекомендован в тех случаях, когда отсутствует априорная информация или есть основания сомневаться в ее достоверности.

2) Принцип минимакса дополнительных потерь. Выбор стратегии η* осуществляется исходя из дополнительных потерь.

- это минимальные потери, которые статистик несет обязательно, даже при своем наилучшем действии, т.е необходимые потери, которые могут быть компенсированы каким-то образом и могут не учитываться при выборе стратегии

3) Байесовский принцип. Учитывает априорные распределения вероятностей и смешанная стратегия статистика оценивается путем усреднения потерь по всем возможным состояниям природы , тогда Байесовская стратегия:

Статистические игры позволяют уточнить состояние природы путем постановки эксперимента, однако это требует затрат средств и времени.

Единичным экспериментом называется эксперимент с заранее определенным объемом и порядком проведения серии испытаний. Пусть Z – пространство исходов Zi, проводимого эксперимента. исходы эксперимента связанны с состоянием природы условными вероятностями

Пространство выбора – это множество задается при помощи таблицы содержащей распределение вероятностей на множестве . Статистик принимает решение в зависимости от исхода эксперимента Zi. Правила d(Z), определяющие решение , которое должен принять статистик при исходе Z называются решающей функцией.

Любую решающую функцию можно рассматривать как разбиение пространства Z на классы. Если статистик выбрал некоторую функцию d(z) в чем и состоит решение задачи, то ему соответствуют потери. Поэтому для оценки решающей функции используется функция риска, соответствующая всевозможным исходам эксперимента.

Пространство решающих функций это пространство содержащее полный перечень решающих функций и из него происходит выбор в игре и единичном эксперименте. При использовании смешанных стратегий должен существовать механизм случайного выбора, задающий распределение вероятностей η(d) и функция риска примет вид:

Принцип минимакса состоит в том, чтобы выбрать стратегию η(d) при которой средний риск, при наихудшем для статистика состоянии природы, был минимальным, т.е

Ожидаемый риск – это средний риск с учетом всех возможных состояний природы и априорного распределения вероятностей на пространстве θ. Для Байесовского принципа статистик может ограничится использованием только чистых, поэтому ожидаемый риск: , а байесовский принцип требует такого применения решающей функции d*, при которой ожидаемый риск будет минимальным т.е .

Пусть N – общее число чистых стратегий статистика в игре с единичным экспериментом. Если l это число возможных действий статистика в игре без эксперимента, ν - число возможных исходов, то N= l ν. При применении Байесовского подхода к определению оптимальной стратегии вместо априорного распределения вероятностей следует использовать апостериорное с целью упрощения решения. Дело в том, что априорное распределение вероятностей дает информацию о том насколько часто то или иное состояние природы встречается вообще, безотносительно к тем конкретным условиям, в которых статистику приходится принимать решение. Целью эксперимента является получение дополнительной информации о действительном состоянии природы, и вместо априорного получается апостериорное распределение на пространстве θ при данном конкретном исходе эксперимента. Это распределение получается по формуле Байеса:

, где ;

Знание апостериорного распределения позволяет оценивать состояние природы, используя принцип максимального правдоподобия, согласно которому за оценку состояния природы принимают то состояние, которое наиболее вероятно на основании опытных данных.

Проблема необходимости рассмотрения большого количества исходов эксперимента снимается рассмотрением задачи для какого-нибудь конкретного случая, при помощи апостериорного распределения вероятности. В этом случае в качестве чистых стратегий статистика используются элементы пространства решений A. При этом каждому решению будут соответствовать потери.

- безусловные потери.

Байесовский принцип сводится к тому, чтобы выбрать такое действие a* при котором величина потерь будет минимальна

Пример. Задача о технологической линии.

На линию может поступать сырье с малым количеством примесей ситуация θ1, с большим количеством примесей θ2.

Предусмотрены 3 режима работы а1, а2, а3. Потери, отражающие качество выпускаемой продукции и расходы сырья в зависимости от качества сырья и режима работы представлены в таблице.

  а1 а2 а3
θ1       0,6
θ2       0,4

0*0,6+5*0,4=2

1*0,6+3*0,4=1,8=min L

3*0,6+2*0,4=2,6

Определив апостериорное распределение вероятностей по известным априорным распределениям и условным распределениям P(Z/θ).

  априорное распределение P(Z/θ) Апостериорное распределение
Z1 Z2 Z3 Z1 Z2 Z3 Z1 Z2 Z3
θ1 0,6 0,6 0,25 0,15 0,36 0,15 0,09 0,818 0,355 0,31
θ2 0,4 0,2 0,3 0,5 0,08 0,12 0,2 0,182 0,445 0,69
P(Z)         0,44 0,27 0,29      

Согласно принципу максимального правдоподобия θ=θ1 это то состояние, которое принимает природа, и поэтому принимаем решение о наладке линии в соответствии с этим состоянием.

Пример. Задача о радиолокационной станции (РЛС).

Сигнал может появлятся или при наличии цели в зоне досягаемости или в результате действия различных помех. Тогда могут быть 2 состояния природы:

θ1 – цель есть, θ2 – цели нет. Можно принять 2 решения а1 – пуск, а2 – нет. Могут быть допущены ошибки 2 видов а12 – ошибка 1-го рода (ложная тревога), а21 – ошибка 2-го рода (пропуск цели).

Для принятия решения в двухальтернативной задаче используют отношение правдоподобия, определяемое соотношением:

Если заданно число К, по значению которого принимают решение, по одному из этих правил:

решение а1 если , а2 если , а1 или а2 если .

Значение К выбирают в зависимости от последствий, к которым может привести ошибочное решение. Так в данной задаче ошибка «ложная тревога» может иметь большие последствия чем «пропуск цели», поэтому решение а1 следует принимать если цель действительно есть, т.е. К следует брать гораздо больше 1.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: