double arrow

Критерии выбора наилучших стратегий в условиях неопределенности


Основные понятия и определения теории игр

Критерий выбора наилучших решений в условиях риска

Критерии выбора наилучших стратегий в условиях неопределенности

Основные понятия и определения теории игр

Тема 11 Экономико-математические методы и модели теории игр

В экономике часто возникают ситуации, в которых интересы участвующих сторон противопо­ложны. Такие ситуации называют конфликтными. Математическую модель конфликтной ситуации называют игрой. Стороны, участвующие в подобной ситуации, — игроки. Возможные действия игро­ков — стратегии. Если один из игроков не является сознательно действующим противником, то его называют «природа», а соответствующие игры — «игры с природой». В этом случае стратегиями природы будут ее возможные состояния. Сознательно действующий игрок может собрать дополни­тельную статистическую информацию о возможных состояниях природы. Потому игры с природой называют статистическими играми. Цель статистических игр – выбор наилуч­ших стратегий (с точки зрения возможно большего выигрыша или возможно меньшего проигрыша сознательно действующего игрока). Такой выбор основывается на платежной матрице.




Пусть у игрока, действующего сознательно, есть т стратегий, которые мы обозначим , А2, ..., а у второго игрока (природы) — п стратегий, которые мы обозначим П2,…, . Прибыль или убыток (выигрыш или проигрыш) сознательного игрока в случае, если он выберет стратегию , а природа реализует стратегию , обозначим Тогда можно построить таблицу вы­игрышей, которая называется платежной матрицей А:

А  
        П2  
             
           
А= А2        
   
           
               

Сознательно действующий игрок принимает решение о выборе той или иной стратегии, поэто­му в дальнейшем будем называть его принимающим решение.

При выборе наилучших стратегий различают две ситуации: ситуацию, в которой вероятности состояний природы неизвестны, и тогда говорят о принятии решений в условиях неопределенности, и ситуацию, в которой вероятности состояний природы известны, тогда говорят о принятии решений в условиях риска. Для каждой из ситуаций существуют свои критерии (принципы) выбора наилучших решений.

1 Критерий Вальда. Данный критерий основан на принципе крайнего пессимизма. Принима­ющий решение считает, что какую бы стратегию он ни выбрал, природа реализует свое наихудшее состояние. В наихудших условиях принимающий решение находит наилучший выход.



Таким образом, принимающий решение для каждой стратегии , находит наименьший выиг­рыш Затем среди наименьших выигрышей он находит наибольший:

. (6.7)

Стратегия соответствующая , будет наилучшей по Вальду. Ее часто называют максимальнной стратегией.

2 Критерий Сэвиджа. Этот критерий основан на принципе минимизации максимального рис­ка. Риском принимающего решение называют разницу между тем выигрышем, ко­торый он бы получил, если бы знал, какое состояние реализует природа, и его реальным выигрышем, т.е.

Матрица рисков R имеет вид:

А  
        П2  
             
           
R= А2        
   
           
               

Принимающий решение для каждой стратегии находит максимальный риск .Затем из максимальных рисков выбирает минимальный:

Стратегия соответствующая минимальному из максимальных рисков , будет наилучшей по Сэвиджу.

3 Критерий Гурвица. Это критерий пессимизма-оптимизма. Наилучшей по Гурвицу является стратегия , соответствующая числу , которое рассчитывается по формуле:

(6.9)

Значение параметра задает принимающий решение на основании своего опыта. Если = 1, то критерий Гурвица преобразуется в критерий крайнего пессимизма:

Если = 0, то получаем критерий крайнего оптимизма:



На практике выбирают 0 < < 1.

Пример. Небольшое частное предприятие выпекает диетические хлебобулочные изделия. Оборудование по­зволяет выпекать 500, 600 или 700 кг изделий в день. Спрос на данный вид продукции также может составлять 500, 600 или 700 кг в день. Если хлебобулочные изделия не продаются в этот день, то они возвращаются на предприятие для переработ­ки. Затраты на производство 1 кг изделий составляют 2 тыс. руб., а цена реализации — 3,5 тыс. руб. Дополнительные затра­ты в случае возврата составляют 1 тыс. руб. на 1 кг изделий.

Необходимо определить ежедневный объем выпечки диетических хлебобулочных изделий.

Решение. В этой ситуации можно выделить две стороны: менеджер предприятия, который должен принять реше­ние об объеме производства, действующий сознательно, и спрос на хлебобулочные изделия, который не является созна­тельно действующим противником. Ситуацию можно назвать конфликтной, так как результаты действий одной стороны зависят от действий другой стороны, не всегда благоприятных для первой.

В данном примере один игрок — менеджер предприятия. Его возможные действия (стратегии): запланировать вы­печку хлебобулочных изделий в объеме 500, 600 либо 700 кг. Второй игрок— спрос на хлебобулочные изделия (природа). Его возможные действия: установить спрос на хлебобулочные изделия в объеме 500, 600 либо 700 кг.

Рассчитаем платежную матрицу. Она будет иметь размерность 3x3, так как игрок, принимающий решение, имеет три стратегии — объем выпечки 500 кг, — 600 кг, А3 — 700 кг), и второй игрок (природа) имеет три стратегии ( — спрос составит 500 кг, П2— 600 кг, — 700 кг). Элементу платежной матрицы соответствуют стратегии и . Это значит, что предприятие выпечет 500 кг хлебобулочных изделий, и спрос на них определится в объеме 500 кг, т.е. все изде­лия будут реализованы в тот же день. Тогда прибыль предприятия составит:

(3,5 - 2) * 500 = 750 тыс. руб.,

т.е. = 750 тыс. руб.

Далее рассчитаем элемент платежной матрицы . Ему соответствуют стратегии и , т.е. предприятие выпечет 500 кг хлебобулочных изделий, а спрос на них определится в объеме 600 кг. Таким образом, все изделия проданы и прибыль предприятия составит:

(3,5 - 2)*500 = 750 тыс. руб.,

т.е. = 750 тыс. руб.

Аналогично определим = 750 тыс. руб.

Рассчитаем элемент платежной матрицы . Предприятие выпечет 600 кг хлебобулочных изделий, а спрос на них определится в объеме 500 кг; 100 кг хлебобулочных изделий будет возвращено на переработку. Тогда прибыль предприятия рассчитывается следующим образом:

(3,5 - 2) *500 + (-2 - 1) *100 = 750 - 300 = 450 тыс. руб.,

т.е. = 450 тыс. руб.

Аналогично рассчитываются все остальные элементы платежной матрицы. В результате платежная матрица имеет вид

А=

Так как в данном примере отсутствует информация о вероятностях, с которыми реализуются стратегии природы, то имеем ситуацию неопределенности. Для выбора наилучших стратегий воспользуемся приведенными выше критериями.

1. Критерий Вальда. Для каждой из стратегий выберем наименьший выигрыш. Для стратегии все состояния природы равнозначны, поэтому условно будем считать, что наименьшим выигрышем принимающего решение будет прибыль 750 тыс. руб., т.е. = 750 тыс. руб. Для стратегии А2 наихудшим будет состояние природы а наименьшим выигрышем а2 = 450 тыс. руб. Для стратегии А3 наименьшим выигрышем будет а3= 150 тыс. руб. Запишем наименьшие выигрыши принимающего решение в дополнительный столбец платежной матрицы:

         
 
 
 

Далее из наименьших выигрышей принимающий решение выбирает наибольший, т.е. = 750= = . Наибольший из наименьших выигрышей соответствует стратегии . Это будет наилучшая стратегия по критерию Вальда.

Таким образом, если руководствоваться принципом крайнего пессимизма (критерием Вальда), то следует выпекать 500 кг хлебобулочных изделий диетических сортов в сутки. При этом прибыль предприятия будет не меньше 750 тыс. руб. при любом спросе.

2. Критерий Сэвиджа. Рассчитаем риск для каждой пары стратегий природы и принимающего решение. Если бы менеджер предприятия точно знал, что природа реализует свое состояние т.е. спрос составит 500 кг, то он бы выбрал стратегию ; при этом предприятие получило бы прибыль 750 тыс. руб.— наибольшую для состояния природы = 750. Для состояния природы П2 наибольшая прибыль равна = 900, а для состояния природы П3 = 1050. По опре­делению, для стратегии , и состояния природы риск составит = 750 - 750 = 0, для стратегии А2 и состояния природы риск равен = 750 - 450 = 300, и т.д.

Получаем матрицу рисков:

                   
        =  
           
           

Далее принимающий решение выбирает для каждой стратегии максимальный риск. Для стратегии , максимальным будет риск, равный 300, т.е. = 300. Аналогично = 300; = 600. В матрицу рисков добавляем столбец, содержащий мак­симальный риск для каждой стратегии:

         
 
 
 

Из максимальных рисков принимающий решение выбирает минимальный: {300,300,600}, т.е. минимальному из максимальных рисков соответствуют и первая, и вторая стратегии. Наилучшими стратегиями по кри­терию Сэвиджа будут и А2.

3. Критерий Гурвица. Пусть в данном примере принимающий решение в равной мере оптимист и пессимист и ис­пользует критерий Гурвица, в котором = 1/5.

Для каждой стратегии рассчитаем число :

,

.

Числу а3 = 870 соответствует стратегия A3, т.е. при таком выборе параметра наилучшим вариантом по Гурвицу яв­ляется выпечка 700 кг хлебобулочных изделий.

Таким образом, в данном примере лучшей по всем критериям будет первая стратегия. Однако в некоторых задачах разные критерии могут рекомендовать различные стратегии. Это объясняется неопределенностью ситуации. В этом случае можно провести дополнительные исследования. И хотя использование игры с природой при принятии решений в условиях неопределенности не всегда дает однозначный результат, принимающий решение упорядочивает данные, определяет со­стояния природы и свои возможные решения, оценивает потери и выигрыши для различных вариантов, что способствует повышению качества принимаемых решений.







Сейчас читают про: