Этот метод ориентирован на произвольную игру G(m,n)

Не требует условия aij>0.

 

 

Рассмотрим метод на примере игры G(3,3).

 

  B1 B2 B3
A1 7 2 9
A2 2 9 0
A3 9 0 11

 

SA=(p1,p2,p3)

SB=(q1,q2,q3)

 

 

Строится следующая матрица:

 

k i B1 B2 B3 j A1 A2 A3 V V V*
1 3 9 0 11 2 2 9 0 0 9 4.5
2 2 11 9 11 2 4 18 0 4.5 9 6.75
3 2 13 18 11 3 13 18 11 3.67 6 4.84
4

 

где:

k            – номер партии

i             – номер стратегии, выбираемой игроком A

j             – номер стратегии, выбираемой игроком В

Bi                  – накопленный игроком А выигрыш за k партий, при условии,

                 что в данной партии B выбирает стратегию Bi

Аj                  – накопленный игроком В проигрыш за k партий,

                 при условии, что в данной партии A выбирает стратегию Аj.

V            – нижняя оценка игры = min (накопленный выигрыш)/k

V           – верхняя оценка игры = max (накопленный проигрыш)/k

 

Доказано, что

 

V*=(V +V)/2, V* à V при k à ¥ и

- cколько раз выбирается Аi стратегия

 - cколько раз выбирается Bj стратегия

Пример. Задача о двух КБ

 

Объявлен конкурс на выполнение 2-х проектов.

 

На проект 1 выделено а денежных единиц.

На проект 2 выделено b денежных единиц.

 

В конкурсе участвуют 2 КБ:

 

КБ1(А) – 4 отдела,

КБ2(В) – 3 отдела.

 

Практика показывает, что если КБ выделяет больше отделов на проект, то оно и получает этот проект, если же они выделяют одинаковое количество отделов, то получения проекта КБ1 и КБ2 равновероятны.

 

Стратегии:

 (a,b) - a - количество отделов, выделяемых под первый проект

       b - количество отделов, выделяемых под второй проект

 

 

КБ1(А):

А1=(4,0); А2=(3,1); А3=(2,2); А4=(1,3); А5=(0,4).

КБ2(В):

В1=(3,0); В2=(2,1); В3=(1,2); В4=(0,3);

 

Для того, чтобы свести парную игру к антагонистической, вычисляем средний выигрыш – (a+b)/2 и вычитаем его из V.

 

G(5,4):

 

  В1 В2 В3 В4
А1 а/2 (a-b)/2 (a-b)/2 (a-b)/2
А2 b/2 a/2 (a-b)/2 (a-b)/2
А3 (b-a)/2 b/2 a/2 (a-b)/2
А4 (b-a)/2 (b-a)/2 b/2 a/2
А5 (b-a)/2 (b-a)/2 (b-a)/2 b/2

 

 

Пусть а=b.

     
 

  В1 В2 В3 В4
А1 a/2 0 0 0
А2 a/2 a/2 0 0
А3 0 a/2 a/2 0
А4 0 0 a/2 a/2
А5 0 0 0 a/2

 

 

  В1 В4
А2 a/2 0
А4 0 a/2

 

SA=(0,1/2,0,1/2,0)

SB=(1/2,0,0,1/2)

 

p1=p2=1/2

q1=q2=1/2

 

V=(a11*p1+a21*p2)*q1+(a12*p1+a22*p2)*q2=a/4

VКБ1=a/4+a=5a/4

VКБ2=3a/4

 

Парная игра с произвольной суммой.

(биматричная игра).

 

Аm \Bn В1 Вn
А1      
  || bij||  
Аm      

 

Аm \Bn В1 Вn
А1      
  || aij||  
Аm      

 

Игра G(m,n)

 

 

Выигрыши игрока А                                     Выигрыши игрока В

Аm \Bn В1 Вn
А1      
  (aij,bij)  
Аm      

 

Две данные матрицы объединяют в одну:

 

 

Нет общей теории решения биматричных игр.

В данном классе игр могут быть коалиции, договорённости.

 

Теория некооперативных игр Нэша.

 
Аm \Bn В1 Вn
А1      
   (aij,bij)  
Аm      

 

 


Необходимо найти решение в виде:

       SA =(p1, p2…, pN)

       SB =(q1, q2…, qN)

       Вводится понятие – ситуация равновесия:

       SA*=(pi*) i=1..m

       SB*=(qj*) j=1..n

                       

Определение.

SA* и SB* является ситуацией равновесия, если онаудовлетворяет следующим условиям:

Для игрока А:

Для игрока В:

 

       По Нэшу, решением биматричной игры является ситуация равновесия при условии, что они взаимозаменяемы.

       Нэш доказал, что для любой биматричной игры существует ситуация равновесия, но нет общего метода её поиска.

 

 



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: