Основные постулаты теории субъективной ожидаемой полезности

(Теории проспектов)

1). Эффект определенности

ЛПР, как правило, предпочитает детерминированный исход

недетерминированному.

2). Эффект отражения

В зависимости от формулировки задачи (в терминах выигрыша или проигрыша) 

ЛПР принимает разные решения.

 

3). Эффект изоляции

Если у ЛПР есть 2 варианта выбора и в них есть одинаковые исходы, то они

выбрасываются.

 

Проспект

P(x,p,y,q) – проспект.

В нем вводится вероятность q для исхода y, p+q<1.

                p       x

              

  1-p-q

0               q        y

 

Вводится функция субъективной ожидаемой полезности:

 

V=W(p)*V(x)+W(q)*V(y), где              (*)

V(x), V(y) – цены исходов x и y,

W(p), W(q) – важности вероятностей p и q.

По определению V(0)=0.

На функции V и W накладываются определенные ограничения:

V(x):

1). V(x) – монотонная функция

2). Спад V(x) круче при отрицательных x

W(x):

1). W(x) монотонна и не подчиняется требованиям теории вероятностей

W(p)+W(1-p)< 1

2). W(0)=0, W(1)=1


                                               W(p)


                     0                  1/2           1                      p


3). W(p)>p при малых p;

W(p)<p при больших p.

4). W(p) плохо определена при p=1 и p=0.

Малые изменения p приводят к большим изменениям W(p).

5). Отношение W(p)/W(q) ближе к 1 при малых вероятностей, чем при

больших.

Этапы поиска решения

 

1. Редактирование проспекта

 

- выбор опорной точки;

- объединение одинаковых исходов(суммируем вероятности);

- удаление одинаковых исходов с равными вероятностями в сравниваемых

проспектах;

- удаление доминирующих исходов;

- округление значений вероятностей и цен исходов.

 

2. Рассчет V по формуле(*) и выбор варианта с максимальным значением.

 




Пример.

    

                1 млн      

d1               

                0.1  5 млн   

                    0.89          

d2                    1 млн      

0.01

ЛПР выбирает d1.

U(5)=1 U(1)=U U(0)=0

 

U > W(0,1)*1+(0,89)*U

 

U > W(0,1)/(1-W(0,89))

 

 

                   0,1  5    

                                     

d1           0,9   0     

                0.11    1   

                                   

d2      0,89      0 

ЛПР выбирает d1.

 

 

W(0,1)*1 > W(0,11)*U

 

U < W(0,1)/W(0,11)

 

W(0,1)/W(0,11) >U > W(0,1)/(1-W(0,89))

 

W(p)+W(1-p) < 1

 

W(p) <1 - W(1-p)

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: