Фон Нейман, О Моренштерн.
6 аксиом.
Функция ожидаемой полезности.
Лотерея:
А – множество исходов: x, y, z, …
Известны вероятности исходов: p, q, r, …
(x, p, y) – вектор с двумя возможными исходами:
x => p
y => 1-p
Лотерея обозначается следующим образом:
Средняя цена лотереи (x, p, y): xp + y(1-p)
Аксиомы рационального выбора:
А1: Все возможные исходы должны принадлежать А.
x (x A)
А2: На множестве исходов должно быть задано отношение строго предпочтения P(>), нестрогого R(), безразличия I(), причём P R, I R и они удовлетворяют двум условиям:
1) Связности, то есть либо справедливо xRy, либо yRx.
2) Транзитивности, то есть из xRy & yRz => xRz.
А3: Две лотереи ((x, p, y), q, y) и (x, pq, y), находятся в состоянии безразличия, то есть справедливо: ((x, p, y), q, y) I (x, pq, y)
А4: Если xIy, то (x, p, z) I (y, p, z).
А5: Если xPy, то xP(x, p, y)Py.
А6: Если xPyPz, то существует вероятность p, такая, что yI(x, p, z).
|
|
Теорема:
Если выполняются аксиомы А1-А6, то существует информация полезности, определяемая на множестве исходов А, для которых выполняются следующие условия:
1) xRy ó U(x) U(y).
2) U(x,p,y) = pU(x) + (1-p)U(y)
U(x) U(y), aU(x) aU(y) При a>0
Пример.
Есть два типа урн.
|
|
700 штук 300 штук
Решение ЛПР:
d1 +350 (если угадано верно)
- 50 (если не верно)
d2 +500 (если угадано верно)
- 100 (если не верно)
Тип урны |
Вероятность выбора урны |
Выигрыш при выборе | |
d1 | d2 | ||
1 | 0.7 | 350 | -100 |
2 | 0.3 | -50 | 500 |
U(d1) = 0.7*350 – 0.3*50 = 230
U(d2) = -0.7*100 + 0.3*500 = 80
d1 – предпочтительнее.
Процесс выбора в ЛПР или ДР.
- личный ход. – случайных ход.
| |||
|
|
Pк(y1) = P(к|н1) = 0.6
Вероятность вытянуть красный шар из
урны 1
Pк(y2) = 0.3
Pч(y1) = 0.4
Pч(y2) = 0.7
Pк = P(к) = Pк(y1)*P(y1) + Pк(y2)*P(y2) =
= 0.6*0.7 + 0.3*0.3 = 0.51
Pч = 0.49
P(y1|к) = 0.6*0.7/0.6*0.7 + 0.3*0.3 = 0.82
P(y2|к) = 0,18
P(y1|ч) = 0,57
P(y2|ч) = 0,43
P(yi|к) = (Pк(yi)* P(yi)) /
/ (Pк(y1)*P(y1) + Pк(y2)*P(y2))
Парадоксальные поведения ЛПР.
Парадокс Алле:
|
|
U(5) = 1 U > 0.1*1 + 0.85*U U > 10/11 U < 10/11
U(2) = U
U(0) = 0