Платежная матрица игры

таблица 2

B j A i B 1 B 2 B 3 B 4 a i
A 1          
A 2          
A 3          
A 4         10
b j     8    

Применяя принцип максимина, находим в добавочном столбце a i наилучшее значение (в нашем случае наибольшее значения) - a = 10. В добавочной нижней строке bj, применяя принцип минимакса, также находим наилучшее значение для игрока В (в нашем случае наименьшее значение) - b = 8. Седловая точка в данной матрице отсутствует, т.к.

Следовательно, решение игры возможно только в смешанных стратегиях. Важным свойством оптимальной смешанной стратегии является то, что при любой стратегии противника (чистой или смешанной) она обеспечивает игроку средний выигрыш не меньше, чем в случае применения противником его оптимальной стратегии.

Прежде, чем определять пару оптимальных смешанных стратегий игроков (SA, SB) пoпытаемся путем анализа доминирования стратегий свести игру к игре с меньшим количеством стратегий. Стратегия А1 доминирует над стратегией А3, поэтому отбросим ее; стратегия В2 доминирует над стратегией В1 и В4 - отбросим их; стратегия А2 доминирует над стратегией А1 - отбросим ее. В таблице 2 выделены стратегии, которые отбрасываются. В результате получаем матрицу типа 2х2 (таблица 3).

Используя известные зависимости определим вероятности p и q для игроков:

Платежная матрица

таблица 3

B j A i   B 2   B 3
A 2    
A 4    

Итак, технолог должен с вероятностью 0,25 применять технологию А2, с вероятностью 0,75 применять технологию А4 и совсем не применять технологии А1 и А3, т.е. чередовать технологии следующим образом: на три раза использования технологи А4 , один раз применять технологию А2 и так далее. При этом величина среднего платежа для А2 составляет: ;

для А4 составляет .

В случае, когда не удается уменьшить количество стратегий вплоть до размера 2х2, тогда необходимо для определения оптимальной пары стратегий (SA, SB) применять метод итераций.

Сходимость метода итераций довольно медленная: точность, сравнимая с численными методами, начинается при количестве итераций более 30. При уменьшении исходной матрицы трудоемкость расчетов существенно снижается.

Следующим этапом в теории игр является оценка выбора решений с помощью критериев Вальда, Сэвиджа и Гурвица.

Максиминный критерий Вальда гарантирует выигрыш в любом случае не меньший, чем нижняя цены игры α:

Критерий минимаксного риска Сэвиджа предлагает выбрать ту стратегию, при которой величина риска в наихудших условиях минимальна:

Чтобы получить риск rij нужно из Вj вычесть фактический выигрыш аij:

Критерий пессимизма- оптимизма Гурвица предлагает выбрать стратегию, которая удовлетворяет условию:

где χ - коэффициент "пессимизма".

При χ = 1 критерий Гурвица превращается в критерий Вальда, при χ = 0 - в критерий «крайнего оптимизма».

Следующим этапом работы является нахождение оптимальных стратегий с использованием пакета «Поиск решения».


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: