таблица 2
B j A i | B 1 | B 2 | B 3 | B 4 | a i |
A 1 | |||||
A 2 | |||||
A 3 | |||||
A 4 | 10 | ||||
b j | 8 |
Применяя принцип максимина, находим в добавочном столбце a i наилучшее значение (в нашем случае наибольшее значения) - a = 10. В добавочной нижней строке bj, применяя принцип минимакса, также находим наилучшее значение для игрока В (в нашем случае наименьшее значение) - b = 8. Седловая точка в данной матрице отсутствует, т.к.
Следовательно, решение игры возможно только в смешанных стратегиях. Важным свойством оптимальной смешанной стратегии является то, что при любой стратегии противника (чистой или смешанной) она обеспечивает игроку средний выигрыш не меньше, чем в случае применения противником его оптимальной стратегии.
Прежде, чем определять пару оптимальных смешанных стратегий игроков (SA, SB) пoпытаемся путем анализа доминирования стратегий свести игру к игре с меньшим количеством стратегий. Стратегия А1 доминирует над стратегией А3, поэтому отбросим ее; стратегия В2 доминирует над стратегией В1 и В4 - отбросим их; стратегия А2 доминирует над стратегией А1 - отбросим ее. В таблице 2 выделены стратегии, которые отбрасываются. В результате получаем матрицу типа 2х2 (таблица 3).
|
|
Используя известные зависимости определим вероятности p и q для игроков:
Платежная матрица
таблица 3
B j A i | B 2 | B 3 |
A 2 | ||
A 4 |
Итак, технолог должен с вероятностью 0,25 применять технологию А2, с вероятностью 0,75 применять технологию А4 и совсем не применять технологии А1 и А3, т.е. чередовать технологии следующим образом: на три раза использования технологи А4 , один раз применять технологию А2 и так далее. При этом величина среднего платежа для А2 составляет: ;
для А4 составляет .
В случае, когда не удается уменьшить количество стратегий вплоть до размера 2х2, тогда необходимо для определения оптимальной пары стратегий (SA, SB) применять метод итераций.
Сходимость метода итераций довольно медленная: точность, сравнимая с численными методами, начинается при количестве итераций более 30. При уменьшении исходной матрицы трудоемкость расчетов существенно снижается.
Следующим этапом в теории игр является оценка выбора решений с помощью критериев Вальда, Сэвиджа и Гурвица.
Максиминный критерий Вальда гарантирует выигрыш в любом случае не меньший, чем нижняя цены игры α:
Критерий минимаксного риска Сэвиджа предлагает выбрать ту стратегию, при которой величина риска в наихудших условиях минимальна:
Чтобы получить риск rij нужно из Вj вычесть фактический выигрыш аij:
|
|
Критерий пессимизма- оптимизма Гурвица предлагает выбрать стратегию, которая удовлетворяет условию:
где χ - коэффициент "пессимизма".
При χ = 1 критерий Гурвица превращается в критерий Вальда, при χ = 0 - в критерий «крайнего оптимизма».
Следующим этапом работы является нахождение оптимальных стратегий с использованием пакета «Поиск решения».