Решение матричной игры в чистых стратегиях

Челябинский юридический колледж

Кафедра математических и естественнонаучных дисциплин

 

 

 

КУРСОВАЯ РАБОТА

по дисциплине «Математические методы»

Теория игр. Графический метод решения теории игр

 

Работу выполнила студентка гр. ПО-001-06 А.В. Егорова
   
Руководитель Н.Р. Хабибуллина

 

 

Челябинск

2009

 

Содержание

 

 

1. Введение 2. Основные методы решений 2.1.Основные понятия теории игр 2.2.Матричные игры 2.3.Решение матричной игры в чистых стратегиях 2.4.Принцип доминирования 2.5.Решение матричной игры 2×2 в смешанных стратегиях 3. Геометрическое решение игры 3.1.Решение игр с платежной матрицей 2× n 3.2.Решение игр с платежной матрицей m ×2 4. Практическая часть 5. Заключение 6. Список литературы     3   4 5 7 11 12   15 18  

 


 


Введение

Непрерывное и последовательное развитие социалистического общества, его производительных сил и производительных отношений, повышение эффективности общественного производства непрерывно связанно с совершенствование системы планирования и управления. Современные достижения науки и техники все шире используются в практике для получения научно обоснованных наиболее эффективных решений в сфере планирования и управления.

При решении ряда практических задач (в разных областях деятельности) приходится анализировать ситуации, где налицо две (или более) враждующие стороны, преследующие противоположные цели, причем результат каждого мероприятия одной из сторон зависит от того, какой образ действия выберет противник.

Необходимость анализировать подобные ситуации вызвала к жизни специальные математический аппарат. Теория игр по существу представляет собой не что иное, как математическую теорию конфликтных ситуаций.

Целью данной работы является рассмотрение не только теории игр в общем, но и ее графический метод решения.

Для наиболее оптимального изучения и рассмотрения поставлены следующие задачи:

1. Кратко изложить понятие о теории игр в целом;

2. Рассмотреть основные методы решений задач теории игр;

3. Детально изучить графический метод решения задач теории игр.

4. Привести примеры задач, решенных с помощью этого метода..

 


 

Основные методы решений


Основные понятия теории игр

Многие социально-экономические ситуации, в которых рассматриваются вопросы о выборе решения, обладают тем свойством, что в них сталкиваются не мнение двух сторон с различными интересами, каждая из которых для достижения своей цели имеет возможность действовать различными способами,

выбор которых при некоторых условиях может осуществляться в зависимости от

действий противоборствующей стороны. Такие ситуации называют конфликтными.

Математическая модель конфликтной ситуации называется игрой. Теория игр занимается математическими моделями принятия оптимальных решений в условиях конфликта. Любое возможное в игре действие игрока называется его стратегией. Игра называется конечной, если множество стратегий каждого игрока конечно. В противном случае (т.е. когда множество стратегий хотя бы одного игрока бесконечно), игра называется бесконечной. В дальнейшем будем рассматривать только конечные игры двух лиц.

Основной целью теории игр является выявление для каждого из игроков «оптимальных стратегий».

Оптимальной называется стратегия, которая при многократно повторяющейся игре гарантирует игроку максимально возможный средний выигрыш (или, эквивалентно, минимально возможный средний проигрыш). Выбор оптимальной стратегии базируется на принципе, предполагающем, что оба игрока разумны в одинаковой степени и поведение каждого из них направлено на противодействие противнику в достижении его цели. Таким образом, теория игр абстрагируется от ошибок, просчетов, азарта и риска, присущих игрокам,  реальных конфликтах.

Будем считать, что выигрыш одного игрока равен в точности проигрышу

второго игрока, такая игра называется игрой с нулевой суммой. Конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока, называется биматричной игрой.



Матричные игры

Матричной игрой называется конечная игра двух игроков с нулевой

суммой, в которой задается выигрыш игрока 1 в виде матрицы, строка матрицы

соответствует номеру применяемой стратегии игрока 1, столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы

находится выигрыш игрока 1, соответствующий применяемым стратегиям.

Пусть играют 2 игрока P1 и P2. Матрица   

элементы a ij – выигрыш игрока P1, если P1 – выбирает i строку, а P2 – выбирает j столбец, называется платежной матрицей игры.

Пусть игрок P1 выбирает i строку с вероятностью xi, P2 выбирает j столбец с

вероятностью yj, тогда  и  будут называться соответственно смешанными стратегиями 1 -ого и 2 -ого игроков.

Замечание: так как компонентами смешанных стратегий X и Y являются

вероятности, то и . Если среди компонентов смешанной стратегии X только одна 1, остальные 0, то стратегия называется чистой.

 - i -ая чистая стратегия. Любую смешанную стратегию можно представить в виде выпуклой комбинации чистых стратегий, т.е. 


Пример. Представить смешанную стратегию в виде выпуклой

комбинации чистых стратегий.

Решение.

Платежной функцией  (X, Y) первого игрока называется математическое

ожидание его выигрыша, т.е.

 (X, Y)=

Решением матричной игры называют пару смешанных стратегий и

число v называемое ценой игры, удовлетворяющих следующим условиям:

1)

Если P1 придерживается своей оптимальной стратегии X *, то какую бы

чистую стратегию не принимал второй игрок P2, P1 получит выигрыш не меньше чем цена игры v.

2)

Если P2 придерживается своей оптимальной стратегии Y *, то какую бы чистую стратегию не применял второй игрок P1, то P2 проиграет не более чем цена игры v.

Теорема 1. Если игрок P1 придерживается своей оптимальной стратегии X *,

а P2 придерживается своей оптимальной стратегии Y *, то .

Теорема 2. Любая матричная игра имеет решение в смешанных стратегиях.




Решение матричной игры в чистых стратегиях

Рассмотрим матричную игру с игроками P1 и P2 и платежной матрицей

1) Перед игроком P1 стоит задача выбора чистой стратегии, в результате применения которой он получит максимально возможный гарантированный

выигрыш. Если игрок P1 выбрал стратегию , то его выигрышем может быть один из выигрышей  , расположенный в i-ой строке платежной

матрицы, в зависимости от выбранной стратегии игроком P2. Предполагая поведение игрока P1 крайне осмысленным, необходимо считать, что игрок P2 сыграет наилучшим для себя образом и на выбор игроком P1 стратегии Xi выберет ту стратегию Yj, при которой выигрыш игрока P1 окажется минимальным.

Обозначим минимальный среди выигрышей через αi:

, (αi –показатель эффективности стратегии Xi).

Продолжая действовать разумно, игрок P1 должен выбрать ту стратегию,

которая максимизирует показатель эффективности, т.е. для которой число αi максимально.

Обозначим:

Число α называется нижней ценой игры в чистых стратегиях, а стратегия

Xi0, которая максимизирует показатель эффективности αi называется максиминной стратегией игрока P1.

Таким образом, если игрок P1 в игре будет следовать максиминной стратегии, то ему при любой игре противника P2 гарантирован выигрыш в чистых стратегиях, не меньший α.

2) Рассмотрим игру с точки зрения игрока P2, который стремиться минимизировать выигрыш игрока P1. Если P2 выберет стратегию , то выигрышем игрока P1 может быть один из выигрышей . Но так как игрок P2 предполагает, что игрок P1 играет наилучшим для себя образом, то выигрышем игрока P1 будет максимальное из этих чисел, обозначим βj:

 (βj –показатель неэффективности стратегии Yj).

Таким образом, для любой стратегии Yj игрока P2 наибольший его проигрыш равен βj. В интересах игрока P2 выбрать стратегию с минимальным показателем неэффективности. Наименьшее из чисел βj обозначим β:

Число β называется верхней ценой игры в чистых стратегиях, а стратегия Yj0, которая максимизирует показатель неэффективности βj называется минимаксной стратегией игрока P2.

Теорема 3. Для элементов платежной матрицы имеют место неравенства:

 и, следовательно, нижняя цена игры не больше ее верхней цены в чистых стратегиях: .

Пример. Найти решение игры, заданной платежной матрицей.

Решение:

Решим игру. Пусть  – оптимальная стратегия первого игрока,  – оптимальная стратегия второго игрока, v – цена игры.

Рассмотрим матрицу

                          min

max(-1,-2,4)=4=

 

max 6 7 4 10

min (6,7,5,10)=5=

- нижняя цена игры.

- верхняя цена игры.

  - максиминная стратегия, - минимаксная стратегия

Если то элемент   называется седловым элементом матрицы

A=

  Теорема 4. (о разрешимости матричной игры в чистых стратегиях) Если платежная матрица A имеет седловой элемент , то матричная игра имеет решение в чистых стратегиях, при этом оптимальной стратегий первого игрока является Xi0 чистая стратегия, а для второго – Yj0 чистая стратегия, а цена игры  v =  .

Пример. Найти решение игры, заданной платежной матрицей A=

Решение:

Решим игру. Пусть -оптимальная стратегия первого игрока,  - оптимальная стратегия второго игрока, v – цена игры.

Рассмотрим матрицу

           min

 

max 2 3

  v = =2 цена игры v = 2, существует седловой элемент = , тогда решение в чистых стратегиях имеет вид:

оптимальная стратегия первого игрока:

оптимальная стратегия второго игрока:

Ответ: оптимальные стратегии игроков ; , цена игры      v =2.




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: