Предмет теории игр. Развернутая и нормальная (стратегическая) форма игры

Теория игр изучает ситуации принятия решений несколькими взаимодействующими индивидами. Теория игр условно делится на некооперативную и кооперативную части. В первой субъектом принятия решений служит индивид, во второй- группа. В 1й индивид характеризуется стратегиями и предпочтениями, во второй исходным материалом служат возможности коалиций. В первой индивиды принимают решения независимо, во 2й допускается соглашение.

В нормальной, или стратегической, форме игра описывается платёжной матрицей. Каждая сторона (точнее, измерение) матрицы — это игрок, строки определяют стратегии первого игрока, а столбцы — второго. На пересечении двух стратегий можно увидеть выигрыши, которые получат игроки. В примере справа, если игрок 1 выбирает первую стратегию, а второй игрок — вторую стратегию, то на пересечении мы видим (−1, −1), это значит, что в результате хода оба игрока потеряли по одному очку.

Игроки выбирали стратегии с максимальным для себя результатом, но проиграли, из-за незнания хода другого игрока.

  Игрок 2 стратегия 1 Игрок 2 стратегия 2
Игрок 1 стратегия 1 4, 3 –1, –1
Игрок 1 стратегия 2 0, 0 3, 4

В играх с полной информацией описание игры известно всем игрокам (все игроки знают чистые стратегии и функции полезности всех остальных игроков). В играх с неполной информацией некоторые игроки могут не знать функции полезности других игроков (то есть не знать некоторые конкретные значения для ячеек таблицы из нашего примера).

Представление игры в нормальной форме может быть использовано для нахождения доминируемых стратегий.

Игра в развернутой форме с множеством игроков представляется с использованием ориентированного дерева (дерева игры) следующим образом.

Стрелки идут в направлении от корня. Вершины дерева изображают позиции игры, места, где какие-то игроки должны выбрать ход- одну из стрелок, выходящую из этой вершины. Поэтому у каждой(нетерминальной) вершины стоит метка того игрока, который делает ход. В терминальных вершинах(где игра заканчивается) стоит вектор выигрышей игроков.

Когда игрок должен выбрать свой ход, он может не знать, в какой из позиций игры он находится, потому что не знает, какой ход был сделан на предыдущем ходе. И все такие позиции объединяются в одно информационное множество

Игра предполагает следующий порядок разыгрывания:

1. Игра начинается из начальной позиции.

2. В любой нетерминальной позиции игрок, имеющий в ней право хода, выбирает ход, в результате чего игра попадает в следующую позицию, в которую входит ребро, соответствующее ходу . Если эта позиция является нетерминальной, то повторяется п. 2.

3. Если игра попадает в терминальную позицию , то все игроки получают выигрыши, и игра завершается.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: