Стратегия (теория игр) - Strategy (game theory)

В теория игры, а игрок с стратегия любой из вариантов, которые он или она выбирает в обстановке, где результат зависит не только по своим действиям но на действия других.[1] Стратегия игрока будет определять действие, которое игрок будет предпринимать на любом этапе игры.

В стратегия понятие иногда (ошибочно) путают с концепцией двигаться. А двигаться - действие, предпринимаемое игроком в какой-то момент во время игры (например, в шахматах, перемещение слона белых с a2 на b3). А стратегия с другой стороны это полный алгоритм для прохождения игры, говоря игроку, что делать в каждой возможной ситуации на протяжении игры.

А профиль стратегии (иногда называемый комбинация стратегий) - это набор стратегий для всех игроков, который полностью определяет все действия в игре. Профиль стратегии должен включать одну и только одну стратегию для каждого игрока.

Набор стратегий

Игрока набор стратегий определяет, какие стратегии доступны им для игры.

У игрока есть конечный стратегия устанавливается, если им доступно несколько дискретных стратегий. Например, игра в камень ножницы Бумага состоит из одного хода каждого игрока - и каждый игрок делает ход без ведома другого, а не в качестве реакции - поэтому каждый игрок имеет конечный набор стратегий {камень, ножницы, бумага}.

В противном случае набор стратегий бесконечен. Например, игра для резки торта имеет ограниченный континуум стратегий в наборе стратегий {Отрезать от нуля до 100 процентов пирога}.

В динамичная игра, набор стратегий состоит из возможных правил, которые игрок может дать робот или же агент о том, как играть в игру. Например, в ультиматумная игра, стратегия, установленная для второго игрока, будет состоять из всевозможных правил, для которых предложения принимать, а какие отклонять.

В Байесовская игра, набор стратегий аналогичен таковому в динамической игре. Он состоит из правил, которые следует предпринять в отношении любой возможной личной информации.

Выбор набора стратегий

В прикладной теории игр определение наборов стратегий является важной частью искусства сделать игру одновременно решаемой и содержательной. Теоретик игр может использовать знание общей проблемы, чтобы ограничить пространство стратегий и облегчить решение.

Например, строго говоря, в игре Ultimatum у игрока могут быть такие стратегии, как: Отклонять предложения на сумму (1, 3, 5, ..., 19 долларов), принимать предложения на сумму (0, 2, 4, ..., 20 долларов). Включение всех таких стратегий приводит к очень большому пространству стратегий и довольно сложной проблеме. Теоретик игр может вместо этого полагать, что они могут ограничить набор стратегии следующим: {Отклонить любое предложение ≤ Икс, примите любое предложение> Икс; за Икс in ($ 0, $ 1, $ 2, ..., $ 20)}.

Чистые и смешанные стратегии

А чистая стратегия дает полное определение того, как игрок будет играть в игру. В частности, он определяет ход, который сделает игрок в любой ситуации, с которой он может столкнуться. Игрока набор стратегий - это набор чистых стратегий, доступных этому игроку.

А смешанная стратегия это задание вероятность каждой чистой стратегии. Это позволяет игроку случайным образом выбирать чистую стратегию. (См. Иллюстрацию в следующем разделе.) Поскольку вероятности непрерывны, игроку доступно бесконечно много смешанных стратегий.

Конечно, можно рассматривать чистую стратегию как вырожденный случай смешанной стратегии, в которой эта конкретная чистая стратегия выбирается с вероятностью 1 и любая другая стратегия с вероятностью 0.

А полностью смешанная стратегия представляет собой смешанную стратегию, в которой игрок приписывает каждой чистой стратегии строго положительную вероятность. (Совершенно смешанные стратегии важны для равновесное уточнение Такие как дрожащая рука идеальное равновесие.)

Смешанная стратегия

Иллюстрация

АB
А1, 10, 0
B0, 01, 1
Чистый координационная игра

Рассмотрим матрица выплат изображенный справа (известный как координационная игра ). Здесь один игрок выбирает строку, а другой - столбец. Игрок строки получает первую выплату, игрок столбца - второй. Если строка выбирает воспроизведение А с вероятностью 1 (т.е. играть А конечно), то говорят, что он играет чистую стратегию. Если столбец выбирает подбросить монету и играть А если монета выпадает орлом и B если монета выпадает решкой, то говорят, что он играет смешанную стратегию, а не чистую стратегию.

Значимость

В своей знаменитой статье Джон Форбс Нэш доказал, что существует равновесие для каждой конечной игры. Равновесия по Нэшу можно разделить на два типа. Чистая стратегия равновесия по Нэшу являются равновесиями Нэша, в которых все игроки играют чистыми стратегиями. Смешанная стратегия равновесия по Нэшу являются равновесиями, в которых хотя бы один игрок играет смешанную стратегию. Хотя Нэш доказал, что каждая конечная игра имеет равновесие по Нэшу, не все имеют равновесие по Нэшу чистой стратегии. Для примера игры, в которой нет равновесия по Нэшу в чистых стратегиях, см. Соответствующие пенни. Однако во многих играх есть чисто стратегические равновесия по Нэшу (например, Координационная игра, то Дилемма заключенного, то Охота на оленя ). Кроме того, игры могут иметь как чистую стратегию, так и равновесие смешанной стратегии. Простым примером является чистая координационная игра, где в дополнение к чистым стратегиям (A, A) и (B, B) существует смешанное равновесие, в котором оба игрока играют любую стратегию с вероятностью 1/2.

Спорный смысл

В 80-е годы концепция смешанных стратегий подверглась резкой критике как «интуитивно проблематичная».[2] Рандомизация, занимающая центральное место в смешанных стратегиях, лишена поведенческой поддержки. Люди редко делают свой выбор после лотереи. Эта поведенческая проблема усугубляется когнитивной трудностью, заключающейся в том, что люди не могут генерировать случайные результаты без помощи случайный или псевдослучайный генератор.[2]

В 1991 г.[3] теоретик игр Ариэль Рубинштейн описал альтернативные способы понимания концепции. Первый, благодаря Харшаньи (1973),[4] называется очищение, и предполагает, что интерпретация смешанных стратегий просто отражает наше незнание информации об игроках и процессе принятия решений. Очевидно, случайный выбор тогда рассматривается как следствие неуказанных, нерелевантных экзогенных факторов. Однако результаты, зависящие от неопределенных факторов, не приносят удовлетворения.[3]

Вторая интерпретация предполагает, что игроки выступают за большую группу агентов. Каждый из агентов выбирает чистую стратегию, и выигрыш зависит от доли агентов, выбирающих каждую стратегию. Таким образом, смешанная стратегия представляет собой распределение чистых стратегий, выбранных каждой популяцией. Однако это не дает никаких оснований для случая, когда игроки являются отдельными агентами.

Позже, Ауманн и Бранденбургер (1995),[5] переинтерпретировал равновесие по Нэшу как равновесие в верования, а не действия. Например, в камень ножницы Бумага равновесие убеждений заставит каждого игрока веря другой с равной вероятностью использовал каждую стратегию. Однако такая интерпретация ослабляет предсказательную силу равновесия по Нэшу, поскольку в таком равновесии каждый игрок может фактически играть в чистую стратегию Рока.

С тех пор отношение теоретиков игр к результатам, основанным на смешанных стратегиях, было двойственным. Смешанные стратегии до сих пор широко используются из-за их способности обеспечивать равновесие по Нэшу в играх, где нет равновесия в чистых стратегиях, но модель не определяет, почему и как игроки рандомизируют свои решения.

Стратегия поведения

В то время как смешанная стратегия назначает распределение вероятностей чистым стратегиям, стратегия поведения назначает каждому информационному набору распределение вероятностей по набору возможных действий. Хотя эти две концепции очень тесно связаны в контексте игр с нормальной формой, они имеют очень разные значения для игр с расширенной формой. Грубо говоря, смешанная стратегия случайным образом выбирает детерминированный путь через дерево игры, в то время как стратегия поведения может рассматриваться как стохастический путь.

Взаимосвязь между смешанными и поведенческими стратегиями является предметом исследования. Теорема Куна. Результат устанавливает, что в любой конечной игре расширенной формы с точным воспроизведением для любого игрока и любой смешанной стратегии существует стратегия поведения, которая против всех профилей стратегий (других игроков) индуцирует такое же распределение по конечным узлам, что и смешанная стратегия делает. Обратное также верно.

Знаменитый пример того, почему для эквивалентности требуется полное воспоминание, был дан Пиччоне и Рубинштейном (1997).[требуется полная цитата ] с их Рассеянный водитель игра.

Смотрите также

Рекомендации

  1. ^ Бен Полак Теория игр: стенограмма лекции 1 ECON 159, 5 сентября 2007 г., Открытые курсы Йельского университета.
  2. ^ а б Ауманн, Р. (1985). «Чего пытается достичь теория игр?» (PDF). In Arrow, K .; Хонкапохья, С. (ред.). Границы экономики. Оксфорд: Бэзил Блэквелл. С. 909–924.
  3. ^ а б Рубинштейн, А. (1991). «Комментарии к интерпретации теории игр». Econometrica. 59 (4): 909–924. Дои:10.2307/2938166. JSTOR  2938166.
  4. ^ Харшани, Джон (1973). «Игры со случайно нарушенными выплатами: новое объяснение для точек равновесия смешанной стратегии». Int. J. Теория игр. 2: 1–23. Дои:10.1007 / BF01737554.
  5. ^ Ауманн, Роберт; Бранденбургер, Адам (1995). «Эпистемические условия равновесия по Нэшу». Econometrica. 63 (5): 1161–1180. CiteSeerX  10.1.1.122.5816. Дои:10.2307/2171725. JSTOR  2171725.