Парадокс сетевого магазина - Chainstore paradox

В парадокс сетевого магазина - очевидный парадокс теории игр, связанный с игрой в сетевых магазинах, где оптимальной представляется «стратегия сдерживания», а не обратная индукция стратегия стандарта теория игры рассуждения.

Игра в сетевом магазине

А монополист (Игрок A) имеет отделения в 20 городах. Ему предстоит столкнуться с 20 потенциальными конкурентами, по одному в каждом городе, которые смогут выбрать в или же из. Они делают это последовательно и по одному. Если потенциальный конкурент выберет из, он получает выплату 1, в то время как A получает выплату 5. Если он выбирает в, он получит выплату либо 2, либо 0, в зависимости от реакции Игрока А на свое действие. Игрок А в ответ на выбор в, необходимо выбрать одну из двух ценовых стратегий, кооператив или же агрессивный. Если он выберет кооператив, и игрок A, и участник получают выплату 2, и если A выбирает агрессивный, каждый игрок получает выплату 0.

Эти результаты приводят к двум теориям игры: индукции (теоретически оптимальная версия игры) и теории сдерживания (теория со слабым доминированием):

Теория индукции

Считайте, что решение, которое должен принять 20-й и последний участник, о том, выбирать ли в или же из. Он знает, что если он выберет в, Игрок А получает более высокий выигрыш, выбирая сотрудничество, чем агрессивное поведение, и, поскольку в последний период игры больше нет будущих конкурентов, которых игроку А нужно было бы запугать с рынка. Зная это, 20-й конкурент выходит на рынок, и Игрок А будет сотрудничать (получая выплату 2 вместо 0).

Исход финального периода, так сказать, высечен в камне. Теперь рассмотрим период 19 и решение потенциального конкурента. Он знает, что А будет сотрудничать в следующем периоде, независимо от того, что произойдет в периоде 19. Таким образом, если игрок 19 входит, агрессивная стратегия не сможет удержать игрока 20 от входа. Игрок 19 знает это и выбирает в. Игрок А выбирает сотрудничать.

Конечно, этот процесс обратная индукция держится до первого участника. Каждый потенциальный конкурент выбирает в, и игрок А всегда сотрудничает. A получает выплату 40 (2 × 20), а каждый участник получает 2.

Теория сдерживания

Эта теория утверждает, что игрок А сможет получить выигрыш выше 40. Предположим, игрок А находит аргумент индукции убедительным. Он решит, сколько периодов в конце будет играть такую стратегию, скажем 3. В периоды 1–17 он решит всегда быть агрессивным против выбора IN. Если это знают все потенциальные конкуренты, маловероятно, что потенциальные конкуренты 1–17 будут беспокоить сеть магазинов, тем самым рискуя получить безопасную выплату в размере 1 («А» не ответит, если они выберут »из"). Если некоторые из них протестируют сеть магазинов на раннем этапе игры и увидят, что их приветствуют агрессивной стратегией, остальные участники, скорее всего, не будут проводить дальнейшие проверки. Если все 17 будут остановлены, игрок A получит 91 (17 × 5 + 2 × 3). Даже если до 10 участников войдут и проверит волю игрока A, игрок A все равно получит выигрыш 41 (10 × 0 + 7 × 5 + 3 × 2), что лучше чем индукционная (теоретически правильная игра) выигрыш.

Парадокс сети магазинов

Если игрок А следует матрице выигрышей теории игр для достижения оптимального выигрыша, он получит меньший выигрыш, чем при стратегии «сдерживания». Это создает очевидный парадокс теории игр: теория игр утверждает, что стратегия индукции должна быть оптимальной, но, похоже, оптимальной является «стратегия сдерживания».

«Стратегия сдерживания» - это не Подигра идеальное равновесие: Он полагается на неправдоподобная угроза ответа на в с агрессивный. Рациональный игрок не будет выполнять не заслуживающую доверия угрозу, но парадокс в том, что, тем не менее, кажется, что выполнение угрозы выгодно игроку А.

Ответ Селтен

Райнхард Зельтен ответ на это очевидное парадокс состоит в том, чтобы утверждать, что идея «сдерживания», в то время как иррациональный по стандартам Теория игры, на самом деле является приемлемой идеей, исходя из рациональности, которую фактически используют люди. Селтен утверждает, что люди могут принимать решения на трех уровнях: рутина, воображение и рассуждение.

Полная информация?

Теория игр основана на идее, что каждая матрица моделируется в предположении полная информация: что «каждый игрок знает выплаты и стратегии, доступные другим игрокам», где слово «выигрыш» описывает поведение - то, что игрок пытается максимизировать. Если в первом городе входит конкурент, а монополист агрессивен, второй конкурент заметил, что монополист, с точки зрения общеизвестных знаний о выплатах и стратегиях, не максимизирует предполагаемые выплаты; ожидать, что монополист сделает это в этом городе, кажется сомнительным.

Если конкуренты приписывают даже очень небольшую вероятность возможности того, что монополист злобный, и придают внутреннюю ценность своей агрессивности (или внешнему виду), и монополист знает это, то даже если у монополиста есть выплаты, как описано выше, в ответ на вступление Ранний город с агрессией будет оптимальным, если он увеличит вероятность того, что более поздние конкуренты сочтут злобным монополистом.

Уровни принятия решений Зельтеном

Обычный уровень

Люди используют свой прошлый опыт результатов решений, чтобы направлять свою реакцию на выбор в настоящем. «Основные критерии схожести между ситуациями принятия решений грубы и иногда неадекватны». (Зельтен)

Уровень воображения

Человек пытается представить себе, как выбор различных альтернатив может повлиять на вероятный ход будущих событий. На этом уровне используется рутинный уровень процессуальных решений. Этот метод похож на компьютерное моделирование.

Уровень рассуждений

Человек прилагает сознательные усилия для рационального анализа ситуации, используя как прошлый опыт, так и логическое мышление. Этот способ решения использует упрощенные модели, предположения которых являются продуктом воображения, и является единственным методом рассуждений, разрешенным и ожидаемым теорией игр.

Процесс принятия решения

Предрешенность

Каждый выбирает, какой метод (рутина, воображение или рассуждение) использовать для решения проблемы, и само это решение принимается на рутинном уровне.

Окончательное решение

В зависимости от того, какой уровень выбран, человек начинает процедуру принятия решения. Затем человек принимает (возможно, другое) решение для каждого доступного уровня (если бы мы выбрали воображение, мы пришли бы к обычному решению, а возможно и к решению воображения). Селтен утверждает, что люди всегда могут принять рутинное решение, но, возможно, не на более высоком уровне. Как только люди примут решение на всех уровнях, они могут решить, какой ответ использовать ... Окончательное решение. Окончательное решение принимается на рутинном уровне и определяет фактическое поведение.

Смотрите также

дальнейшее чтение

Связь парадокса сетевых магазинов с конституционной политикой в Канаде