Победа - остаться, проиграть - переключиться - Win–stay, lose–switch - Wikipedia
В психология, теория игры, статистика, и машинное обучение, выиграть - остаться, проиграть - переключиться (также выиграть – остаться, проиграть – сдвиг) это эвристический стратегия обучения, используемая для моделирования обучения в ситуациях принятия решений. Впервые он был изобретен как усовершенствование рандомизации в бандитские проблемы.[1] Позже он был применен к Дилемма заключенного чтобы смоделировать эволюция из альтруизм.[2]
Правило обучения основывает свое решение только на результате предыдущей игры. Результаты делятся на успехи (победы) и неудачи (проигрыши). Если игра в предыдущем раунде закончилась успехом, то агент применяет ту же стратегию в следующем раунде. В качестве альтернативы, если игра закончилась неудачей, агент переключается на другое действие.
Масштабное эмпирическое исследование игроков в игре камень ножницы Бумага показывает, что реальным игрокам в игре применяется вариант этой стратегии, а не равновесие по Нэшу стратегия выбора наугад между тремя вариантами.[3][4]
Рекомендации
- ^ Роббинс, Х. (1952). «Некоторые аспекты последовательного планирования экспериментов». Бюллетень Американского математического общества. 58 (5): 527–535. Дои:10.1090 / s0002-9904-1952-09620-8.
- ^ Новак, М .; Зигмунд, К. (1 июля 1993 г.). «Стратегия взаимовыгодного пребывания, проигрыша-сдвига, которая превосходит« око за око »в игре« Дилемма заключенного ». Природа. 364 (6432): 56–58. Дои:10.1038 / 364056a0. PMID 8316296.
- ^ Морган, Джеймс (2 мая 2014 г.). «Как выиграть в камень-ножницы-бумага». Новости BBC.
- ^ Ван, Чжицзянь; Сюй, Бен; Чжоу, Хай-Цзюнь (25 июля 2014 г.). «Социальный цикл и условные реакции в игре« Камень-ножницы-бумага »». Научные отчеты. 4: 5830. Дои:10.1038 / srep05830. ЧВК 5376050. PMID 25060115.
Смотрите также
Этот теория игры статья - это заглушка. Вы можете помочь Википедии расширяя это. |