Expectiminimax - Expectiminimax

Expectiminimax
Учебный классАлгоритм поиска
Худший случай спектакль, куда количество различных бросков костей
Лучший случай спектакль, если все броски костей известны заранее

В expectiminimax алгоритм является разновидностью минимакс алгоритм, для использования в искусственный интеллект системы, которые играют на двоих с нулевой суммой игры, такие как нарды, в котором результат зависит от комбинации навыков игрока и случайные элементы например, броски костей. В дополнение к узлам «min» и «max» традиционного минимаксного дерева этот вариант имеет «случайность» («двигаться по природе ") узлы, которые принимают ожидаемое значение случайного события.[1] В теория игры терминами, дерево expectiminimax - это дерево игры обширная игра из идеально, но неполная информация.

В традиционном минимакс , уровни дерева чередуются от max до min до тех пор, пока не будет достигнута граница глубины дерева. В дереве expectiminimax «случайные» узлы чередуются с максимальными и минимальными узлами. Вместо того, чтобы брать максимум или минимум полезные ценности для своих дочерних узлов случайные узлы принимают средневзвешенное значение, причем вес - это вероятность достижения дочернего элемента.[1]

Чередование зависит от игры. Каждый «ход» игры оценивается как «максимальный» узел (представляющий ход ИИ-игрока), «минимальный» узел (представляющий ход потенциально оптимального оппонента) или узел «шанс» (представляющий случайный эффект или игрок).[1]

Например, рассмотрим игру, в которой каждый раунд состоит из одного броска кубика, а затем решения принимаются сначала ИИ-игроком, а затем другим умным противником. Порядок узлов в этой игре будет чередоваться: «шанс», «максимум» и затем «минимум».[1]

Псевдокод

Алгоритм expectiminimax является вариантом минимакс алгоритм и был впервые предложен Дональд Мичи в 1966 г.[2]Его псевдокод приведен ниже.

функция expectiminimax (узел, глубина) если узел является конечным узлом или же глубина = 0 возвращаться эвристическое значение узла если противник должен играть на узле // Возвращаемое значение дочернего узла с минимальным значением позволять α: = + ∞ для каждого дочерний узел α: = min (α, expectiminimax (дочерний элемент, глубина-1)) иначе если мы должны играть на узле // Возвращаемое значение дочернего узла с максимальным значением позволять α: = -∞ для каждого дочерний элемент узла α: = max (α, expectiminimax (дочерний элемент, глубина-1)) иначе если случайное событие в узле // Возвращает средневзвешенное значение значений всех дочерних узлов позволять α: = 0 для каждого дочерний элемент узла α: = α + (Вероятность [ребенок] × expectiminimax (дочерний элемент, глубина-1)) возвращаться α

Обратите внимание, что для случайных узлов должна быть известная вероятность достижения каждого дочернего элемента. (Для большинства азартных игр дочерние узлы будут иметь одинаковый вес, что означает, что возвращаемое значение может быть просто средним всех дочерних значений.)

Смотрите также

Рекомендации

  1. ^ а б c d Стюарт Дж. Рассел; Питер Норвиг (2009). Искусственный интеллект: современный подход. Прентис Холл. С. 177–178. ISBN  978-0-13-604259-4.
  2. ^ Д. Мичи (1966). Игровые и обучающие игры автоматы. В Л. Фокс (ред.), Достижения в программировании и нечисловых вычислениях, стр. 183-200.