Метрополис с несколькими попытками - Multiple-try Metropolis

Метрополис с несколькими попытками (MTM) это метод отбора проб это модифицированная форма Метрополис – Гастингс Метод, впервые представленный Лю, Ляном и Вонгом в 2000 г., призван помочь траектории отбора проб быстрее сходиться за счет увеличения как размера шага, так и скорости приема.

Фон

Проблемы с Метрополис-Гастингс

В Цепь Маркова Монте-Карло, то Алгоритм Метрополиса – Гастингса (MH) можно использовать для выборки из распределение вероятностей из которого сложно брать образцы напрямую. Однако алгоритм MH требует, чтобы пользователь предоставил распределение предложений, которое может быть относительно произвольным. Во многих случаях используется гауссово распределение с центром в текущей точке в вероятностном пространстве вида . Это распределение предложений удобно для выборки и может быть лучшим выбором, если кто-то мало знает о целевом распределении, . При желании можно использовать более общий многомерное нормальное распределение, , куда это ковариационная матрица, которая, по мнению пользователя, похожа на целевое распределение.

Хотя этот метод должен сходиться к стационарному распределению в пределе бесконечного размера выборки, на практике прогресс может быть чрезвычайно медленным. Если слишком велико, почти все шаги алгоритма MH будут отклонены. С другой стороны, если слишком мала, будут приняты почти все шаги, и цепь Маркова будет похожа на случайное блуждание по вероятностному пространству. В более простом случае , Мы видим, что шагов занимает всего лишь расстояние . В этом случае цепь Маркова не сможет полностью исследовать вероятностное пространство за разумный промежуток времени. Таким образом, алгоритм MH требует разумной настройки параметра масштаба ( или же ).

Проблемы с большой размерностью

Даже если масштабный параметр правильно настроен, по мере увеличения размерности проблемы прогресс может оставаться чрезвычайно медленным. Чтобы увидеть это, снова рассмотрим . В одном измерении это соответствует гауссовскому распределению со средним значением 0 и дисперсией 1. Для одного измерения это распределение имеет средний шаг, равный нулю, однако средний квадрат размера шага определяется выражением

По мере увеличения количества измерений ожидаемый размер шага становится все больше и больше. В размеры, вероятность перемещения на радиальное расстояние относится к Распределение Ци, и задается

Это распределение достигает максимума в который для больших . Это означает, что размер шага будет увеличиваться примерно как квадратный корень из числа измерений. Для алгоритма MH большие шаги почти всегда будут попадать в области с низкой вероятностью и, следовательно, будут отклонены.

Если мы теперь добавим параметр масштаба обратно, мы обнаруживаем, что для сохранения приемлемой скорости принятия мы должны сделать преобразование . В этой ситуации степень принятия теперь может быть разумной, но исследование вероятностного пространства становится все более медленным. Чтобы увидеть это, рассмотрите срез по любому одному измерению проблемы. Сделав масштабное преобразование, описанное выше, ожидаемый размер шага будет таким, что любое одно измерение не но вместо этого . Поскольку этот размер шага намного меньше, чем «истинный» масштаб распределения вероятностей (при условии, что как-то известно априори, что является наилучшим возможным случаем), алгоритм выполняет случайное блуждание по каждому параметру.

Алгоритм Метрополиса с несколькими попытками

Предполагать произвольный функция предложения. Мы требуем, чтобы только если . Кроме того, - функция правдоподобия.

Определять куда является неотрицательной симметричной функцией в и который может быть выбран пользователем.

Теперь предположим, что текущее состояние . Алгоритм MTM выглядит следующим образом:

1) Рисовать k предложения независимого судебного разбирательства из . Вычислить веса для каждого из них.

2) Выберите от с вероятностью, пропорциональной весам.

3) Теперь создайте набор ссылок, нарисовав из раздачи . Набор (текущая точка).

4) Принять с вероятностью

Можно показать, что этот метод удовлетворяет подробный баланс свойство и, следовательно, производит обратимую цепь Маркова с как стационарное распределение.

Если симметрична (как и в случае многомерное нормальное распределение ), то можно выбрать который дает .

Недостатки

Метрополису необходимо несколько попыток вычислить энергию другие состояния на каждом шаге. Если медленная часть процесса вычисляет энергию, то этот метод может быть медленнее. Если медленная часть процесса находит соседей данной точки или генерирует случайные числа, тогда снова этот метод может Можно утверждать, что этот метод появляется быстрее только потому, что он помещает гораздо больше вычислений в «один шаг», чем это делает Метрополис-Гастингс.

Смотрите также

Рекомендации

  • Лю Дж. С., Лян Ф. и Вонг В. Х. (2000). Метод множественных попыток и локальная оптимизация в выборке Metropolis, Журнал Американской статистической ассоциации, 95(449): 121–134 JSTOR