Алгоритм Ланжевена с поправкой на мегаполис - Metropolis-adjusted Langevin algorithm
В вычислительная статистика, то Алгоритм Ланжевена с поправкой на мегаполис (MALA) или же Ланжевен Монте-Карло (LMC) это Цепь Маркова Монте-Карло (MCMC) метод получения случайные выборки - последовательности случайных наблюдений - из распределение вероятностей для которых затруднен прямой отбор проб. Как следует из названия, MALA использует комбинацию двух механизмов для генерации состояний случайная прогулка который имеет целевое распределение вероятностей как инвариантная мера:
- новые состояния предлагаются с использованием (чрезмерно демпфированный ) Динамика Ланжевена, которые используют оценки градиент цели функция плотности вероятности;
- эти предложения принимаются или отклоняются с использованием Алгоритм Метрополиса – Гастингса, который использует оценки целевой плотности вероятности (но не ее градиента).
Неформально динамика Ланжевена приводит к случайному блужданию в направлении областей с высокой вероятностью в виде градиентного потока, в то время как механизм принятия / отклонения Метрополиса – Гастингса улучшает свойства смешивания и сходимости этого случайного блуждания. MALA был первоначально предложен Юлиан Бесаг в 1994 г.[1] и его свойства были подробно исследованы Гарет Робертс вместе с Ричард Твиди[2] и Джефф Розенталь.[3] С тех пор было введено множество вариаций и уточнений, например то многообразие вариант Джиролами и Колдерхед (2011).[4] Метод эквивалентен использованию Гамильтониан Монте-Карло алгоритм только с одним дискретным шагом по времени.[4]
Более подробная информация
Позволять обозначим функцию плотности вероятности на , из которых желательно нарисовать ансамбль независимые и одинаково распределенные образцы. Рассмотрим передемпфированный ланжевеновский Ито диффузия
управляется производной по времени от стандарта Броуновское движение . (Обратите внимание, что еще одна часто используемая нормализация для этого распространения -
что порождает ту же динамику.) В пределе , это распределение вероятностей из приближается к стационарному распределению, которое также инвариантно относительно диффузии, которое мы обозначим . Оказывается, на самом деле .
Примерные траектории диффузии Ланжевена могут быть получены многими методами с дискретным временем. Один из самых простых - Метод Эйлера – Маруямы с фиксированным шагом по времени . Мы установили а затем рекурсивно определить приближение к истинному решению к
где каждый является независимым розыгрышем многомерное нормальное распределение на с иметь в виду 0 и ковариационная матрица равно единичная матрица. Обратите внимание, что нормально распределяется со средним и ковариация равна раз единичная матрица.
В отличие от метода Эйлера – Маруямы для моделирования диффузии Ланжевена, который всегда обновляет согласно правилу обновления
MALA включает дополнительный этап. Мы рассматриваем приведенное выше правило обновления как определение предложение для нового государства,
Это предложение принимается или отклоняется по алгоритму Метрополиса-Гастингса: установить
куда
- плотность вероятности перехода из к (обратите внимание, что в целом ). Позволять быть извлеченным из непрерывное равномерное распределение на интервале . Если , то предложение принимается, и мы устанавливаем ; в противном случае предложение отклоняется, и мы устанавливаем .
Комбинированная динамика диффузии Ланжевена и алгоритма Метрополиса – Гастингса удовлетворяет подробный баланс условия, необходимые для существования единственного, инвариантного, стационарного распределения . По сравнению с наивным Метрополис-Гастингс, MALA имеет то преимущество, что обычно предлагает переезд в регионы более высокого уровня. вероятность, которые затем будут приняты с большей вероятностью. С другой стороны, когда сильно анизотропный (т.е. в одних направлениях он меняется намного быстрее, чем в других), необходимо принять чтобы правильно уловить динамику Ланжевена; использование положительно определенного предварительная подготовка матрица может помочь решить эту проблему, создавая предложения в соответствии с
так что имеет в виду и ковариация .
В практических приложениях оптимальная скорость приема для этого алгоритма ; если обнаружится, что он существенно отличается, следует соответствующим образом изменить.[3]
Рекомендации
- ^ Ж. Бесаг (1994). «Комментарии к« Представлениям знаний в сложных системах »У. Гренандера и М.И. Миллера». Журнал Королевского статистического общества, серия B. 56: 591–592.
- ^ Дж. О. Робертс и Р. Л. Твиди (1996). «Экспоненциальная сходимость распределений Ланжевена и их дискретные приближения». Бернулли. 2 (4): 341–363. Дои:10.2307/3318418. JSTOR 3318418.
- ^ а б Дж. О. Робертс и Дж. С. Розенталь (1998). «Оптимальное масштабирование дискретных приближений к диффузии Ланжевена». Журнал Королевского статистического общества, серия B. 60 (1): 255–268. Дои:10.1111/1467-9868.00123.
- ^ а б М. Джиролами и Б. Колдерхед (2011). "Римановы многообразия Ланжевена и гамильтоновы методы Монте-Карло". Журнал Королевского статистического общества, серия B. 73 (2): 123–214. CiteSeerX 10.1.1.190.580. Дои:10.1111 / j.1467-9868.2010.00765.x.