Алгоритм Франка – Вульфа - Frank–Wolfe algorithm

В Алгоритм Франка – Вульфа является итеративный первый заказ оптимизация алгоритм за сдержанный выпуклая оптимизация. Также известен как метод условного градиента,[1] алгоритм уменьшенного градиента и алгоритм выпуклой комбинации, метод был первоначально предложен Маргарита Франк и Филип Вулф в 1956 г.[2] На каждой итерации алгоритм Франка – Вульфа рассматривает линейное приближение целевой функции и движется к минимизатору этой линейной функции (взятой в той же области).

Постановка задачи

Предполагать это компактный выпуклый набор в векторное пространство и это выпуклый, дифференцируемый функция с действительным знаком. Алгоритм Франка – Вульфа решает проблема оптимизации

Свести к минимуму
при условии .

Алгоритм

Шаг алгоритма Франка – Вульфа
Инициализация: Позволять , и разреши быть любой точкой в .
Шаг 1. Подзадача пеленгации: Находить решение
Свести к минимуму
При условии
(Интерпретация: минимизировать линейную аппроксимацию задачи, заданную Приближение Тейлора из вокруг .)
Шаг 2. Определение размера шага: Набор или найти что сводит к минимуму при условии .
Шаг 3. Обновлять: Позволять , позволять и переходите к шагу 1.

Характеристики

В то время как конкурирующие методы, такие как градиентный спуск для ограниченной оптимизации требуется шаг проекции возвращаясь к допустимому набору на каждой итерации, алгоритму Франка – Вульфа требуется только решение линейной задачи для одного и того же набора на каждой итерации, и он автоматически остается в допустимом наборе.

Сходимость алгоритма Франка – Вульфа в целом сублинейна: ошибка целевой функции к оптимуму равна после k итераций, пока градиент Липшицева непрерывная относительно некоторой нормы. Такая же скорость сходимости может быть показана, если подзадачи решены только приблизительно.[3]

Итерации алгоритма всегда можно представить в виде разреженной выпуклой комбинации крайних точек допустимого множества, что способствовало популярности алгоритма разреженной жадной оптимизации в машинное обучение и обработка сигналов проблемы,[4] а также, например, оптимизация потоки с минимальной стоимостью в транспортные сети.[5]

Если допустимый набор задается набором линейных ограничений, то подзадача, которая должна быть решена на каждой итерации, становится линейная программа.

В то время как в худшем случае скорость сходимости с не может быть улучшена в целом, более быстрая сходимость может быть получена для специальных классов задач, таких как некоторые сильно выпуклые задачи.[6]

Нижние границы значения решения и первично-дуальный анализ

С является выпуклый, для любых двух точек у нас есть:

Это также верно для (неизвестного) оптимального решения . То есть, . Наилучшая нижняя оценка по заданной точке дан кем-то

Последняя задача оптимизации решается на каждой итерации алгоритма Франка – Вульфа, поэтому решение подзадачи пеленгации -я итерация может использоваться для определения возрастающих нижних границ во время каждой итерации, задав и

Такие нижние границы неизвестного оптимального значения важны на практике, поскольку их можно использовать в качестве критерия остановки и давать эффективный сертификат качества аппроксимации на каждой итерации, поскольку всегда .

Было показано, что это соответствующее разрыв дуальности, в этом разница между и нижняя граница , убывает с той же скоростью сходимости, т.е.

Примечания

  1. ^ Левитин, Э. С .; Поляк, Б. Т. (1966). «Методы условной минимизации». Вычислительная математика и математическая физика СССР. 6 (5): 1. Дои:10.1016/0041-5553(66)90114-5.
  2. ^ Франк, М .; Вулф, П. (1956). «Алгоритм квадратичного программирования». Ежеквартально по логистике военно-морских исследований. 3 (1–2): 95–110. Дои:10.1002 / nav.3800030109.
  3. ^ Dunn, J.C .; Харшбаргер, С. (1978). «Алгоритмы условного градиента с правилами размера шага разомкнутого цикла». Журнал математического анализа и приложений. 62 (2): 432. Дои:10.1016 / 0022-247X (78) 90137-3.
  4. ^ Кларксон, К. Л. (2010). «Coresets, разреженное жадное приближение и алгоритм Франка-Вульфа». ACM-транзакции на алгоритмах. 6 (4): 1–30. CiteSeerX  10.1.1.145.9299. Дои:10.1145/1824777.1824783.
  5. ^ Фукусима, М. (1984). «Модифицированный алгоритм Франка-Вульфа для решения проблемы распределения трафика». Транспортные исследования, часть B: методологические. 18 (2): 169–177. Дои:10.1016/0191-2615(84)90029-8.
  6. ^ Бертсекас, Дмитрий (1999). Нелинейное программирование. Athena Scientific. п. 215. ISBN  978-1-886529-00-7.

Библиография

внешняя ссылка

Смотрите также