Качмарц метод - Kaczmarz method

В Качмарц метод или же Алгоритм Качмарца является итерационный алгоритм для решения системы линейных уравнений . Впервые его открыл польский математик. Стефан Качмарц,[1] и был заново открыт в области реконструкции изображений по проекциям Ричард Гордон, Роберт Бендер и Габор Герман в 1970 году, где он называется Алгебраическая реконструкция (ИЗОБРАЗИТЕЛЬНОЕ ИСКУССТВО).[2] ART включает ограничение положительности, что делает его нелинейным.[3]

Метод Качмарца применим к любой линейной системе уравнений, но его вычислительное преимущество по сравнению с другими методами зависит от того, какая система редкий. Было продемонстрировано, что в некоторых приложениях биомедицинской визуализации он превосходит другие методы, такие как отфильтрованная обратная проекция метод.[4]

Он имеет множество приложений, начиная от компьютерная томография (CT) в обработка сигналов. Его можно получить также, применяя к гиперплоскостям, описываемым линейной системой, метод последовательных проекции на выпуклые множества (POCS).[5][6]

Алгоритм 1: алгоритм Качмарца

Позволять быть система линейных уравнений, позволять быть количеством строк А, быть й ряд сложный -значен матрица , и разреши - произвольное комплексное начальное приближение к решению задачи . За вычислить:

 

 

 

 

(1)

куда и обозначает комплексное сопряжение из .

Если система согласована, сходится к минимуму-норма решение при условии, что итерации начинаются с нулевого вектора.

Более общий алгоритм можно определить с помощью расслабление параметр

Существуют версии метода, которые сходятся к регуляризованному взвешенному решению наименьших квадратов при применении к системе несовместимых уравнений и, по крайней мере, в отношении начального поведения, с меньшими затратами, чем другие итерационные методы, такие как метод сопряженных градиентов.[7]

Алгоритм 2: рандомизированный алгоритм Качмарца

В 2009 году рандомизированная версия метода Качмарца для сверхопределенный линейные системы были введены Томасом Штромером и Романом Вершининым.[8] в которой я-е уравнение выбирается случайным образом с вероятностью, пропорциональной

Этот метод можно рассматривать как частный случай стохастический градиентный спуск.[9]

При таких обстоятельствах экспоненциально быстро сходится к решению а скорость сходимости зависит только от масштабированного номер условия .

Теорема. Позволять быть решением Тогда алгоритм 2 сходится к в ожидании, со средней ошибкой:

Доказательство

У нас есть

 

 

 

 

(2)

С помощью

мы можем написать (2) в качестве

 

 

 

 

(3)

Суть доказательства - рассмотреть левую часть в (3) как ожидание некоторой случайной величины. А именно, напомним, что пространство решений уравнение это гиперплоскость

чей нормальный Определите случайный вектор Z значения которых являются нормалями ко всем уравнениям , с вероятностями, как в нашем алгоритме:

с вероятностью

Потом (3) Говорит, что

 

 

 

 

(4)

Ортогональная проекция на пространство решений случайного уравнения дан кем-то

Теперь мы готовы проанализировать наш алгоритм. Мы хотим показать, что ошибка уменьшается на каждом шаге в среднем (с учетом предыдущих шагов) не менее чем в раз Следующее приближение вычисляется из в качестве куда являются независимыми реализациями случайной проекции Вектор находится в ядре Он ортогонален пространству решений уравнения, на которое проекты, содержащие вектор (Напомним, что является решением всех уравнений). Тогда ортогональность этих двух векторов дает

Чтобы завершить доказательство, мы должны оценить снизу. По определению , у нас есть

куда являются независимыми реализациями случайного вектора

Таким образом

Теперь возьмем математическое ожидание обеих сторон условным от выбора случайных векторов (поэтому фиксируем выбор случайных проекций и, таким образом, случайные векторы и мы усредняем случайный вектор ). потом

К (4) и независимость,

Принимая во внимание ожидания обеих сторон, мы заключаем, что

Превосходство этого выбора было проиллюстрировано реконструкцией функции с ограниченной полосой пропускания по ее неравномерно разнесенным значениям выборки. Однако было указано[10] что успех, о котором сообщают Штромер и Вершинин, зависит от конкретных выборов, которые были сделаны при переводе основной проблемы, геометрическая природа которой найти общую точку набора гиперплоскостей, в систему алгебраических уравнений. Всегда будут законные алгебраические представления основной проблемы, для которой метод выбора в[8] будет работать хуже.[8][10][11]

Итерация Качмара (1) имеет чисто геометрическую интерпретацию: алгоритм последовательно проецирует текущую итерацию на гиперплоскость, определяемую следующим уравнением. Следовательно, любое масштабирование уравнений не имеет значения; это также видно из (1), что любое (ненулевое) масштабирование уравнений сокращается. Таким образом, в РК можно использовать или любые другие веса, которые могут иметь значение. В частности, в вышеупомянутом примере реконструкции уравнения были выбраны с вероятностью, пропорциональной среднему расстоянию каждой точки выборки от двух ее ближайших соседей - концепция, введенная Файхтингер и Gröchenig. Для получения дополнительной информации по этой теме см.[12][13] и ссылки в нем.

Алгоритм 3: алгоритм Гауэра-Рихтарика

В 2015 году Роберт М. Гауэр и Питер Рихтарик[14] разработал универсальный рандомизированный итерационный метод решения непротиворечивой системы линейных уравнений который включает в себя рандомизированный алгоритм Качмарца как частный случай. Другие особые случаи включают рандомизированный спуск координат, рандомизированный спуск Гаусса и рандомизированный метод Ньютона. Блочные версии и версии с выборкой важности всех этих методов также возникают как особые случаи. Показано, что этот метод демонстрирует экспоненциальное затухание скорости (в ожидании), также известное как линейная сходимость, при очень мягких условиях, когда случайность входит в алгоритм. Метод Гауэра-Рихтарика - первый алгоритм, раскрывающий «родственные» отношения между этими методами, некоторые из которых были независимо предложены ранее, в то время как многие из них были новыми.

Информация о рандомизированном Качмаре

Интересные новые сведения о рандомизированном методе Качмарца, которые можно получить из анализа метода, включают:

  • Общая скорость алгоритма Гауэра-Рихтарика точно восстанавливает скорость рандомизированного метода Качмарца в частном случае, когда она сводится к нему.
  • Выбор вероятностей, для которых изначально был сформулирован и проанализирован рандомизированный алгоритм Качмарца (вероятности, пропорциональные квадратам норм строк), не является оптимальным. Оптимальные вероятности - это решение некоторой полуопределенной программы. Теоретическая сложность рандомизированного Качмара с оптимальными вероятностями может быть произвольно лучше, чем сложность для стандартных вероятностей. Однако, насколько лучше зависит от матрицы . Есть задачи, для которых стандартные вероятности оптимальны.
  • Применительно к системе с матрицей который является положительно определенным, рандомизированный метод Качмарца эквивалентен методу стохастического градиентного спуска (SGD) (с очень специальным размером шага) для минимизации сильно выпуклой квадратичной функции Обратите внимание, что поскольку выпукло, минимизаторы должен удовлетворить , что эквивалентно «Особый размер шага» - это размер шага, который приводит к точке, которая на одномерной линии, натянутой на стохастический градиент, минимизирует евклидово расстояние от неизвестного (!) Минимизатора , а именно из Это понимание получено из двойного взгляда на итерационный процесс (ниже описанный как «Точка зрения оптимизации: ограничение и приближение»).

Шесть эквивалентных составов

Метод Гауэра-Рихтарика имеет шесть, казалось бы, разных, но эквивалентных формулировок, проливающих дополнительный свет на то, как его интерпретировать (и, как следствие, как интерпретировать его многочисленные варианты, включая рандомизированный Качмарц):

  • 1. Набросок точки обзора: эскиз и проект
  • 2. Точка зрения оптимизации: ограничение и приближение
  • 3. Геометрическая точка зрения: случайное пересечение.
  • 4. Алгебраическая точка зрения 1: случайное линейное решение.
  • 5. Алгебраическая точка зрения 2: случайное обновление
  • 6. Аналитическая точка зрения: случайная фиксированная точка.

Теперь опишем некоторые из этих точек зрения. Метод зависит от 2 параметров:

  • положительно определенная матрица приводя к взвешенному евклидову внутреннему продукту и индуцированная норма
  • и случайная матрица с таким количеством строк, как (и, возможно, случайное количество столбцов).

1. Эскиз и проект

Учитывая предыдущую итерацию новая точка вычисляется путем рисования случайной матрицы (способом iid из некоторого фиксированного дистрибутива) и установка

То есть, получается как проекция на случайно нарисованную систему . Идея этого метода состоит в том, чтобы выбрать таким образом, что проекция на нарисованную систему существенно проще, чем решение исходной системы . Рандомизированный метод Качмара получается путем выбора быть единичной матрицей, и быть единичный вектор координат с вероятностью Различные варианты и приводят к разным вариантам метода.

2. Ограничение и приближение

На первый взгляд другая, но полностью эквивалентная формулировка метода (полученная с помощью лагранжевой двойственности):

куда также разрешено варьироваться, и где любое решение системы Следовательно, получается, сначала ограничивая обновление линейным подпространством, охватываемым столбцами случайной матрицы , т.е. к

а затем выбрав точку из этого подпространства, которое наилучшим образом приближает . Эта формулировка может показаться удивительной, поскольку кажется невозможным выполнить шаг приближения из-за того, что неизвестно (в конце концов, это то, что мы пытаемся вычислить!). Однако это все еще возможно просто потому, что вычисленный таким образом, такой же, как вычислено с помощью эскиза и формулировки проекта, и поскольку не появляется там.

5. Случайное обновление

Обновление также можно явно записать как

Посредством чего обозначим псевдообратную матрицу Мура - Пенроуза . Следовательно, метод можно записать в виде , куда это случайное обновление вектор.

Сдача можно показать, что система всегда есть решение , и что для всех таких решений вектор та же. Следовательно, не имеет значения, какое из этих решений выбрано, и метод также можно записать как . Псевдообратное решение приводит только к одному частному решению. Роль псевдообратного двойника:

  • Это позволяет записать метод в явной форме "случайного обновления", как указано выше,
  • Благодаря последней, шестой, формулировке анализ упрощается.

6. Случайная фиксированная точка

Если мы вычтем с обеих сторон формулы случайного обновления обозначим

и использовать тот факт, что приходим к последней формулировке:

куда - единичная матрица. Матрица итераций, случайно, откуда и название этой формулировки.

Конвергенция

Принимая условные ожидания в 6-й формулировке (при условии ), мы получаем

Снова взяв ожидание и используя свойство ожидания башни, мы получаем

Гауэр и Рихтарик[14] покажи это

где матричная норма определяется как

Более того, без каких-либо предположений о надо Взяв нормы и развернув рекуррентность, получим

Теорема [Гауэр и Ричтарик, 2015]

Замечание. Достаточным условием сходимости ожидаемых остатков к 0 является Этого можно добиться, если имеет полный ранг в столбце и при очень мягких условиях Сходимость метода можно установить и без предположения о полном ранге столбца другим способом.[15]

Также возможно показать более сильный результат:

Теорема [Гауэр и Ричтарик, 2015]

В ожидаемые квадратные нормы (а не нормы ожиданий) сходятся с одинаковой скоростью:

Замечание. Этот второй тип сходимости сильнее из-за следующей идентичности[14] которое справедливо для любого случайного вектора и любой фиксированный вектор :

Сходимость рандомизированного Качмара

Мы видели, что рандомизированный метод Качмарца появляется как частный случай метода Гауэра-Рихтарика для и будучи единичный вектор координат с вероятностью куда это ряд Прямым расчетом можно проверить, что

Другие особые случаи

Примечания

  1. ^ Качмарц (1937)
  2. ^ Гордон, Бендер и Герман (1970)
  3. ^ Гордон (2011)
  4. ^ Герман (2009)
  5. ^ Цензор и Зениос (1997)
  6. ^ Астер, Борчерс и Тербер (2004)
  7. ^ Видеть Герман (2009) и ссылки в нем.
  8. ^ а б c Штромер и Вершинин (2009)
  9. ^ Ниделл, Сребро и Уорд (2009)
  10. ^ а б Цензор, Герман и Цзян (2009)
  11. ^ Штромер и Вершинин (2009b)
  12. ^ Бас и Грёчениг (2013)
  13. ^ Гордон (2017)
  14. ^ а б c Гауэр и Ричтарик (2015)
  15. ^ Гауэр, Роберт М .; Ричтарик, Питер (2015). «Стохастическое двойственное восхождение для решения линейных систем». arXiv:1512.06890 [math.NA ].

Рекомендации

  • Качмарц, Стефан (1937), "Angenäherte Auflösung von Systemen linearer Gleichungen" (PDF), Международный бюллетень полонезной академии наук и литературы. Classe des Sciences Mathématiques et Naturelles. Серия А, Математические науки, 35, стр. 355–357
  • Чонг, Эдвин К. П .; Зак, Станислав Х. (2008), Введение в оптимизацию (3-е изд.), John Wiley & Sons, стр. 226–230.
  • Гордон, Ричард; Бендер, Роберт; Герман, Габор (1970), «Методы алгебраической реконструкции (ART) для трехмерной электронной микроскопии и рентгеновской фотографии», Журнал теоретической биологии, 29 (3): 471–481, Дои:10.1016/0022-5193(70)90109-8, PMID  5492997
  • Гордон, Ричард (2011), Остановите рак груди сейчас же! Представление способов визуализации для поиска, уничтожения, лечения и бдительного ожидания рака груди до метастазирования. В: Рак молочной железы - болезнь долей, редактор: Тибор Тот, Springer, стр. 167–203.
  • Герман, Габор (2009), Основы компьютерной томографии: Восстановление изображения по проекции. (2-е изд.), Springer
  • Цензор, Яир; Зениос, С.А. (1997), Параллельная оптимизация: теория, алгоритмы и приложения, Нью-Йорк: Издательство Оксфордского университета.
  • Астер, Ричард; Борчерс, Брайан; Тербер, Клиффорд (2004), Оценка параметров и обратные задачи, Эльзевьер
  • Стромер, Томас; Вершинин, Роман (2009), «Рандомизированный алгоритм Качмарца для линейных систем с экспоненциальной сходимостью» (PDF), Журнал анализа Фурье и приложений, 15 (2): 262–278, Дои:10.1007 / s00041-008-9030-4
  • Ниделл, Дина; Уорд, Рэйчел; Сребро, Нати (2015), «Стохастический градиентный спуск, взвешенная выборка и рандомизированный алгоритм Качмарца», Математическое программирование, 155: 549–573, arXiv:1310.5715, Дои:10.1007 / s10107-015-0864-7
  • Цензор Яир; Герман, Габор; Цзян, М. (2009), «Заметка о поведении рандомизированного алгоритма Качмарца Штромера и Вершинина», Журнал анализа Фурье и приложений, 15 (4): 431–436, Дои:10.1007 / s00041-009-9077-х, ЧВК  2872793, PMID  20495623
  • Стромер, Томас; Вершинин, Роман (2009b), «Комментарии к рандомизированному методу Качмарца», Журнал анализа Фурье и приложений, 15 (4): 437–440, Дои:10.1007 / s00041-009-9082-0
  • Басс, Ричард Ф.; Gröchenig, Karlheinz (2013), «Соответствующая выборка функций с ограниченной полосой пропускания», Иллинойсский журнал математики, 57 (1): 43–58
  • Гордон, Дэн (2017), «Дерандомизационный подход к восстановлению сигналов с ограниченной полосой пропускания в широком диапазоне случайных частот дискретизации», Численные алгоритмы, Дои:10.1007 / s11075-017-0356-3
  • Винь Нгуен, Куанг; Лумбанская тюрьма, Форд (2011), Материалы 2-го Международного конгресса по компьютерным приложениям и вычислительным наукам, 2011 г., 2, Springer, стр. 465–469.
  • Гауэр, Роберт; Рихтарик, Питер (2015), «Рандомизированные итерационные методы для линейных систем», Журнал SIAM по матричному анализу и приложениям, 36 (4): 1660–1690, arXiv:1506.03296, Дои:10.1137 / 15M1025487
  • Гауэр, Роберт; Рихтарик, Питер (2015), «Стохастическое двойное восхождение для решения линейных систем», arXiv:1512.06890 [math.NA ]

внешняя ссылка

  • [1] Рандомизированный алгоритм Качмарца с экспоненциальной сходимостью
  • [2] Комментарии к рандомизированному методу Качмара