Неявный метод переменного направления - Alternating direction implicit method

В числовая линейная алгебра, то Неявный метод переменного направления (ADI) это итерационный метод, используемый для решения Сильвестр матричные уравнения. Это популярный метод решения больших матричных уравнений, возникающих в теория систем и контроль,[1] и могут быть сформулированы для построения решений в факторизованной форме с эффективным использованием памяти.[2][3] Он также используется для численного решения параболический и эллиптический уравнения в частных производных, и это классический метод, используемый для моделирования теплопроводность и решение уравнение диффузии в двух или более измерениях.[4] Это пример разделение операторов метод.[5]

ADI для матричных уравнений

Метод

Метод ADI - это двухэтапный итерационный процесс, который поочередно обновляет пространства столбцов и строк приближенного решения для . Одна итерация ADI состоит из следующих шагов:[6]

1. Решите для , где

2. Решите для , где .

Число называются параметрами сдвига, и сходимость сильно зависит от выбора этих параметров.[7][8] Выполнить итерации ADI, первоначальное предположение требуется, а также параметры смены, .

Когда использовать ADI

Если и , тогда можно решить прямо в с помощью метода Бартельса-Стюарта.[9] Поэтому использование ADI выгодно только тогда, когда умножение матрицы на вектор и линейные решения включают и может применяться дешево.

Уравнение имеет единственное решение тогда и только тогда, когда , где это спектр из .[1] Однако метод ADI особенно хорошо работает, когда и хорошо разделены, и и находятся нормальные матрицы. Этим предположениям удовлетворяет, например, уравнение Ляпунова когда является положительно определенный. При этих предположениях параметры сдвига, близкие к оптимальным, известны для нескольких вариантов выбора и .[7][8] Кроме того, могут быть вычислены априорные границы ошибок, что устраняет необходимость в мониторинге остаточной ошибки при реализации.

Метод ADI все еще может применяться, когда вышеприведенные предположения не выполняются. Использование неоптимальных параметров сдвига может отрицательно повлиять на сходимость,[1] и на сходимость также влияет ненормальность или (иногда выгодно).[10] Крыловское подпространство методы, такие как Рациональный метод подпространств Крылова,[11] обычно сходятся быстрее, чем ADI в этой настройке,[1][3] и это привело к развитию гибридных методов ADI-проекции.[3]

Выбор параметра сдвига и уравнение ошибки ADI

Задача поиска хороших параметров сдвига нетривиальна. Эту проблему можно понять, изучив уравнение ошибки ADI. После итераций ошибка определяется выражением

Выбор приводит к следующей границе относительной ошибки:

где это норма оператора. Идеальный набор параметров смены определяет рациональная функция что минимизирует количество . Если и находятся нормальные матрицы и имеют собственные разложения и , тогда

.

Практически оптимальные параметры смены

В некоторых случаях известны близкие к оптимальным параметры сдвига, например, когда и , где и непересекающиеся интервалы на прямой.[7][8] В Уравнение Ляпунова , например, удовлетворяет этим предположениям, когда является положительно определенный. В этом случае параметры сдвига можно выразить в замкнутой форме с помощью эллиптические интегралы, и легко вычисляется численно.

В более общем смысле, если замкнутые непересекающиеся множества и , где и , известны, задача выбора оптимального параметра сдвига приближенно решается путем нахождения экстремальной рациональной функции, которая принимает значение

где нижняя грань берется по всем рациональным функциям степени .[8] Эта проблема аппроксимации связана с несколькими результатами в теория потенциала,[12][13] и был решен Золотарев в 1877 г. для = [a, b] и [14] Решение также известно, когда и непересекающиеся диски на комплексной плоскости.[15]

Стратегии эвристического сдвига параметров

Когда меньше известно о и , или когда или являются ненормальными матрицами, может оказаться невозможным найти близкие к оптимальным параметры сдвига. В этой настройке можно использовать различные стратегии для создания хороших параметров переключения передач. К ним относятся стратегии, основанные на асимптотических результатах в теории потенциала,[16] используя значения Ритца матриц , , , и сформулировать жадный подход,[17] и циклические методы, в которых один и тот же небольшой набор параметров сдвига повторно используется до тех пор, пока не будет соблюден допуск сходимости.[17][10] Когда один и тот же параметр сдвига используется на каждой итерации, ADI эквивалентен алгоритму, называемому методом Смита.[18]

Фактор ADI

Во многих приложениях и очень большие, разреженные матрицы и можно разложить на множители как , где , с участием .[1] В таких условиях хранение потенциально плотной матрицы может оказаться невозможным. явно. Вариант ADI, называемый факторизованным ADI,[3][2] можно использовать для вычисления , где . Эффективность факторного ADI зависит от того, хорошо аппроксимируется матрицей низкого ранга. Это, как известно, верно при различных предположениях о и .[10][8]

ADI для параболических уравнений

Исторически метод ADI был разработан для решения двумерного уравнения диффузии в квадратной области с использованием конечных разностей.[4] В отличие от ADI для матричных уравнений, ADI для параболических уравнений не требует выбора параметров сдвига, поскольку сдвиг, появляющийся на каждой итерации, определяется такими параметрами, как временной шаг, коэффициент диффузии и шаг сетки. Связь с ADI в матричных уравнениях можно наблюдать, если рассмотреть действие итерации ADI на систему в установившемся состоянии.

Пример: двумерное уравнение диффузии

Трафаретная фигура для неявного метода переменного направления в конечно-разностных уравнениях

Традиционным методом численного решения уравнения теплопроводности является метод Метод Кранка – Николсона. Этот метод приводит к очень сложной системе уравнений в нескольких измерениях, решение которых требует больших затрат. Преимущество метода ADI заключается в том, что уравнения, которые необходимо решать на каждом этапе, имеют более простую структуру и могут быть эффективно решены с помощью алгоритм трехдиагональной матрицы.

Рассмотрим линейное уравнение диффузии в двух измерениях:

Неявный метод Кранка – Николсона дает следующее уравнение конечных разностей:

где:

и - центральный второй разностный оператор для п-я координата

с участием или для или соответственно (и сокращение для точек решетки ).

После выполнения анализ устойчивости, можно показать, что этот метод будет устойчивым для любых .

Недостатком метода Кранка – Николсона является то, что матрица в приведенном выше уравнении имеет вид полосатый с шириной полосы, как правило, довольно большой. Это делает прямое решение проблемы система линейных уравнений довольно затратно (хотя существуют эффективные приближенные решения, например, использование метод сопряженных градиентов предварительно подготовленный с неполная факторизация Холецкого ).

Идея метода ADI состоит в том, чтобы разделить конечно-разностные уравнения на два, одно с Икс-производная берется неявно, а следующая с y-производная взята неявно,

Используемая система уравнений имеет вид симметричный и трехдиагональный (с полосой пропускания 3), и обычно решается с использованием алгоритм трехдиагональной матрицы.

Можно показать, что этот метод безусловно устойчив и имеет второй порядок во времени и пространстве.[19] Существуют более усовершенствованные методы ADI, такие как методы Дугласа,[20] или метод f-фактора[21] который можно использовать для трех или более измерений.

Обобщения

Использование метода ADI в качестве разделение операторов Схема может быть обобщена. То есть мы можем рассматривать общие эволюционные уравнения

где и являются (возможно, нелинейными) операторами, определенными в банаховом пространстве.[22][23] В приведенном выше примере распространения мы имеем и .

Фундаментальный ADI (FADI)

Упрощение ADI до FADI

Можно упростить традиционный метод ADI до метода Fundamental ADI, который имеет только аналогичные операторы в левой части и не содержит операторов в правой части. Это можно рассматривать как фундаментальную (базовую) схему метода ADI,[24][25] без дополнительных операторов (подлежащих сокращению) в правой части, в отличие от большинства традиционных неявных методов, которые обычно состоят из операторов в обеих частях уравнений. Метод FADI позволяет получить более простые, краткие и эффективные уравнения обновления без ухудшения точности обычного метода ADI.

Отношения к другим неявным методам

Многие классические неявные методы Пичмана-Рачфорда, Дугласа-Ганна, Д'Яконова, Луча-Уорминга, Крэнка-Николсона и т. Д. Могут быть упрощены до фундаментальных неявных схем с правыми частями без операторов.[25] В своих основных формах метод FADI временной точности второго порядка может быть тесно связан с фундаментальным локально-одномерным методом (FLOD), который может быть повышен до временного порядка второго порядка, например, для трехмерных уравнений Максвелла. [26][27] в вычислительная электромагнетизм. Для двумерных и трехмерных уравнений теплопроводности и диффузии методы FADI и FLOD могут быть реализованы более простым, более эффективным и стабильным образом по сравнению с их традиционными методами. [28][29]

использованная литература

  1. ^ а б c d е Симончини, В. (2016). «Вычислительные методы для линейных матричных уравнений». SIAM Обзор. 58 (3): 377–441. Дои:10.1137/130912839. ISSN  0036-1445. S2CID  17271167.
  2. ^ а б Ли, Цзин-Ребекка; Белый, Джейкоб (2002). "Решение уравнений Ляпунова низкого ранга". Журнал SIAM по матричному анализу и приложениям. 24 (1): 260–280. Дои:10.1137 / s0895479801384937. ISSN  0895-4798.
  3. ^ а б c d Беннер, Питер; Ли, Рен-Цан; Трухар, Нинослав (2009). «О методе ADI для уравнений Сильвестра». Журнал вычислительной и прикладной математики. 233 (4): 1035–1045. Bibcode:2009JCoAM.233.1035B. Дои:10.1016 / j.cam.2009.08.108. ISSN  0377-0427.
  4. ^ а б Peaceman, D. W .; Рачфорд-младший, Х. Х. (1955), "Численное решение параболических и эллиптических дифференциальных уравнений", Журнал Общества промышленной и прикладной математики, 3 (1): 28–41, Дои:10.1137/0103003, HDL:10338.dmlcz / 135399, Г-Н  0071874.
  5. ^ *Нажмите, WH; Теукольский С.А.; Феттерлинг, штат Вашингтон; Фланнери, ВР (2007). «Раздел 20.3.3. Общие методы разделения операторов». Числовые рецепты: искусство научных вычислений (3-е изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN  978-0-521-88068-8.
  6. ^ Wachspress, Юджин Л. (2008). "След к решению уравнения Ляпунова". Компьютеры и математика с приложениями. 55 (8): 1653–1659. Дои:10.1016 / j.camwa.2007.04.048. ISSN  0898-1221.
  7. ^ а б c Лу, Ан; Wachspress, E.L. (1991). «Решение уравнений Ляпунова неявной итерацией с переменным направлением». Компьютеры и математика с приложениями. 21 (9): 43–58. Дои:10.1016 / 0898-1221 (91) 90124-м. ISSN  0898-1221.
  8. ^ а б c d е Беккерманн, Бернхард; Таунсенд, Алекс (2017). «Об особых значениях матриц со структурой смещения». Журнал SIAM по матричному анализу и приложениям. 38 (4): 1227–1248. arXiv:1609.09494. Дои:10.1137 / 16m1096426. ISSN  0895-4798.
  9. ^ Голуб, Г. (1989). Матричные вычисления. Ван Лоан, С (Четвертое изд.). Балтимор: Университет Джона Хопкинса. ISBN  1421407949. OCLC  824733531.
  10. ^ а б c Сабино, Дж (2007). Решение крупномасштабных уравнений Ляпунова блочно-модифицированным методом Смита. PhD Diss., Rice Univ. (Тезис). HDL:1911/20641.
  11. ^ Друскин, В .; Симончини, В. (2011). «Адаптивные рациональные подпространства Крылова для крупномасштабных динамических систем». Письма о системах и управлении. 60 (8): 546–560. Дои:10.1016 / j.sysconle.2011.04.013. ISSN  0167-6911.
  12. ^ 1944-, Сафф, Э. Б. (11 ноября 2013 г.). Логарифмические потенциалы с внешними полями. Тотик, В. Берлин. ISBN  9783662033296. OCLC  883382758.CS1 maint: числовые имена: список авторов (ссылка на сайт)
  13. ^ Гончар, А.А. (1969). «Проблемы Золотарева, связанные с рациональными функциями». Мат. Сб. (Н.С.). 78 (120):4 (4): 640–654. Bibcode:1969СбМат ... 7..623Г. Дои:10.1070 / SM1969v007n04ABEH001107.
  14. ^ Золотарев, Д. (1877). «Применение эллиптических функций к вопросам о функциях, наименее и наиболее отклоняющихся от нуля». Зап. Imp. Акад. Наук. Санкт-Петербург. 30: 1–59.
  15. ^ Старке, Герхард (июль 1992 г.). «Околоокруглость для рациональной задачи Золотарева в комплексной плоскости». Журнал теории приближений. 70 (1): 115–130. Дои:10.1016 / 0021-9045 (92) 90059-в.. ISSN  0021-9045.
  16. ^ Старке, Герхард (июнь 1993). «Точки Фейера-Уолша для рациональных функций и их использование в итерационном методе ADI». Журнал вычислительной и прикладной математики. 46 (1–2): 129–141. Дои:10.1016 / 0377-0427 (93) 90291-я. ISSN  0377-0427.
  17. ^ а б Пенцл, Тило (январь 1999 г.). "Циклический метод Смита низкого ранга для больших разреженных уравнений Ляпунова". Журнал SIAM по научным вычислениям. 21 (4): 1401–1418. Дои:10.1137 / s1064827598347666. ISSN  1064-8275.
  18. ^ Смит, Р. А. (январь 1968 г.). «Матричное уравнение XA + BX = C». Журнал SIAM по прикладной математике. 16 (1): 198–201. Дои:10.1137/0116017. ISSN  0036-1399.
  19. ^ Дуглас-младший, Дж. (1955), "О численном интегрировании uхх+ тыгг= uт неявными методами », Журнал Общества промышленной и прикладной математики, 3: 42–65, Г-Н  0071875.
  20. ^ Дуглас мл., Джим (1962), "Методы переменного направления для трех пространственных переменных", Numerische Mathematik, 4 (1): 41–63, Дои:10.1007 / BF01386295, ISSN  0029-599X.
  21. ^ Chang, M. J .; Chow, L.C .; Чанг, В. С. (1991), «Улучшенный неявный метод переменного направления для решения нестационарных трехмерных задач диффузии тепла», Числовой теплообмен, часть B: основы, 19 (1): 69–84, Bibcode:1991НХТБ ... 19 ... 69С, Дои:10.1080/10407799108944957, ISSN  1040-7790.
  22. ^ Хундсдорфер, Виллем; Вервер, янв (2003). Численное решение нестационарных уравнений адвекции-диффузии-реакции. Берлин, Гейдельберг: Springer Berlin Heidelberg. ISBN  978-3-662-09017-6.
  23. ^ Lions, P. L .; Мерсье, Б. (декабрь 1979 г.). «Алгоритмы расщепления суммы двух нелинейных операторов». Журнал SIAM по численному анализу. 16 (6): 964–979. Bibcode:1979SJNA ... 16..964L. Дои:10.1137/0716071.
  24. ^ Тан, Э. Л. (2007). «Эффективный алгоритм для безусловно стабильного трехмерного метода ADI-FDTD» (PDF). Письма IEEE о микроволновых и беспроводных компонентах. 17 (1): 7–9. Дои:10.1109 / LMWC.2006.887239.
  25. ^ а б Тан, Э. Л. (2008). «Основные схемы для эффективных безоговорочно стабильных неявных конечно-разностных методов во временной области» (PDF). Транзакции IEEE по антеннам и распространению. 56 (1): 170–177. Дои:10.1109 / TAP.2007.913089.
  26. ^ Тан, Э. Л. (2007). «Безусловно устойчивый метод LOD-FDTD для трехмерных уравнений Максвелла» (PDF). Письма IEEE о микроволновых и беспроводных компонентах. 17 (2): 85–87. Дои:10.1109 / LMWC.2006.890166.
  27. ^ Gan, T. H .; Тан, Э. Л. (2013). «Безоговорочно стабильный фундаментальный метод LOD-FDTD с временной точностью второго порядка и соответствующей дивергенцией» (PDF). Транзакции IEEE по антеннам и распространению. 61 (5): 2630–2638. Дои:10.1109 / TAP.2013.2242036.
  28. ^ Tay, W. C .; Tan, E. L .; Хех, Д. Ю. (2014). «Фундаментальный локально-одномерный метод трехмерного теплового моделирования». Сделки IEICE по электронике. E-97-C (7): 636–644. Дои:10.1587 / transele.E97.C.636.
  29. ^ Heh, D. Y .; Tan, E. L .; Тай, У. К. (2016). «Неявный метод быстрого изменения направления для эффективного теплового моделирования переходных процессов в интегральных схемах». Международный журнал численного моделирования: электронные сети, устройства и поля. 29 (1): 93–108. Дои:10.1002 / jnm.2049.