Обобщенный метод минимальной невязки - Generalized minimal residual method

В математике обобщенный метод минимальной невязки (GMRES) является итерационный метод для числовой решение несимметричного система линейных уравнений. Метод аппроксимирует решение вектором в Крыловское подпространство с минимальным остаточный. В Итерация Арнольди используется для нахождения этого вектора.

Метод GMRES был разработан Юсеф Саад и Мартин Х. Шульц в 1986 году.[1]GMRES - это обобщение MINRES метод[2] разработан Крисом Пейджем и Майклом Сондерсом в 1975 году. GMRES также является частным случаем DIIS метод, разработанный Питером Пулаем в 1980 году. DIIS также применим к нелинейным системам.

Метод

Обозначим Евклидова норма любого вектора v от . Обозначим (квадратную) систему линейных уравнений, которую необходимо решить, через

Матрица А предполагается обратимый размера м-от-м. Кроме того, предполагается, что б нормализовано, т. е. что .

В п-го Крыловское подпространство для этой проблемы

где это начальная ошибка при первоначальном предположении . Ясно если .

GMRES приближает точное решение по вектору который минимизирует евклидову норму остаточный .

Векторы может быть близко к линейно зависимый, поэтому вместо этой основы Итерация Арнольди используется для поиска ортонормированных векторов которые составляют основу . Особенно, .

Следовательно, вектор можно записать как с участием , где это м-от-п матрица, образованная .

Процесс Арнольди также дает ()-от- верхний Матрица Гессенберга с участием

Поскольку столбцы ортонормированы, мы имеем

где

является первым вектором в стандартная основа из , и

являющийся первым пробным вектором (обычно нулевым). Следовательно, можно найти, минимизируя евклидову норму невязки

Это линейный метод наименьших квадратов проблема размера п.

Это дает метод GMRES. На -я итерация:

  1. вычислить по методу Арнольди;
  2. Найти что сводит к минимуму ;
  3. вычислить ;
  4. повторить, если остаток еще недостаточно мал.

На каждой итерации произведение матрица-вектор должны быть вычислены. Это стоит около операции с плавающей запятой для общих плотных матриц размера , но стоимость может снизиться до для разреженные матрицы. В дополнение к произведению матрица-вектор, операции с плавающей точкой должны вычисляться в п -я итерация.

Конвергенция

В пth итерация минимизирует невязку в подпространстве Крылова Kп. Поскольку каждое подпространство содержится в следующем подпространстве, невязка не увеличивается. После м итераций, где м размер матрицы А, пространство Крылова Kм это весь рм и, следовательно, метод GMRES дает точное решение. Однако идея состоит в том, что после небольшого количества итераций (относительно м) вектор Иксп уже является хорошим приближением к точному решению.

Так не бывает вообще. Действительно, теорема Гринбаума, Птака и Стракоша утверждает, что для любой невозрастающей последовательности а1, …, ам−1, ам = 0, можно найти матрицу А такой, что ||рп|| = ап для всех п, где рп - невязка, определенная выше. В частности, можно найти матрицу, для которой невязка остается постоянной при м - 1 итерация и падает до нуля только на последней итерации.

Однако на практике GMRES часто работает хорошо. Это можно доказать в конкретных ситуациях. Если симметричная часть А, это , является положительно определенный, тогда

где и обозначают самый маленький и самый большой собственное значение матрицы соответственно.[3]

Если А является симметричный и положительно определенный, то мы даже имеем

где обозначает номер условия из А в евклидовой норме.

В общем случае, когда А не является положительно определенным, мы имеем

где пп обозначает множество многочленов степени не выше п с участием п(0) = 1, V матрица, входящая в спектральное разложение из А, и σ(А) это спектр из А. Грубо говоря, это говорит о том, что быстрая сходимость происходит, когда собственные значения А сгруппированы далеко от источника и А не слишком далеко от нормальность.[4]

Все эти неравенства ограничивают только остатки, а не фактическую ошибку, то есть расстояние между текущей итерацией. Иксп и точное решение.

Расширения метода

Как и другие итерационные методы, GMRES обычно сочетается с предварительная подготовка метод для ускорения сходимости.

Стоимость итераций растет как O (п2), где п - номер итерации. Поэтому иногда метод перезапускается после номера, например k, итераций, с Иксk как первоначальное предположение. Полученный метод называется GMRES (k) или перезапустили GMRES. Для неположительно определенных матриц этот метод может страдать от стагнации сходимости, поскольку перезапущенное подпространство часто близко к предыдущему подпространству.

Недостатки GMRES и перезапущенного GMRES устраняются повторным использованием подпространства Крылова в методах типа GCRO, таких как GCROT и GCRODR.[5]Повторное использование подпространств Крылова в GMRES также может ускорить сходимость, когда необходимо решить последовательности линейных систем.[6]

Сравнение с другими решателями

Итерация Арнольди сводится к Итерация Ланцоша для симметричных матриц. Соответствующие Крыловское подпространство Метод минимальной невязки (MinRes) Пейдж и Сондерс. В отличие от несимметричного случая, метод MinRes задается трехчленным отношение повторения. Можно показать, что не существует метода подпространств Крылова для общих матриц, который задается коротким рекуррентным соотношением и все же минимизирует нормы остатков, как это делает GMRES.

Другой класс методов основан на несимметричная итерация Ланцоша, в частности BiCG метод. Они используют трехчленное рекуррентное соотношение, но они не достигают минимальной невязки, и, следовательно, невязка не уменьшается монотонно для этих методов. Сходимость даже не гарантируется.

Третий класс образован такими методами, как CGS и BiCGSTAB. Они также работают с трехчленным рекуррентным отношением (следовательно, без оптимальности) и могут даже преждевременно завершиться без достижения сходимости. Идея этих методов заключается в подходящем выборе порождающих полиномов итерационной последовательности.

Ни один из этих трех классов не является лучшим для всех матриц; Всегда есть примеры, в которых один класс превосходит другой. Поэтому на практике используются несколько решателей, чтобы увидеть, какой из них лучше всего подходит для данной проблемы.

Решение задачи наименьших квадратов

Одна из частей метода GMRES - найти вектор что сводит к минимуму

Обратите внимание, что является (п + 1) -по-п матрица, следовательно, она дает чрезмерно ограниченную линейную систему п+1 уравнение для п неизвестные.

Минимум можно вычислить с помощью QR-разложение: найти (п + 1) -на- (п + 1) ортогональная матрица Ωп и (п + 1) -по-п верхний треугольная матрица такой, что

Треугольная матрица имеет на одну строку больше, чем столбцов, поэтому ее нижняя строка состоит из нуля. Следовательно, его можно разложить как

где является п-от-п (таким образом квадратная) треугольная матрица.

QR-разложение можно дешево обновлять от одной итерации к следующей, потому что матрицы Хессенберга отличаются только строкой нулей и столбцом:

где часп + 1 = (час1,п + 1, …, часп + 1, п + 1)Т. Отсюда следует, что умножение матрицы Хессенберга на Ωп, дополненная нулями и строкой с мультипликативной единицей, дает почти треугольную матрицу:

Это было бы треугольником, если σ равно нулю. Чтобы исправить это, нужно Вращение Гивенса

где

С помощью этого вращения Гивенса мы формируем

Действительно,

- треугольная матрица.

Учитывая разложение QR, проблема минимизации легко решается, если заметить, что

Обозначая вектор от

с участием гпрп и γпр, это

Вектор y который минимизирует это выражение, дается

И снова векторы легко обновляются.[7]

Пример кода

Обычный GMRES (MATLAB / GNU Octave)

функция[x, e] =gmres( A, b, x, max_iterations, порог)п = длина(А);  м = max_iterations;  % использовать x как начальный вектор  р = б - А * Икс;  b_norm = норма(б);  ошибка = норма(р) / b_norm;  % инициализировать 1D-векторы  sn = нули(м, 1);  cs = нули(м, 1);  % e1 = нули (n, 1);  e1 = нули(м+1, 1);  e1(1) = 1;  е = [ошибка];  r_norm = норма(р);  Q(:,1) = р / r_norm;  бета = r_norm * e1;     % Примечание: это не бета-скаляр из раздела «Метод» выше, а бета-скаляр, умноженный на e1  для к = 1: м    % беги арнольди    [ЧАС(1:k+1, k) Q(:, k+1)] = Арнольди(А, Q, k);        % удалить последний элемент в строке H и обновить матрицу вращения    [ЧАС(1:k+1, k) cs(k) sn(k)] = apply_givens_rotation(ЧАС(1:k+1,k), cs, sn, k);        % обновить остаточный вектор    бета(k + 1) = -sn(k) * бета(k);    бета(k)     = cs(k) * бета(k);    ошибка  = абс (бета (k + 1)) / b_norm;    % сохранить ошибку    е = [е; ошибка];    если (ошибка <= порог)      перерыв;    конецконец  %, если порог не достигнут, в этой точке k = m (а не m + 1)     % рассчитать результат  y = ЧАС(1:k, 1:k)  бета(1:k);  Икс = Икс + Q(:, 1:k) * y;конец%----------------------------------------------------%% Функция Арнольди%%----------------------------------------------------%функция[h, q] =Арнольди(А, Q, k)q = А*Q(:,k);   % Крылова Вектор  для i = 1: k% модифицированного Грамма-Шмидта с сохранением матрицы Гессенберга    час(я) = q' * Q(:, я);    q = q - час(я) * Q(:, я);  конецh (k + 1) = норма (q);  q = q / час(k + 1);конец%---------------------------------------------------------------------%% Применение вращения Гивенса к H col%%---------------------------------------------------------------------%функция[h, cs_k, sn_k] =apply_givens_rotation(h, cs, sn, k)% подать заявку на i-й столбец  для я = 1: к-1    темп  = cs (i) * h (i) + sn (i) * h (i + 1);    час(я+1) = -sn(я) * час(я) + cs(я) * час(я + 1);    час(я)   = темп;  конец% обновить следующие значения sin cos для вращения  [cs_k sn_k] = givens_rotation(час(k), час(k + 1));  % удалить H (i + 1, i)  час(k) = cs_k * час(k) + sn_k * час(k + 1);  час(k + 1) = 0.0;конец%% ---- Вычислить заданную матрицу вращения ---- %%функция[cs, sn] =givens_rotation(v1, v2)% если (v1 == 0)% cs = 0;% sn = 1;% еще    т = sqrt(v1^2 + v2^2);% cs = abs (v1) / t;% sn = cs * v2 / v1;    cs = v1 / т;  % см. http://www.netlib.org/eispack/comqr.f    sn = v2 / т;%  конецконец

Смотрите также

использованная литература

  1. ^ Ю. Саад и М.Х. Шульц
  2. ^ Пейдж и Сондерс, "Решение разреженных неопределенных систем линейных уравнений", SIAM J. Numer. Anal., Том 12, стр. 617 (1975) https://doi.org/10.1137/0712047
  3. ^ Eisenstat, Elman & Schultz, Thm 3.3. NB: все результаты для GCR справедливы и для GMRES, см. Саад и Шульц
  4. ^ Trefethen & Bau, Thm 35.2
  5. ^ Амриткар, Амит; де Стерлер, Эрик; Свиридович, Катажина; Тафти, Данеш; Ахуджа, Капил (2015). «Переработка подпространств Крылова для приложений CFD и новый гибридный решатель рециклинга». Журнал вычислительной физики. 303: 222. arXiv:1501.03358. Bibcode:2015JCoPh.303..222A. Дои:10.1016 / j.jcp.2015.09.040.
  6. ^ Галлия, Андре (2014). Переработка методов подпространства Крылова для последовательностей линейных систем (Кандидат наук.). ТУ Берлин. Дои:10.14279 / depositonce-4147.
  7. ^ Стоер и Булирш, §8.7.2

Заметки

  • А. Мейстер, Numerik linearer Gleichungssysteme, 2-е издание, Vieweg 2005, ISBN  978-3-528-13135-7.
  • Ю. Саад, Итерационные методы для разреженных линейных систем., 2-е издание, Общество промышленной и прикладной математики, 2003. ISBN  978-0-89871-534-7.
  • Ю. Саад и М.Х. Шульц, "GMRES: Обобщенный алгоритм минимальной невязки для решения несимметричных линейных систем", SIAM J. Sci. Стат. Comput., 7:856–869, 1986. Дои:10.1137/0907058.
  • С.К. Эйзенстат, Х.К. Эльман и М. Шульц, "Вариационные итерационные методы для несимметричных систем линейных уравнений", Журнал SIAM по численному анализу, 20(2), 345–357, 1983.
  • Дж. Стоер и Р. Булирш, Введение в численный анализ, 3-е издание, Спрингер, Нью-Йорк, 2002. ISBN  978-0-387-95452-3.
  • Ллойд Н. Трефетен и Дэвид Бау, III, Числовая линейная алгебра, Общество промышленной и прикладной математики, 1997. ISBN  978-0-89871-361-9.
  • Dongarra et al. , Шаблоны для решения линейных систем: строительные блоки для итерационных методов, 2-е издание, SIAM, Филадельфия, 1994 г.
  • Амриткар, Амит; де Стерлер, Эрик; Свиридович, Катажина; Тафти, Данеш; Ахуджа, Капил (2015). «Переработка подпространств Крылова для приложений CFD и новый гибридный решатель рециклинга». Журнал вычислительной физики 303: 222. DOI: 10.1016 / j.jcp.2015.09.040