В математика , особенно в линейная алгебра , то Теорема Шура о произведении заявляет, что Произведение Адамара из двух положительно определенные матрицы также является положительно определенной матрицей. Результат назван в честь Иссай Шур [1] (Schur 1911, стр. 14, теорема VII) (заметьте, что Шур подписался как J. Schur в Журнал für die reine und angewandte Mathematik .[2] [3] )
Доказательство
Доказательство с использованием формулы следа Для любых матриц M { displaystyle M} и N { displaystyle N} , произведение Адамара M ∘ N { Displaystyle M circ N} рассматривается как билинейная форма, действует на векторы а , б { displaystyle a, b} в качестве
а ∗ ( M ∘ N ) б = tr ( M Т диагональ ( а ∗ ) N диагональ ( б ) ) { displaystyle a ^ {*} (M circ N) b = operatorname {tr} left (M ^ { extf {T}} operatorname {diag} left (a ^ {*} right) N operatorname {diag} (b) right)} куда tr { displaystyle operatorname {tr}} это матрица след и диагональ ( а ) { displaystyle operatorname {diag} (а)} это диагональная матрица имея в качестве диагональных входов элементы а { displaystyle a} .
Предполагать M { displaystyle M} и N { displaystyle N} положительно определены, и поэтому Эрмитский . Мы можем рассматривать их квадратные корни M 1 2 { displaystyle M ^ { frac {1} {2}}} и N 1 2 { displaystyle N ^ { frac {1} {2}}} , которые также являются эрмитскими, и пишем
tr ( M Т диагональ ( а ∗ ) N диагональ ( б ) ) = tr ( M ¯ 1 2 M ¯ 1 2 диагональ ( а ∗ ) N 1 2 N 1 2 диагональ ( б ) ) = tr ( M ¯ 1 2 диагональ ( а ∗ ) N 1 2 N 1 2 диагональ ( б ) M ¯ 1 2 ) { displaystyle operatorname {tr} left (M ^ { extf {T}} operatorname {diag} left (a ^ {*} right) N operatorname {diag} (b) right) = имя оператора {tr} left ({ overline {M}} ^ { frac {1} {2}} { overline {M}} ^ { frac {1} {2}} operatorname {diag} left (a ^ {*} right) N ^ { frac {1} {2}} N ^ { frac {1} {2}} operatorname {diag} (b) right) = operatorname {tr} left ({ overline {M}} ^ { frac {1} {2}} operatorname {diag} left (a ^ {*} right) N ^ { frac {1} {2}} N ^ { frac {1} {2}} operatorname {diag} (b) { overline {M}} ^ { frac {1} {2}} right)} Тогда для а = б { displaystyle a = b} , это записывается как tr ( А ∗ А ) { displaystyle operatorname {tr} left (A ^ {*} A right)} за А = N 1 2 диагональ ( а ) M ¯ 1 2 { displaystyle A = N ^ { frac {1} {2}} operatorname {diag} (a) { overline {M}} ^ { frac {1} {2}}} и поэтому строго положительно для А ≠ 0 { displaystyle A neq 0} , что происходит тогда и только тогда, когда а ≠ 0 { displaystyle a neq 0} . Это показывает, что ( M ∘ N ) { Displaystyle (M circ N)} - положительно определенная матрица.
Доказательство с использованием гауссова интегрирования В случае если M = N Позволять Икс { displaystyle X} быть п { displaystyle n} -размерный центрированный Гауссовская случайная величина с ковариация ⟨ Икс я Икс j ⟩ = M я j { Displaystyle langle X_ {i} X_ {j} rangle = M_ {ij}} . Тогда ковариационная матрица Икс я 2 { displaystyle X_ {i} ^ {2}} и Икс j 2 { Displaystyle X_ {j} ^ {2}} является
Cov ( Икс я 2 , Икс j 2 ) = ⟨ Икс я 2 Икс j 2 ⟩ − ⟨ Икс я 2 ⟩ ⟨ Икс j 2 ⟩ { displaystyle operatorname {Cov} left (X_ {i} ^ {2}, X_ {j} ^ {2} right) = left langle X_ {i} ^ {2} X_ {j} ^ { 2} right rangle - left langle X_ {i} ^ {2} right rangle left langle X_ {j} ^ {2} right rangle} С помощью Теорема Вика разрабатывать ⟨ Икс я 2 Икс j 2 ⟩ = 2 ⟨ Икс я Икс j ⟩ 2 + ⟨ Икс я 2 ⟩ ⟨ Икс j 2 ⟩ { displaystyle left langle X_ {i} ^ {2} X_ {j} ^ {2} right rangle = 2 left langle X_ {i} X_ {j} right rangle ^ {2} + left langle X_ {i} ^ {2} right rangle left langle X_ {j} ^ {2} right rangle} у нас есть
Cov ( Икс я 2 , Икс j 2 ) = 2 ⟨ Икс я Икс j ⟩ 2 = 2 M я j 2 { displaystyle operatorname {Cov} left (X_ {i} ^ {2}, X_ {j} ^ {2} right) = 2 left langle X_ {i} X_ {j} right rangle ^ {2} = 2M_ {ij} ^ {2}} Поскольку ковариационная матрица положительно определена, это доказывает, что матрица с элементами M я j 2 { displaystyle M_ {ij} ^ {2}} - положительно определенная матрица.
Общий случай Позволять Икс { displaystyle X} и Y { displaystyle Y} быть п { displaystyle n} -размерный центрированный Гауссовские случайные величины с ковариации ⟨ Икс я Икс j ⟩ = M я j { displaystyle left langle X_ {i} X_ {j} right rangle = M_ {ij}} , ⟨ Y я Y j ⟩ = N я j { displaystyle left langle Y_ {i} Y_ {j} right rangle = N_ {ij}} и независимы друг от друга, так что мы
⟨ Икс я Y j ⟩ = 0 { displaystyle left langle X_ {i} Y_ {j} right rangle = 0} для любого я , j { displaystyle i, j} Тогда ковариационная матрица Икс я Y я { displaystyle X_ {i} Y_ {i}} и Икс j Y j { displaystyle X_ {j} Y_ {j}} является
Cov ( Икс я Y я , Икс j Y j ) = ⟨ Икс я Y я Икс j Y j ⟩ − ⟨ Икс я Y я ⟩ ⟨ Икс j Y j ⟩ { displaystyle operatorname {Cov} left (X_ {i} Y_ {i}, X_ {j} Y_ {j} right) = left langle X_ {i} Y_ {i} X_ {j} Y_ { j} right rangle - left langle X_ {i} Y_ {i} right rangle left langle X_ {j} Y_ {j} right rangle} С помощью Теорема Вика разрабатывать
⟨ Икс я Y я Икс j Y j ⟩ = ⟨ Икс я Икс j ⟩ ⟨ Y я Y j ⟩ + ⟨ Икс я Y я ⟩ ⟨ Икс j Y j ⟩ + ⟨ Икс я Y j ⟩ ⟨ Икс j Y я ⟩ { displaystyle left langle X_ {i} Y_ {i} X_ {j} Y_ {j} right rangle = left langle X_ {i} X_ {j} right rangle left langle Y_ { i} Y_ {j} right rangle + left langle X_ {i} Y_ {i} right rangle left langle X_ {j} Y_ {j} right rangle + left langle X_ { i} Y_ {j} right rangle left langle X_ {j} Y_ {i} right rangle} а также используя независимость Икс { displaystyle X} и Y { displaystyle Y} , у нас есть
Cov ( Икс я Y я , Икс j Y j ) = ⟨ Икс я Икс j ⟩ ⟨ Y я Y j ⟩ = M я j N я j { displaystyle operatorname {Cov} left (X_ {i} Y_ {i}, X_ {j} Y_ {j} right) = left langle X_ {i} X_ {j} right rangle left langle Y_ {i} Y_ {j} right rangle = M_ {ij} N_ {ij}} Поскольку ковариационная матрица положительно определена, это доказывает, что матрица с элементами M я j N я j { displaystyle M_ {ij} N_ {ij}} - положительно определенная матрица.
Доказательство с использованием собственного разложения Доказательство положительной полуопределенности Позволять M = ∑ μ я м я м я Т { Displaystyle М = сумма му _ {я} м_ {я} м_ {я} ^ { extf {T}}} и N = ∑ ν я п я п я Т { displaystyle N = sum nu _ {i} n_ {i} n_ {i} ^ { extf {T}}} . потом
M ∘ N = ∑ я j μ я ν j ( м я м я Т ) ∘ ( п j п j Т ) = ∑ я j μ я ν j ( м я ∘ п j ) ( м я ∘ п j ) Т { Displaystyle M circ N = sum _ {ij} mu _ {i} nu _ {j} left (m_ {i} m_ {i} ^ { extf {T}} right) circ left (n_ {j} n_ {j} ^ { extf {T}} right) = sum _ {ij} mu _ {i} nu _ {j} left (m_ {i} circ n_ {j} right) left (m_ {i} circ n_ {j} right) ^ { extf {T}}} Каждый ( м я ∘ п j ) ( м я ∘ п j ) Т { displaystyle left (m_ {i} circ n_ {j} right) left (m_ {i} circ n_ {j} right) ^ { extf {T}}} положительно полуопределено (но, за исключением одномерного случая, не положительно определено, так как они классифицировать 1 матрицы). Также, μ я ν j > 0 { displaystyle mu _ {i} nu _ {j}> 0} таким образом сумма M ∘ N { Displaystyle M circ N} также положительно полуопределено.
Доказательство определенности Чтобы показать, что результат положительно определенный, требуются дополнительные доказательства. Покажем, что для любого вектора а ≠ 0 { displaystyle a neq 0} , у нас есть а Т ( M ∘ N ) а > 0 { Displaystyle а ^ { extf {T}} (М circ N) а> 0} . Продолжая, как указано выше, каждый а Т ( м я ∘ п j ) ( м я ∘ п j ) Т а ≥ 0 { displaystyle a ^ { extf {T}} left (m_ {i} circ n_ {j} right) left (m_ {i} circ n_ {j} right) ^ { extf {T }} а geq 0} , поэтому остается показать, что существуют я { displaystyle i} и j { displaystyle j} для которых соответствующий член выше неотрицателен. Для этого заметим, что
а Т ( м я ∘ п j ) ( м я ∘ п j ) Т а = ( ∑ k м я , k п j , k а k ) 2 { displaystyle a ^ { extf {T}} (m_ {i} circ n_ {j}) (m_ {i} circ n_ {j}) ^ { extf {T}} a = left ( сумма _ {k} m_ {i, k} n_ {j, k} a_ {k} right) ^ {2}} С N { displaystyle N} положительно определен, существует j { displaystyle j} для которого п j ∘ а ≠ 0 { displaystyle n_ {j} circ a neq 0} (так как иначе п j Т а = ∑ k ( п j ∘ а ) k = 0 { displaystyle n_ {j} ^ { extf {T}} a = sum _ {k} (n_ {j} circ a) _ {k} = 0} для всех j { displaystyle j} ), а также поскольку M { displaystyle M} положительно определен, существует я { displaystyle i} для которого ∑ k м я , k ( п j ∘ а ) k = м я Т ( п j ∘ а ) ≠ 0. { displaystyle sum _ {k} m_ {i, k} (n_ {j} circ a) _ {k} = m_ {i} ^ { extf {T}} (n_ {j} circ a) neq 0.} Однако эта последняя сумма просто ∑ k м я , k п j , k а k { displaystyle sum _ {k} m_ {i, k} n_ {j, k} a_ {k}} . Таким образом, его квадрат положительный. Это завершает доказательство.
Рекомендации
^ "Bemerkungen zur Theorie der beschränkten Bilinearformen mit unendlich vielen Veränderlichen". Журнал für die reine und angewandte Mathematik . 1911 (140): 1–28. 1911. Дои :10.1515 / crll.1911.140.1 . ^ Чжан, Фучжэнь, изд. (2005). «Дополнение Шура и его приложения». Численные методы и алгоритмы. 4 . Дои :10.1007 / b105056 . ISBN 0-387-24271-6 . , стр.9, гл. 0,6 Издание под руководством Дж. Шура ^ Ледерманн, В. (1983). «Иссай Шур и его школа в Берлине». Бюллетень Лондонского математического общества . 15 (2): 97–106. Дои :10.1112 / blms / 15.2.97 . внешняя ссылка