Ковариационная матрица - Covariance matrix

А двумерная гауссова функция плотности вероятности с центром в (0, 0), с ковариационной матрицей, заданной
Образцы точек из двумерное распределение Гаусса со стандартным отклонением 3 примерно в нижнем левом и верхнем правом направлении и 1 в ортогональном направлении. Поскольку Икс и у компоненты взаимозависимы, дисперсия и не описывают полностью раздачу. А необходима ковариационная матрица; направления стрелок соответствуют собственные векторы этой ковариационной матрицы и их длины к квадратным корням из собственные значения.

В теория вероятности и статистика, а ковариационная матрица (также известен как матрица автоковариации, матрица дисперсии, матрица отклонений, или же матрица дисперсии-ковариации) представляет собой квадрат матрица давая ковариация между каждой парой элементов данного случайный вектор. Любая ковариационная матрица симметричный и положительный полуопределенный а его главная диагональ содержит отклонения (т.е. ковариация каждого элемента с самим собой).

Интуитивно ковариационная матрица обобщает понятие дисперсии на несколько измерений. Например, вариацию набора случайных точек в двумерном пространстве нельзя полностью охарактеризовать одним числом, равно как и вариации в и направления содержат всю необходимую информацию; а матрица необходима для полной характеристики двумерной вариации.

Ковариационная матрица случайного вектора обычно обозначается или .

Определение

В этой статье полужирным шрифтом без подписи и используются для обозначения случайных векторов, а нижний индекс выделен жирным шрифтом. и используются для обозначения скалярных случайных величин.

Если записи в вектор столбца

находятся случайные переменные, каждый с конечным отклонение и ожидаемое значение, то ковариационная матрица матрица, запись - это ковариация[1]:п. 177

где оператор обозначает ожидаемое значение (среднее значение) своего аргумента.

Другими словами,

Приведенное выше определение эквивалентно матричному равенству

 

 

 

 

(Уравнение 1)

где .

Обобщение дисперсии

Эта форма (Уравнение 1) можно рассматривать как обобщение скалярнозначных отклонение в более высокие измерения. Помните, что для случайной величины со скалярным знаком

В самом деле, элементы на диагонали автоковариационной матрицы - дисперсии каждого элемента вектора .

Противоречивые номенклатуры и обозначения

Номенклатуры различаются. Некоторые статистики, вслед за вероятностником Уильям Феллер в его двухтомной книге Введение в теорию вероятностей и ее приложения,[2] назовите матрицу то отклонение случайного вектора , потому что это естественное обобщение одномерной дисперсии на более высокие измерения. Другие называют это ковариационная матрица, поскольку это матрица ковариаций между скалярными компонентами вектора .

Обе формы вполне стандартные, и между ними нет никакой двусмысленности. Матрица также часто называют ковариационная матрица, поскольку диагональные члены на самом деле являются дисперсиями.

Для сравнения, обозначения для матрица кросс-ковариации между два вектора

Характеристики

Связь с автокорреляционной матрицей

Матрица автоковариации относится к автокорреляционная матрица к

где автокорреляционная матрица определяется как .

Связь с корреляционной матрицей

Сущностью, тесно связанной с ковариационной матрицей, является матрица Коэффициенты корреляции произведение-момент Пирсона между каждой из случайных величин в случайном векторе , который можно записать как

где - матрица диагональных элементов (т.е. диагональная матрица дисперсии за ).

Эквивалентно корреляционную матрицу можно рассматривать как ковариационную матрицу стандартизированные случайные величины за .

Каждый элемент на главной диагонали корреляционной матрицы - это корреляция случайной величины с самим собой, которая всегда равна 1. Каждый недиагональный элемент составляет от -1 до +1 включительно.

Обратная матрица ковариации

Обратная матрица, , если он существует, является обратной ковариационной матрицей, также известной как матрица концентрации или точность матрица.[3]

Основные свойства

За и , где это -мерная случайная величина, применяются следующие основные свойства:[4]

  1. является положительно-полуопределенный, т.е.
  2. является симметричный, т.е.
  3. Для любой постоянной (т.е. неслучайной) матрица и постоянный вектор , надо
  4. Если - другой случайный вектор той же размерности, что и , тогда где это матрица кросс-ковариации из и .

Блочные матрицы

Совместное среднее и совместная ковариационная матрица из и можно записать в блочной форме

где , и .

и можно идентифицировать как матрицы дисперсии маржинальные распределения за и соответственно.

Если и находятся совместно нормально распределенные,

затем условное распределение за данный дан кем-то

[5]

определяется условное среднее

и условная дисперсия

Матрица известна как матрица регресс коэффициентов, а в линейной алгебре это Дополнение Шура из в .

Матрица коэффициентов регрессии часто может быть представлена ​​в транспонированной форме, , подходит для постмножения вектора-строки независимых переменных вместо предварительного умножения вектора-столбца . В таком виде они соответствуют коэффициентам, полученным путем обращения матрицы нормальные уравнения из обыкновенный метод наименьших квадратов (OLS).

Матрица частичной ковариации

Ковариационная матрица со всеми ненулевыми элементами говорит нам, что все отдельные случайные величины взаимосвязаны. Это означает, что переменные не только напрямую связаны, но и косвенно связаны через другие переменные. Часто такие косвенные, синфазный корреляции банальны и неинтересны. Их можно подавить, вычислив частичную матрицу ковариаций, то есть часть матрицы ковариаций, которая показывает только интересную часть корреляций.

Если два вектора случайных величин и связаны через другой вектор , последние корреляции подавляются в матрице[6]

Матрица частичной ковариации эффективно представляет собой простую ковариационную матрицу как будто неинтересные случайные величины были постоянными.

Матрица ковариации как параметр распределения

Если вектор-столбец из возможно коррелированные случайные величины совместно нормально распределенные, или в более общем смысле эллиптически распределенный, то его функция плотности вероятности можно выразить через ковариационную матрицу следующим образом[6]

где и это детерминант из .

Матрица ковариации как линейный оператор

Применительно к одному вектору ковариационная матрица отображает линейную комбинацию c случайных величин Икс на вектор ковариаций с этими переменными: . Рассматривается как билинейная форма, он дает ковариацию между двумя линейными комбинациями: . Тогда дисперсия линейной комбинации равна , его ковариация с самим собой.

Точно так же (псевдо) обратная ковариационная матрица дает внутренний продукт , что вызывает Расстояние Махаланобиса, мера "маловероятности" c.[нужна цитата ]

Какие матрицы являются ковариационными матрицами?

Из тождества чуть выше, пусть быть действительный вектор, то

который всегда должен быть неотрицательным, так как это отклонение вещественной случайной величины, поэтому ковариационная матрица всегда положительно-полуопределенная матрица.

Приведенный выше аргумент можно расширить следующим образом:

И наоборот, каждая симметричная положительно полуопределенная матрица является ковариационной матрицей. Чтобы увидеть это, предположим это симметричная положительно-полуопределенная матрица. Из конечномерного случая спектральная теорема, следует, что имеет неотрицательную симметричную квадратный корень, который можно обозначить как M1/2. Позволять быть любым случайная величина со значением вектора-столбца, ковариационная матрица которой является единичная матрица. потом

Комплексные случайные векторы

Ковариационная матрица

В отклонение из сложный скалярный случайная величина с ожидаемым значением обычно определяется с использованием комплексное сопряжение:

где комплексное сопряжение комплексного числа обозначается ; таким образом, дисперсия сложной случайной величины является действительным числом.

Если вектор-столбец комплексных случайных величин, то сопряженный транспонировать формируется обе транспонирование и спряжение. В следующем выражении произведение вектора на сопряженное транспонирование приводит к квадратной матрице, называемой ковариационная матрица, как его ожидание:[7]:п. 293

,

где обозначает сопряженное транспонирование, которое применимо к скалярному случаю, поскольку транспонирование скаляра по-прежнему является скаляром. Полученная таким образом матрица будет Эрмитский положительно-полуопределенный,[8] с действительными числами на главной диагонали и комплексными числами вне диагонали.

Матрица псевдоковариации

Для сложных случайных векторов второй центральный момент другого вида, псевдоковариационная матрица (также называемая матрицей отношений) определяется следующим образом. В отличие от ковариационной матрицы, определенной выше, эрмитова транспозиция заменяется транспонированием в определении.

Характеристики

  • Ковариационная матрица - это Эрмитова матрица, т.е. .[1]:п. 179
  • Диагональные элементы ковариационной матрицы действительны.[1]:п. 179

Предварительный расчет

Если и сосредоточены матрицы данных измерения и соответственно, т.е. с п колонки наблюдений за п и q строки переменных, из которых были вычтены средние по строкам, тогда, если средние по строкам были оценены на основе данных, выборка ковариационных матриц и можно определить как

или, если средние строки были известны априори,

Эти эмпирические выборочные ковариационные матрицы являются наиболее простыми и наиболее часто используемыми оценщиками для ковариационных матриц, но существуют и другие оценщики, включая регуляризованные или усадочные оценщики, которые могут иметь лучшие свойства.

Приложения

Ковариационная матрица - полезный инструмент во многих различных областях. Из него матрица преобразования может быть получен, называемый отбеливающее преобразование, что позволяет полностью декоррелировать данные[нужна цитата ] или, с другой точки зрения, найти оптимальную основу для представления данных в компактном виде[нужна цитата ] (увидеть Фактор Рэлея для формального доказательства и дополнительных свойств ковариационных матриц). Анализ главных компонентов (PCA) и Преобразование Карунена – Лоэва (KL-преобразование).

Ковариационная матрица играет ключевую роль в финансовая экономика, особенно в теория портфеля и это теорема о разделении паевых инвестиционных фондов и в модель ценообразования основных средств. Матрица ковариаций доходности различных активов используется для определения, при определенных допущениях, относительных объемов различных активов, которые должны инвестировать (в нормативный анализ ) или прогнозируются (в положительный анализ ) выберите удержание в контексте диверсификация.

Ковариационное отображение

В ковариационное отображение ценности или Матрица строятся как 2-мерная карта. Когда векторы и дискретны случайные функции, карта показывает статистические связи между различными областями случайных функций. Статистически независимые области функций отображаются на карте как равнины с нулевым уровнем, а положительные или отрицательные корреляции отображаются, соответственно, как холмы или долины.

На практике векторы-столбцы , и приобретаются экспериментально как ряды образцы, например

где это я-ое дискретное значение в выборке j случайной функции . Ожидаемые значения, необходимые в ковариационной формуле, оцениваются с использованием выборочное среднее, например

а ковариационная матрица оценивается выборочная ковариация матрица

где угловые скобки обозначают усреднение выборки, как и раньше, за исключением того, что Поправка Бесселя следует сделать, чтобы избежать предвзятость. Используя эту оценку, частную матрицу ковариации можно рассчитать как

где обратная косая черта обозначает левое деление матрицы оператор, который обходит требование инвертировать матрицу и доступен в некоторых вычислительных пакетах, таких как Matlab.[9]

Рисунок 1: Построение частичной ковариационной карты N2 молекулы подвергаются кулоновскому взрыву, индуцированному лазером на свободных электронах.[10] Панели а и б сопоставьте два члена ковариационной матрицы, которая показана на панели c. Панель d отображает синфазные корреляции через флуктуации интенсивности лазера. Панель е отображает частичную матрицу ковариации, скорректированную на флуктуации интенсивности. Панель ж показывает, что 10% избыточная коррекция улучшает карту и делает ионно-ионные корреляции четко видимыми. Благодаря сохранению импульса эти корреляции выглядят как линии, приблизительно перпендикулярные линии автокорреляции (и периодическим модуляциям, вызываемым звоном детектора).

На рис. 1 показано, как строится частичная ковариационная карта на примере эксперимента, проведенного в ВСПЫШКА лазер на свободных электронах в Гамбурге.[10] Случайная функция это время полета спектр ионов из Кулоновский взрыв молекул азота многократно ионизируются лазерным импульсом. Поскольку за каждый лазерный импульс ионизируются всего несколько сотен молекул, однократные спектры сильно колеблются. Однако сбор обычно такие спектры, , и усредняя их по производит гладкий спектр , который показан красным внизу рис. 1. Средний спектр показывает несколько ионов азота в виде пиков, уширенных по их кинетической энергии, но для нахождения корреляций между стадиями ионизации и импульсами ионов необходимо вычислить ковариационную карту.

В примере на рис.1 спектры и такие же, за исключением того, что диапазон времени пролета отличается. Панель а показывает , панель б показывает и панель c показывает их различие, которое (обратите внимание на изменение цветовой шкалы). К сожалению, эта карта перегружена неинтересными синфазными корреляциями, вызванными колебаниями интенсивности лазера от кадра к кадру. Для подавления таких корреляций интенсивность лазера записывается при каждом выстреле, помещается в и рассчитывается как панели d и е Показать. Однако подавление неинтересных корреляций несовершенно, потому что существуют другие источники синфазных флуктуаций, кроме интенсивности лазера, и в принципе все эти источники следует контролировать в векторном виде. . Однако на практике часто бывает достаточно сверхкомпенсировать частичную коррекцию ковариации в виде панели ж показывает, где теперь отчетливо видны интересные корреляции импульсов ионов в виде прямых линий, центрированных на стадиях ионизации атомарного азота.

Двумерная инфракрасная спектроскопия

Двумерная инфракрасная спектроскопия использует корреляционный анализ для получения 2D-спектров конденсированная фаза. Есть две версии этого анализа: синхронный и асинхронный. Математически первый выражается в терминах выборочной ковариационной матрицы, а метод эквивалентен ковариационному отображению.[11]

Смотрите также

Рекомендации

  1. ^ а б c Парк, Кун Иль (2018). Основы вероятностных и случайных процессов с приложениями к коммуникациям. Springer. ISBN  978-3-319-68074-3.
  2. ^ Уильям Феллер (1971). Введение в теорию вероятностей и ее приложения. Вайли. ISBN  978-0-471-25709-7. Получено 10 августа 2012.
  3. ^ Вассерман, Ларри (2004). Вся статистика: краткий курс статистических выводов. ISBN  0-387-40272-1.
  4. ^ Табога, Марко (2010). «Лекции по теории вероятностей и математической статистике».
  5. ^ Итон, Моррис Л. (1983). Многомерная статистика: подход векторного пространства. Джон Уайли и сыновья. С. 116–117. ISBN  0-471-02776-6.
  6. ^ а б W J Krzanowski "Принципы многомерного анализа" (Oxford University Press, Нью-Йорк, 1988), гл. 14,4; К. В. Мардиа, Дж. Т. Кент и Дж. М. Бибби "Многомерный анализ (Academic Press, Лондон, 1997), глава 6.5.3; Т. В. Андерсон" Введение в многомерный статистический анализ "(Wiley, Нью-Йорк, 2003), 3-е изд., Главы 2.5.1 и 4.3.1.
  7. ^ Лапидот, Амос (2009). Фонд цифровых коммуникаций. Издательство Кембриджского университета. ISBN  978-0-521-19395-5.
  8. ^ Брукс, Майк. «Справочное руководство по матрице». Цитировать журнал требует | журнал = (Помогите)
  9. ^ LJ Frasinski "Методы отображения ковариации" J. Phys. Летучая мышь. Мол. Опт. Phys. 49 152004 (2016), открытый доступ
  10. ^ а б О. Корнилов, М. Экштейн, М. Розенблатт, К. П. Шульц, К. Мотомура, А. Рузе, Дж. Клей, Л. Фукар, М. Сиано, А. Любке, Ф. Шаппер, П. Джонссон, Д. М. П. Холланд, Т. Шлатхольтер, Т. Марченко, С. Дюстерер, К. Уэда, MJJ Vrakking и LJ Frasinski "Кулоновский взрыв двухатомных молекул в интенсивных XUV-полях, отображаемых с помощью частичной ковариации" J. Phys. Летучая мышь. Мол. Опт. Phys. 46 164028 (2013), открытый доступ
  11. ^ И Нода "Обобщенный метод двумерной корреляции, применимый к инфракрасной, рамановской и другим типам спектроскопии" Appl. Spectrosc. 47 1329–36 (1993)

дальнейшее чтение