Образцы точек из двумерное распределение Гаусса со стандартным отклонением 3 примерно в нижнем левом и верхнем правом направлении и 1 в ортогональном направлении. Поскольку Икс и у компоненты взаимозависимы, дисперсия и не описывают полностью раздачу. А необходима ковариационная матрица; направления стрелок соответствуют собственные векторы этой ковариационной матрицы и их длины к квадратным корням из собственные значения.
В теория вероятности и статистика, а ковариационная матрица (также известен как матрица автоковариации, матрица дисперсии, матрица отклонений, или же матрица дисперсии-ковариации) представляет собой квадрат матрица давая ковариация между каждой парой элементов данного случайный вектор. Любая ковариационная матрица симметричный и положительный полуопределенный а его главная диагональ содержит отклонения (т.е. ковариация каждого элемента с самим собой).
Интуитивно ковариационная матрица обобщает понятие дисперсии на несколько измерений. Например, вариацию набора случайных точек в двумерном пространстве нельзя полностью охарактеризовать одним числом, равно как и вариации в и направления содержат всю необходимую информацию; а матрица необходима для полной характеристики двумерной вариации.
Ковариационная матрица случайного вектора обычно обозначается или .
В этой статье полужирным шрифтом без подписи и используются для обозначения случайных векторов, а нижний индекс выделен жирным шрифтом. и используются для обозначения скалярных случайных величин.
где оператор обозначает ожидаемое значение (среднее значение) своего аргумента.
Другими словами,
Приведенное выше определение эквивалентно матричному равенству
(Уравнение 1)
где .
Обобщение дисперсии
Эта форма (Уравнение 1) можно рассматривать как обобщение скалярнозначных отклонение в более высокие измерения. Помните, что для случайной величины со скалярным знаком
В самом деле, элементы на диагонали автоковариационной матрицы - дисперсии каждого элемента вектора .
Противоречивые номенклатуры и обозначения
Номенклатуры различаются. Некоторые статистики, вслед за вероятностником Уильям Феллер в его двухтомной книге Введение в теорию вероятностей и ее приложения,[2] назовите матрицу то отклонение случайного вектора , потому что это естественное обобщение одномерной дисперсии на более высокие измерения. Другие называют это ковариационная матрица, поскольку это матрица ковариаций между скалярными компонентами вектора .
Обе формы вполне стандартные, и между ними нет никакой двусмысленности. Матрица также часто называют ковариационная матрица, поскольку диагональные члены на самом деле являются дисперсиями.
Сущностью, тесно связанной с ковариационной матрицей, является матрица Коэффициенты корреляции произведение-момент Пирсона между каждой из случайных величин в случайном векторе , который можно записать как
Каждый элемент на главной диагонали корреляционной матрицы - это корреляция случайной величины с самим собой, которая всегда равна 1. Каждый недиагональный элемент составляет от -1 до +1 включительно.
Обратная матрица ковариации
Обратная матрица, , если он существует, является обратной ковариационной матрицей, также известной как матрица концентрации или точность матрица.[3]
Основные свойства
За и , где это -мерная случайная величина, применяются следующие основные свойства:[4]
Матрица известна как матрица регресс коэффициентов, а в линейной алгебре это Дополнение Шура из в .
Матрица коэффициентов регрессии часто может быть представлена в транспонированной форме, , подходит для постмножения вектора-строки независимых переменных вместо предварительного умножения вектора-столбца . В таком виде они соответствуют коэффициентам, полученным путем обращения матрицы нормальные уравнения из обыкновенный метод наименьших квадратов (OLS).
Матрица частичной ковариации
Ковариационная матрица со всеми ненулевыми элементами говорит нам, что все отдельные случайные величины взаимосвязаны. Это означает, что переменные не только напрямую связаны, но и косвенно связаны через другие переменные. Часто такие косвенные, синфазный корреляции банальны и неинтересны. Их можно подавить, вычислив частичную матрицу ковариаций, то есть часть матрицы ковариаций, которая показывает только интересную часть корреляций.
Если два вектора случайных величин и связаны через другой вектор , последние корреляции подавляются в матрице[6]
Матрица частичной ковариации эффективно представляет собой простую ковариационную матрицу как будто неинтересные случайные величины были постоянными.
Применительно к одному вектору ковариационная матрица отображает линейную комбинацию c случайных величин Икс на вектор ковариаций с этими переменными: . Рассматривается как билинейная форма, он дает ковариацию между двумя линейными комбинациями: . Тогда дисперсия линейной комбинации равна , его ковариация с самим собой.
Точно так же (псевдо) обратная ковариационная матрица дает внутренний продукт , что вызывает Расстояние Махаланобиса, мера "маловероятности" c.[нужна цитата ]
Какие матрицы являются ковариационными матрицами?
Из тождества чуть выше, пусть быть действительный вектор, то
Приведенный выше аргумент можно расширить следующим образом:
И наоборот, каждая симметричная положительно полуопределенная матрица является ковариационной матрицей. Чтобы увидеть это, предположим это симметричная положительно-полуопределенная матрица. Из конечномерного случая спектральная теорема, следует, что имеет неотрицательную симметричную квадратный корень, который можно обозначить как M1/2. Позволять быть любым случайная величина со значением вектора-столбца, ковариационная матрица которой является единичная матрица. потом
где комплексное сопряжение комплексного числа обозначается ; таким образом, дисперсия сложной случайной величины является действительным числом.
Если вектор-столбец комплексных случайных величин, то сопряженный транспонировать формируется обе транспонирование и спряжение. В следующем выражении произведение вектора на сопряженное транспонирование приводит к квадратной матрице, называемой ковариационная матрица, как его ожидание:[7]:п. 293
,
где обозначает сопряженное транспонирование, которое применимо к скалярному случаю, поскольку транспонирование скаляра по-прежнему является скаляром. Полученная таким образом матрица будет Эрмитскийположительно-полуопределенный,[8] с действительными числами на главной диагонали и комплексными числами вне диагонали.
Матрица псевдоковариации
Для сложных случайных векторов второй центральный момент другого вида, псевдоковариационная матрица (также называемая матрицей отношений) определяется следующим образом. В отличие от ковариационной матрицы, определенной выше, эрмитова транспозиция заменяется транспонированием в определении.
Если и сосредоточены матрицы данных измерения и соответственно, т.е. с п колонки наблюдений за п и q строки переменных, из которых были вычтены средние по строкам, тогда, если средние по строкам были оценены на основе данных, выборка ковариационных матриц и можно определить как
или, если средние строки были известны априори,
Эти эмпирические выборочные ковариационные матрицы являются наиболее простыми и наиболее часто используемыми оценщиками для ковариационных матриц, но существуют и другие оценщики, включая регуляризованные или усадочные оценщики, которые могут иметь лучшие свойства.
В ковариационное отображение ценности или Матрица строятся как 2-мерная карта. Когда векторы и дискретны случайные функции, карта показывает статистические связи между различными областями случайных функций. Статистически независимые области функций отображаются на карте как равнины с нулевым уровнем, а положительные или отрицательные корреляции отображаются, соответственно, как холмы или долины.
На практике векторы-столбцы , и приобретаются экспериментально как ряды образцы, например
где это я-ое дискретное значение в выборке j случайной функции . Ожидаемые значения, необходимые в ковариационной формуле, оцениваются с использованием выборочное среднее, например
где угловые скобки обозначают усреднение выборки, как и раньше, за исключением того, что Поправка Бесселя следует сделать, чтобы избежать предвзятость. Используя эту оценку, частную матрицу ковариации можно рассчитать как
где обратная косая черта обозначает левое деление матрицы оператор, который обходит требование инвертировать матрицу и доступен в некоторых вычислительных пакетах, таких как Matlab.[9]
Рисунок 1: Построение частичной ковариационной карты N2 молекулы подвергаются кулоновскому взрыву, индуцированному лазером на свободных электронах.[10] Панели а и б сопоставьте два члена ковариационной матрицы, которая показана на панели c. Панель d отображает синфазные корреляции через флуктуации интенсивности лазера. Панель е отображает частичную матрицу ковариации, скорректированную на флуктуации интенсивности. Панель ж показывает, что 10% избыточная коррекция улучшает карту и делает ионно-ионные корреляции четко видимыми. Благодаря сохранению импульса эти корреляции выглядят как линии, приблизительно перпендикулярные линии автокорреляции (и периодическим модуляциям, вызываемым звоном детектора).
На рис. 1 показано, как строится частичная ковариационная карта на примере эксперимента, проведенного в ВСПЫШКАлазер на свободных электронах в Гамбурге.[10] Случайная функция это время полета спектр ионов из Кулоновский взрыв молекул азота многократно ионизируются лазерным импульсом. Поскольку за каждый лазерный импульс ионизируются всего несколько сотен молекул, однократные спектры сильно колеблются. Однако сбор обычно такие спектры, , и усредняя их по производит гладкий спектр , который показан красным внизу рис. 1. Средний спектр показывает несколько ионов азота в виде пиков, уширенных по их кинетической энергии, но для нахождения корреляций между стадиями ионизации и импульсами ионов необходимо вычислить ковариационную карту.
В примере на рис.1 спектры и такие же, за исключением того, что диапазон времени пролета отличается. Панель а показывает , панель б показывает и панель c показывает их различие, которое (обратите внимание на изменение цветовой шкалы). К сожалению, эта карта перегружена неинтересными синфазными корреляциями, вызванными колебаниями интенсивности лазера от кадра к кадру. Для подавления таких корреляций интенсивность лазера записывается при каждом выстреле, помещается в и рассчитывается как панели d и е Показать. Однако подавление неинтересных корреляций несовершенно, потому что существуют другие источники синфазных флуктуаций, кроме интенсивности лазера, и в принципе все эти источники следует контролировать в векторном виде. . Однако на практике часто бывает достаточно сверхкомпенсировать частичную коррекцию ковариации в виде панели ж показывает, где теперь отчетливо видны интересные корреляции импульсов ионов в виде прямых линий, центрированных на стадиях ионизации атомарного азота.
Двумерная инфракрасная спектроскопия
Двумерная инфракрасная спектроскопия использует корреляционный анализ для получения 2D-спектров конденсированная фаза. Есть две версии этого анализа: синхронный и асинхронный. Математически первый выражается в терминах выборочной ковариационной матрицы, а метод эквивалентен ковариационному отображению.[11]
^Итон, Моррис Л. (1983). Многомерная статистика: подход векторного пространства. Джон Уайли и сыновья. С. 116–117. ISBN0-471-02776-6.
^ абW J Krzanowski "Принципы многомерного анализа" (Oxford University Press, Нью-Йорк, 1988), гл. 14,4; К. В. Мардиа, Дж. Т. Кент и Дж. М. Бибби "Многомерный анализ (Academic Press, Лондон, 1997), глава 6.5.3; Т. В. Андерсон" Введение в многомерный статистический анализ "(Wiley, Нью-Йорк, 2003), 3-е изд., Главы 2.5.1 и 4.3.1.
^Лапидот, Амос (2009). Фонд цифровых коммуникаций. Издательство Кембриджского университета. ISBN978-0-521-19395-5.
^LJ Frasinski "Методы отображения ковариации" J. Phys. Летучая мышь. Мол. Опт. Phys.49 152004 (2016), открытый доступ
^ абО. Корнилов, М. Экштейн, М. Розенблатт, К. П. Шульц, К. Мотомура, А. Рузе, Дж. Клей, Л. Фукар, М. Сиано, А. Любке, Ф. Шаппер, П. Джонссон, Д. М. П. Холланд, Т. Шлатхольтер, Т. Марченко, С. Дюстерер, К. Уэда, MJJ Vrakking и LJ Frasinski "Кулоновский взрыв двухатомных молекул в интенсивных XUV-полях, отображаемых с помощью частичной ковариации" J. Phys. Летучая мышь. Мол. Опт. Phys.46 164028 (2013), открытый доступ
^И Нода "Обобщенный метод двумерной корреляции, применимый к инфракрасной, рамановской и другим типам спектроскопии" Appl. Spectrosc.47 1329–36 (1993)