Метод переназначения - Reassignment method

В способ переназначения это техника для заточки частотно-временное представление отображая данные в частотно-временные координаты, которые ближе к истинным регион поддержки анализируемого сигнала. Этот метод был независимо представлен несколькими сторонами под разными названиями, в том числеспособ переназначения, переназначение, частотно-временное переназначение, и модифицированный метод подвижного окна.[1] В случае спектрограмма или кратковременное преобразование Фурье, метод переназначения повышает резкость размытых частотно-временных данных за счет перемещения данных в соответствии с локальными оценками мгновенной частоты и групповой задержки. Это сопоставление с переназначенными частотно-временными координатами очень точно для сигналов, которые разделяются по времени и частоте относительно окна анализа.

Вступление

Переназначенная спектральная поверхность для начала акустического басового тона с резкой ощупью и основной частотой примерно 73,4 Гц. Очевидны резкие спектральные гребни, представляющие гармоники, как и резкое начало тона. Спектрограмма была рассчитана с использованием окна Кайзера 65,7 мс с параметром формирования 12.

Многие представляющие интерес сигналы имеют распределение энергии, которое изменяется во времени и по частоте. Например, любой звуковой сигнал, имеющий начало или конец, имеет распределение энергии, которое изменяется во времени, и большинство звуков демонстрируют значительные изменения как во времени, так и по частоте в течение их продолжительности. Временно-частотные представления обычно используются для анализа или характеристики таких сигналов. Они отображают одномерный сигнал во временной области в двумерную функцию времени и частоты. Частотно-временное представление описывает изменение спектрального распределения энергии во времени, так же как музыкальная партитура описывает изменение времени музыкального питчовера.

В анализе аудиосигнала спектрограмма является наиболее часто используемым частотно-временным представлением, вероятно, потому, что оно хорошо понимается и невосприимчиво к так называемым «перекрестным терминам», которые иногда затрудняют интерпретацию других частотно-временных представлений. Но оконная операция, необходимая при вычислении спектрограмм, вводит сомнительный компромисс между разрешением по времени и разрешением по частоте, поэтому спектрограммы обеспечивают представление время-частота, которое размыто во времени, по частоте или в обоих измерениях. Метод частотно-временного переназначения - это метод переориентации частотно-временных данных в размытом представлении, таком как спектрограмма, путем отображения данных на частотно-временные координаты, которые ближе к истинной области поддержки анализируемого сигнала.

Спектрограмма как частотно-временное представление

Одним из наиболее известных представлений время-частота является спектрограмма, определяемая как квадрат величины кратковременного преобразования Фурье. Хотя известно, что кратковременный фазовый спектр содержит важную временную информацию о сигнале, эту информацию трудно интерпретировать, поэтому обычно при краткосрочном спектральном анализе учитывается только кратковременный спектр величин.

В частотно-временном представлении спектрограмма имеет относительно низкое разрешение. Разрешение по времени и частоте зависит от выбора окна анализа, и большая концентрация в одной области сопровождается большим размытием в другой.

Частотно-временное представление с улучшенным разрешением по отношению к спектрограмме является Распределение Вигнера – Вилля, которое можно интерпретировать как кратковременное преобразование Фурье с оконной функцией, которая идеально согласована с сигналом. Распределение Вигнера – Вилля сильно сконцентрировано по времени и частоте, но также в значительной степени нелинейно и нелокально. Следовательно, это распределение очень чувствительно к шуму и генерирует перекрестные компоненты, которые часто маскируют интересующие компоненты, что затрудняет извлечение полезной информации, касающейся распределения энергии в многокомпонентных сигналах.

Класс Коэна Билинейные частотно-временные представления - это класс «сглаженных» распределений Вигнера – Вилля, использующих сглаживающее ядро, которое может снизить чувствительность распределения к шуму и подавить перекрестные компоненты за счет сглаживания распределения по времени и частоте. Это размытие приводит к тому, что распределение не равно нулю в областях, где истинное распределение Вигнера – Вилля не показывает энергии.

Спектрограмма является членом класса Коэна. Это сглаженное распределение Вигнера – Вилля со сглаживающим ядром, равным распределению Вигнера – Вилля в окне анализа. Метод переназначения сглаживает распределение Вигнера – Вилледа, но затем перефокусирует распределение обратно на истинные области поддержки компонентов сигнала. Было показано, что этот метод уменьшает время и частоту смазывания любого члена класса Коэна. [2].[3]В случае переназначенной спектрограммы кратковременный фазовый спектр используется для корректировки номинальных временных и частотных координат спектральных данных и отображения их ближе к истинным областям поддержки анализируемого сигнала.

Способ переназначения

Новаторская работа по методу переназначения была опубликована Кодерой, Гендрином и де Виллари под именем Модифицированный метод подвижного окна [4] Их метод увеличивает разрешение по времени и частоте классического метода движущегося окна (эквивалент спектрограммы), присваивая каждой точке данных новую частотно-временную координату, которая лучше отражает распределение энергии в анализируемом сигнале.

В классическом методе движущегося окна сигнал во временной области, раскладывается на набор коэффициентов, на основе набора элементарных сигналов, , определенный

куда является (действительным) функцией ядра нижних частот, как оконная функция в кратковременном преобразовании Фурье. Коэффициенты в этом разложении определяются

куда величина, а фаза , преобразование Фурье сигнала сдвинут во времени на и за окном .

может быть восстановлен из коэффициентов движущегося окна с помощью

Для сигналов с амплитудным спектром , чье изменение во времени происходит медленно по сравнению с изменением фазы, максимальный вклад в интеграл восстановления дает окрестность точки удовлетворяющее условию фазовой стационарности

или, что то же самое, вокруг точки определяется

Это явление известно в таких областях, как оптика, как принцип стационарной фазы, в котором говорится, что для периодических или квазипериодических сигналов изменение фазового спектра Фурье, не связанное с периодическими колебаниями, происходит медленно по времени в окрестности частоты колебаний, а в окружающих областях изменение происходит относительно быстро. Аналогично, для импульсных сигналов, которые сконцентрированы во времени, изменение фазового спектра происходит медленно по отношению к частоте около времени импульса, а в окружающих областях изменение происходит относительно быстро.

При восстановлении положительные и отрицательные вклады в синтезируемую форму волны нейтрализуются из-за деструктивной интерференции в частотных областях с быстрым изменением фазы. Только области медленного изменения фазы (стационарная фаза) будут вносить существенный вклад в реконструкцию, а максимальный вклад (центр тяжести) происходит в точке, где фаза изменяется наиболее медленно по времени и частоте.

Вычисленные таким образом частотно-временные координаты равны локальной групповой задержке, и местная мгновенная частота, и вычисляются из фазы кратковременного преобразования Фурье, которое обычно игнорируется при построении спектрограммы. Эти количества местный в том смысле, что они представляют обработанный окнами и отфильтрованный сигнал, локализованный по времени и частоте, и не являются глобальными свойствами анализируемого сигнала.

Модифицированный метод движущегося окна или метод переназначения изменяет (переназначает) точку атрибуции к этому моменту максимальный вклад , а не по делу при котором он вычисляется. Эту точку иногда называют центр гравитации распределения по аналогии с массовым распределением. Эта аналогия является полезным напоминанием о том, что отнесение спектральной энергии к центру тяжести ее распределения имеет смысл только тогда, когда есть энергия для атрибуции, поэтому метод переназначения не имеет смысла в точках, где спектрограмма имеет нулевое значение.

Эффективное вычисление переназначенных времен и частот

При цифровой обработке сигналов чаще всего выбирают временную и частотную области. Дискретное преобразование Фурье используется для вычисления выборок. преобразования Фурье по выборкам сигнала во временной области. Операции переназначения, предложенные Кодера и др. не может применяться непосредственно к дискретным данным кратковременного преобразования Фурье, поскольку частные производные не могут быть вычислены непосредственно на дискретных по времени и частоте данных, и было высказано предположение, что эта трудность была основным препятствием для более широкого использования метода переназначения.

Частные производные можно аппроксимировать с помощью конечных разностей. Например, фазовый спектр может быть оценен в два близких момента времени, а частная производная по времени может быть аппроксимирована как разница между двумя значениями, деленная на разницу во времени, как в

При достаточно малых значениях и и при условии, что разность фаз должным образом "развернута", этот метод конечных разностей дает хорошие приближения к частным производным фазы, потому что в областях спектра, в которых эволюция фазы преобладает за счет вращения из-за синусоидальных колебаний одиночный, близкий компонент, фаза является линейной функцией.

Независимо от Кодера и другие., Нельсон пришел к аналогичному методу для улучшения частотно-временной точности краткосрочных спектральных данных на основе частных производных краткосрочного фазового спектра.[5] Легко показать, что Нельсон поперечные спектральные поверхности вычислить приближение производных, эквивалентное методу конечных разностей.

Оже и Фландрин показали, что метод переназначения, предложенный в контексте спектрограммы Кодерой и др., Может быть распространен на любого члена группы. Класс Коэна частотно-временных представлений путем обобщения операций переназначения на

куда - распределение Вигнера – Вилля , и - функция ядра, определяющая распределение. Далее они описали эффективный метод эффективного и точного вычисления времен и частот для переназначенной спектрограммы без явного вычисления частных производных фазы.[2]

В случае спектрограммы операции переназначения могут быть вычислены с помощью

куда кратковременное преобразование Фурье, вычисленное с использованием окна анализа кратковременное преобразование Фурье, вычисленное с использованием окна взвешенного по времени анализа. и кратковременное преобразование Фурье, вычисленное с использованием окна анализа производной по времени .

Использование вспомогательных оконных функций и , операции переназначения могут быть вычислены в любой частотно-временной координате из алгебраической комбинации трех преобразований Фурье, вычисленных на . Поскольку эти алгоритмы работают только с кратковременными спектральными данными, оцениваемыми за один момент времени и с одной частотой, и не вычисляют явно какие-либо производные, это дает эффективный метод вычисления переназначенного дискретного кратковременного преобразования Фурье.

Одним из ограничений этого метода вычисления является то, что должно быть ненулевым. Это не является большим ограничением, поскольку сама операция переназначения подразумевает, что есть некоторая энергия для переназначения, и не имеет смысла, когда распределение имеет нулевое значение.

Отделимость

Кратковременное преобразование Фурье часто можно использовать для оценки амплитуд и фаз отдельных компонентов в многокомпонентный сигнал, например тон квазигармонического музыкального инструмента. Кроме того, операции переназначения времени и частоты могут использоваться для повышения четкости представления путем приписывания спектральной энергии, сообщаемой кратковременным преобразованием Фурье, точке, которая является локальным центром тяжести комплексного распределения энергии.

Для сигнала, состоящего из одного компонента, мгновенную частоту можно оценить по частным производным фазы любого канала с кратковременным преобразованием Фурье, который проходит через компонент. Если сигнал нужно разложить на множество компонентов,

и мгновенная частота каждого компонента определяется как производная его фазы по времени, то есть

тогда мгновенная частота каждого отдельного компонента может быть вычислена из фазы отклика фильтра, который пропускает этот компонент, при условии, что не более одного компонента находится в полосе пропускания фильтра.

Это свойство в частотной области, которое Нельсон назвал отделимость[5] и требуется для всех анализируемых сигналов. Если это свойство не выполняется, то желаемое многокомпонентное разложение не может быть достигнуто, потому что параметры отдельных компонентов не могут быть оценены с помощью кратковременного преобразования Фурье. В таких случаях необходимо выбрать другое окно анализа, чтобы выполнялся критерий разделимости.

Если компоненты сигнала разделяются по частоте относительно определенного окна краткосрочного спектрального анализа, то выходной сигнал каждого фильтра с кратковременным преобразованием Фурье представляет собой отфильтрованную версию, самое большее, одной доминанты (имеющей значительную энергию). составляющей, и, следовательно, производной по времени фазы равна производной по времени фазы доминирующего компонента при Следовательно, если компонент, имеющий мгновенную частоту является доминирующим компонентом в окрестности тогда мгновенная частота этого компонента может быть вычислена из фазы кратковременного преобразования Фурье, вычисленной при То есть,

Переназначенная спектрограмма с длинным окном слова «открытый», вычисленная с использованием окна Кайзера 54,4 мс с параметром формирования 9, подчеркивающим гармоники.
Переназначенная в коротком окне спектрограмма слова «открытый», вычисленная с использованием окна Кайзера 13,6 мс с параметром формирования 9, подчеркивая форманты и голосовые импульсы.

Так же, как каждый полосовой фильтр в наборе фильтров с кратковременным преобразованием Фурье может пропускать не более одной комплексной экспоненциальной составляющей, два временных события должны быть достаточно разделены во времени, чтобы они не лежали в одном и том же оконном сегменте входного сигнала. Это свойство разделяемости во временной области эквивалентно требованию, чтобы время между двумя событиями было больше, чем длина импульсной характеристики фильтров кратковременного преобразования Фурье, диапазон ненулевых отсчетов в

Как правило, для многокомпонентного сигнала существует бесконечное количество равнозначных разложений. Свойство отделимости необходимо рассматривать в контексте желаемой декомпозиции. Например, при анализе речевого сигнала окно анализа, длинное относительно времени между голосовыми импульсами, достаточно для разделения гармоник, но отдельные голосовые импульсы будут размыты, поскольку многие импульсы покрываются каждым окном (то есть , отдельные импульсы не разделимы по времени выбранным окном анализа). Окно анализа, которое намного короче, чем время между голосовыми импульсами, может разрешить голосовые импульсы, потому что ни одно окно не охватывает более одного импульса, но гармонические частоты размываются вместе, потому что главный лепесток спектра окна анализа шире, чем интервал между гармониками (то есть гармоники не разделяются по частоте выбранным окном анализа).

Рекомендации

  1. ^ Хейнсворт, Стивен (2003). «Глава 3: Методы переназначения». Методы автоматического анализа музыкального звука (Кандидат наук). Кембриджский университет. CiteSeerX  10.1.1.5.9579.
  2. ^ а б Ф. Огер и П. Фландрин (май 1995 г.). «Повышение читабельности частотно-временных и масштабных представлений методом переназначения». Транзакции IEEE при обработке сигналов. 43 (5): 1068–1089. Bibcode:1995ITSP ... 43.1068A. CiteSeerX  10.1.1.646.794. Дои:10.1109/78.382394.
  3. ^ П. Фландрин, Ф. Оже, Э. Шассанд-Моттен, Переназначение частоты и времени: от принципов к алгоритмам, в Приложениях в частотно-временной обработке сигналов (А. Папандреу-Супаппола, ред.), гл. 5. С. 179 - 203, CRC Press, 2003.
  4. ^ К. Кодера; Р. Гендрин и К. де Виллари (февраль 1978 г.). «Анализ изменяющихся во времени сигналов с небольшими значениями BT». Транзакции IEEE по акустике, речи и обработке сигналов. 26 (1): 64–76. Дои:10.1109 / ТАССП.1978.1163047.
  5. ^ а б Д. Дж. Нельсон (ноябрь 2001 г.). «Кросс-спектральные методы обработки речи». Журнал Акустического общества Америки. 110 (5): 2575–2592. Bibcode:2001ASAJ..110.2575N. Дои:10.1121/1.1402616. PMID  11757947.

дальнейшее чтение

  • С. А. Фулоп и К. Фитц, Спектрограмма двадцать первого века, Акустика сегодня, т. 2, вып. 3. С. 26–33, 2006.
  • С. А. Фулоп и К. Фитц, Алгоритмы вычисления скорректированной по времени мгновенной частотной (переназначенной) спектрограммы с приложениями, Журнал Акустического общества Америки, вып. 119, стр. 360 - 371, январь 2006 г.

внешняя ссылка