Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Метод переназначения представляет собой метод для заточки частотно-временного представления пути отображения данных в координаты времени-частоте, которые ближе к истинной области поддержки анализируемого сигнала. Метод был независимо представлен несколькими сторонами под разными именами, включая метод переназначения , переназначение , переназначение частоты и времени и модифицированный метод движущегося окна . [1] В случае спектрограммы или кратковременного преобразования Фурье, метод переназначения повышает резкость размытых частотно-временных данных путем перемещения данных в соответствии с локальными оценками мгновенной частоты и групповой задержки. Это сопоставление с переназначенными частотно-временными координатами очень точно для сигналов, которые разделяются по времени и частоте относительно окна анализа.

Введение [ править ]

Переназначенная спектральная поверхность для начала акустического басового тона с резкой ощупью и основной частотой примерно 73,4 Гц. Четкие спектральные гребни, представляющие гармоники, очевидны, как и резкое начало тона. Спектрограмма была рассчитана с использованием окна Кайзера 65,7 мс с параметром формирования 12.

Многие представляющие интерес сигналы имеют распределение энергии, которое изменяется во времени и по частоте. Например, любой звуковой сигнал, имеющий начало или конец, имеет распределение энергии, которое изменяется во времени, и большинство звуков демонстрируют значительные изменения как во времени, так и по частоте в течение своей продолжительности. Частотно-временные представления обычно используются для анализа или характеристики таких сигналов. Они отображают одномерный сигнал во временной области в двумерную функцию времени и частоты. Частотно-временное представление описывает изменение распределения спектральной энергии во времени, так же как музыкальная партитура описывает изменение музыкального тона во времени.

При анализе аудиосигнала спектрограмма является наиболее часто используемым частотно-временным представлением, вероятно, потому, что оно хорошо понимается и невосприимчиво к так называемым «перекрестным терминам», которые иногда затрудняют интерпретацию других частотно-временных представлений. Но операция управления окнами, необходимая при вычислении спектрограммы, вводит сомнительный компромисс между разрешением по времени и разрешением по частоте, поэтому спектрограммы обеспечивают представление время-частота, которое размыто во времени, по частоте или в обоих измерениях. Метод частотно-временного переназначения - это метод переориентации частотно-временных данных в размытом представлении, таком как спектрограмма, путем преобразования данных в частотно-временные координаты, которые ближе к истинной области поддержки анализируемого сигнала.

Спектрограмма как частотно-временное представление [ править ]

Одним из наиболее известных частотно-временных представлений является спектрограмма, определяемая как квадрат величины кратковременного преобразования Фурье. Хотя известно, что кратковременный фазовый спектр содержит важную временную информацию о сигнале, эту информацию трудно интерпретировать, поэтому обычно в краткосрочном спектральном анализе учитывается только кратковременный спектр амплитуды.

В частотно-временном представлении спектрограмма имеет относительно низкое разрешение. Разрешение по времени и частоте определяется выбором окна анализа, и большая концентрация в одной области сопровождается большим размытием в другой.

Частотно-временным представлением с улучшенным разрешением относительно спектрограммы является распределение Вигнера – Вилля , которое можно интерпретировать как кратковременное преобразование Фурье с оконной функцией, которая идеально согласована с сигналом. Распределение Вигнера – Вилля сильно сконцентрировано по времени и частоте, но также сильно нелинейно и нелокально. Следовательно, это распределение очень чувствительно к шуму и генерирует перекрестные компоненты, которые часто маскируют интересующие компоненты, что затрудняет извлечение полезной информации, касающейся распределения энергии в многокомпонентных сигналах.

Класс Коэна билинейных частотно-временных представлений - это класс «сглаженных» распределений Вигнера – Вилля, использующих сглаживающее ядро, которое может снизить чувствительность распределения к шуму и подавить перекрестные компоненты за счет размытия распределения по времени и частоте. . Это размытие приводит к тому, что распределение не равно нулю в областях, где истинное распределение Вигнера – Вилля не показывает энергии.

Спектрограмма является членом класса Коэна. Это сглаженное распределение Вигнера – Вилля с ядром сглаживания, равным распределению Вигнера – Вилля окна анализа. Метод переназначения сглаживает распределение Вигнера – Вилля, но затем перефокусирует распределение обратно на истинные области поддержки компонентов сигнала. Было показано, что этот метод уменьшает время и частоту смазывания любого члена класса Коэна [2] . [3] В случае переназначенной спектрограммы кратковременный фазовый спектр используется для корректировки номинальных временных и частотных координат спектральных данных и отображения их ближе к истинным областям поддержки анализируемого сигнала.

Способ переназначения [ править ]

Новаторская работа по методу переназначения была опубликована Кодерой, Гендрином и де Виллари под названием « Модифицированный метод движущегося окна» [4]. Их метод увеличивает разрешение во времени и частоте классического метода движущегося окна (эквивалент спектрограммы) за счет присвоение каждой точке данных новой частотно-временной координаты, которая лучше отражает распределение энергии в анализируемом сигнале.

В классическом методе движущегося окна сигнал во временной области раскладывается на набор коэффициентов на основе набора элементарных сигналов , определенных

где - (действительная) функция ядра нижних частот, подобная оконной функции в кратковременном преобразовании Фурье. Коэффициенты в этом разложении определяются

где - величина и фаза преобразования Фурье сигнала, сдвинутого во времени на и оконного на .

может быть восстановлен из коэффициентов движущегося окна с помощью

Для сигналов, имеющих амплитудные спектры , изменение во времени которых происходит медленно по сравнению с изменением фазы, максимальный вклад в интеграл восстановления вносит окрестность точки, удовлетворяющей условию фазовой стационарности

или, что то же самое, вокруг точки, определяемой

Это явление известно в таких областях, как оптика, как принцип стационарной фазы , который гласит, что для периодических или квазипериодических сигналов изменение фазового спектра Фурье, не связанное с периодическими колебаниями, происходит медленно по времени в окрестности частота колебаний, а в окружающих областях изменение относительно быстрое. Аналогично, для импульсных сигналов, которые сконцентрированы во времени, изменение фазового спектра происходит медленно по отношению к частоте около времени импульса, а в окружающих областях изменение происходит относительно быстро.

При восстановлении положительные и отрицательные вклады в синтезируемую форму волны нейтрализуются из-за деструктивной интерференции в частотных областях быстрого изменения фазы. Только области медленного изменения фазы (стационарная фаза) будут вносить существенный вклад в реконструкцию, а максимальный вклад (центр тяжести) происходит в точке, где фаза изменяется наиболее медленно по времени и частоте.

Вычисленные таким образом частотно-временные координаты равны локальной групповой задержке и локальной мгновенной частоте и вычисляются из фазы кратковременного преобразования Фурье, которое обычно игнорируется при построении спектрограммы. Эти величины являются локальными в том смысле, что они представляют собой обработанный окнами и отфильтрованный сигнал, который локализован по времени и частоте, и не являются глобальными свойствами анализируемого сигнала.

Модифицированный метод движущегося окна или метод переназначения изменяет (переназначает) точку отнесения к этой точке максимального вклада , а не к точке, в которой он вычисляется. Эту точку иногда называют центром тяжести распределения по аналогии с распределением масс. Эта аналогия является полезным напоминанием о том, что отнесение спектральной энергии к центру тяжести ее распределения имеет смысл только тогда, когда есть энергия для атрибуции, поэтому метод переназначения не имеет смысла в точках, где спектрограмма имеет нулевое значение.

Эффективное вычисление переназначенного времени и частоты [ править ]

При цифровой обработке сигналов чаще всего выбирают временную и частотную области. Дискретное преобразование Фурье используется для вычисления отсчетов преобразования Фурье из отсчетов сигнала во временной области. Операции переназначения, предложенные Кодера и др. не могут быть применены непосредственно к дискретным данным кратковременного преобразования Фурье, потому что частные производные не могут быть вычислены непосредственно на данных, дискретных по времени и частоте, и было высказано предположение, что эта трудность была основным препятствием для более широкого использования метода переназначения.

Частные производные можно аппроксимировать с помощью конечных разностей. Например, фазовый спектр может быть оценен в два близких момента времени, а частная производная по времени может быть аппроксимирована как разница между двумя значениями, деленная на разницу во времени, как в

Для достаточно малых значений и и при условии, что разность фаз соответствующим образом «развернута», этот метод конечных разностей дает хорошие приближения к частным производным фазы, поскольку в областях спектра, в которых эволюция фазы преобладает за счет вращения из-за синусоидального колебания одного соседнего компонента фаза является линейной функцией.

Независимо от Kodera et al. , Нельсон пришел к аналогичному методу для улучшения частотно-временной точности кратковременных спектральных данных из частных производных от кратковременного фазового спектра. [5] Легко показать, что поперечные спектральные поверхности Нельсона вычисляют приближение производных, что эквивалентно методу конечных разностей.

Оже и Фландрин показали, что метод переназначения, предложенный в контексте спектрограммы Кодерой и др., Может быть расширен на любой член класса частотно-временных представлений Коэна путем обобщения операций переназначения на

где - распределение Вигнера – Вилля , а - функция ядра, определяющая распределение. Они также описали эффективный метод для эффективного и точного вычисления времен и частот для переназначенной спектрограммы без явного вычисления частных производных фазы. [2]

В случае спектрограммы операции переназначения могут быть вычислены с помощью

где - кратковременное преобразование Фурье, вычисленное с использованием окна анализа, - кратковременное преобразование Фурье, вычисленное с использованием окна взвешенного по времени анализа, и - кратковременное преобразование Фурье, вычисленное с использованием окна анализа производной по времени .

Используя вспомогательные оконные функции и , операции переназначения могут быть вычислены в любой координате время-частота из алгебраической комбинации трех преобразований Фурье, вычисленных в . Поскольку эти алгоритмы работают только с кратковременными спектральными данными, оцениваемыми за одно время и с одной частотой, и не вычисляют явно какие-либо производные, это дает эффективный метод вычисления переназначенного дискретного кратковременного преобразования Фурье.

Одним из ограничений этого метода вычисления является то, что он должен быть ненулевым. Это не является большим ограничением, поскольку сама операция переназначения подразумевает, что есть некоторая энергия для переназначения, и не имеет смысла, когда распределение имеет нулевое значение.

Разделимость [ править ]

Кратковременное преобразование Фурье часто можно использовать для оценки амплитуд и фаз отдельных компонентов в многокомпонентном сигнале, таком как квазигармонический тон музыкального инструмента. Более того, операции переназначения времени и частоты могут использоваться для повышения четкости представления путем приписывания спектральной энергии, сообщаемой кратковременным преобразованием Фурье, точке, которая является локальным центром тяжести комплексного распределения энергии.

Для сигнала, состоящего из одного компонента, мгновенную частоту можно оценить по частным производным фазы любого канала с кратковременным преобразованием Фурье, который проходит через компонент. Если сигнал нужно разложить на множество компонентов,

и мгновенная частота каждого компонента определяется как производная его фазы по времени, то есть

тогда мгновенная частота каждого отдельного компонента может быть вычислена из фазы отклика фильтра, который пропускает этот компонент, при условии, что не более одного компонента находится в полосе пропускания фильтра.

Это свойство в частотной области, которое Нельсон назвал разделимостью [5], требуется для всех сигналов, анализируемых таким образом. Если это свойство не соблюдается, то желаемое многокомпонентное разложение не может быть достигнуто, поскольку параметры отдельных компонентов не могут быть оценены с помощью кратковременного преобразования Фурье. В таких случаях необходимо выбрать другое окно анализа, чтобы выполнялся критерий разделимости.

Если компоненты сигнала разделяются по частоте относительно конкретного окна краткосрочного спектрального анализа, то выходной сигнал каждого фильтра с кратковременным преобразованием Фурье представляет собой отфильтрованную версию, самое большее, одной доминанты (имеющей значительную энергию). составляющая, и, таким образом, производная по времени фазы равна производной по времени фазы доминирующего компонента при Таким образом, если компонент, имеющий мгновенную частоту, является доминирующим компонентом в Вблизи этого значения мгновенная частота этого компонента может быть вычислена из фазы кратковременного преобразования Фурье, вычисленной в То есть,

Переназначенная спектрограмма с длинным окном слова «открытый», вычисленная с использованием окна Кайзера 54,4 мс с параметром формирования 9, подчеркивающим гармоники.
Переназначенная в коротком окне спектрограмма слова «открытый», вычисленная с использованием окна Кайзера 13,6 мс с параметром формирования 9, с акцентом на форманты и голосовые импульсы.

Так же, как каждый полосовой фильтр в наборе фильтров с кратковременным преобразованием Фурье может пропускать не более одной комплексной экспоненциальной составляющей, два временных события должны быть достаточно разделены во времени, чтобы они не лежали в одном и том же оконном сегменте входного сигнала. Это свойство разделяемости во временной области эквивалентно требованию, чтобы время между двумя событиями было больше, чем длина импульсной характеристики фильтров кратковременного преобразования Фурье, диапазон ненулевых отсчетов в

Как правило, для многокомпонентного сигнала существует бесконечное количество равнозначных разложений. Свойство отделимости необходимо рассматривать в контексте желаемой декомпозиции. Например, при анализе речевого сигнала окно анализа, длинное относительно времени между голосовыми импульсами, достаточно для разделения гармоник, но отдельные голосовые импульсы будут размыты, потому что многие импульсы покрываются каждым окном (то есть , отдельные импульсы не разделимы по времени выбранным окном анализа). Окно анализа, которое намного короче, чем время между голосовыми импульсами, может разрешить голосовые импульсы, потому что ни одно окно не охватывает более одного импульса, но гармонические частоты размываются вместе, потому что главный лепесток спектра окна анализа шире, чем интервал между гармониками (то естьгармоники не разделимы по частоте выбранным окном анализа).

Ссылки [ править ]

  1. ^ Хейнсворт, Стивен (2003). «Глава 3: Методы переназначения». Методы автоматизированного анализа музыкального звука (PhD). Кембриджский университет. CiteSeerX  10.1.1.5.9579 .
  2. ^ a b F. Auger & P. ​​Flandrin (май 1995 г.). «Повышение читаемости частотно-временных и масштабных представлений методом переназначения». Транзакции IEEE по обработке сигналов . 43 (5): 1068–1089. Bibcode : 1995ITSP ... 43.1068A . CiteSeerX 10.1.1.646.794 . DOI : 10.1109 / 78.382394 . 
  3. ^ П. Фландрин, Ф. Оже и Э. Чассанд-Моттин, Переназначение частоты и времени: от принципов к алгоритмам , в Приложениях в обработке частотно-временных сигналов (А. Папандреу-Супаппола, ред.), Гл. 5. С. 179 - 203, CRC Press, 2003.
  4. ^ К. Кодера; Р. Гендрин и К. де Виллари (февраль 1978 г.). «Анализ изменяющихся во времени сигналов с небольшими значениями BT». Транзакции IEEE по акустике, речи и обработке сигналов . 26 (1): 64–76. DOI : 10,1109 / TASSP.1978.1163047 .
  5. ^ a b Д. Дж. Нельсон (ноябрь 2001 г.). «Кросс-спектральные методы обработки речи». Журнал Акустического общества Америки . 110 (5): 2575–2592. Bibcode : 2001ASAJ..110.2575N . DOI : 10.1121 / 1.1402616 . PMID 11757947 . 

Дальнейшее чтение [ править ]

  • С. А. Фулоп и К. Фитц, Спектрограмма двадцать первого века , Acoustics Today, vol. 2, вып. 3. С. 26–33, 2006.
  • С. А. Фулоп и К. Фитц, Алгоритмы для вычисления скорректированной по времени спектрограммы мгновенной частоты (переназначенной), с приложениями , Журнал Акустического общества Америки, вып. 119, стр. 360 - 371, январь 2006 г.

Внешние ссылки [ править ]

  • TFTB - Панель инструментов "Время-частота"
  • SPEAR - Синусоидальный анализ частичного редактирования и ресинтез
  • Loris - программное обеспечение с открытым исходным кодом для моделирования и морфинга звука
  • SRA - веб-инструмент исследования спектрального анализа и анализа шероховатости звуковых сигналов (при поддержке гранта Северо-Западного академического вычислительного консорциума Дж. Миддлтон, Университет Восточного Вашингтона)
  • Редкие частотно-временные представления - PNAS