Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В математике и обработке сигналов преобразование с постоянной добротностью , известное как CQT, преобразует ряд данных в частотную область. Он связан с преобразованием Фурье [1] и очень тесно связан с комплексным вейвлет- преобразованием Морле . [2]

Преобразование можно представить себе как серию фильтров f k , логарифмически разнесенных по частоте, с k -м фильтром, имеющим спектральную ширину δf k, кратную ширине предыдущего фильтра:

где δf k - ширина полосы k -го фильтра, f min - центральная частота самого нижнего фильтра, а n - количество фильтров на октаву .

Расчет [ править ]

Короткое время преобразования Фурье от й [ п ] для кадра сдвигается образец м вычисляется следующим образом :

Учитывая серию данных с частотой дискретизации f s = 1 / T , где T - период дискретизации наших данных, для каждого частотного интервала мы можем определить следующее:

  • Ширина фильтра, δf k .
  • Q , «добротность»:
Ниже показано целое число циклов, обработанных на центральной частоте f k . Таким образом, это в некоторой степени определяет временную сложность преобразования.
  • Длина окна для k-го бункера:
Поскольку f s / f k - это количество выборок, обрабатываемых за цикл на частоте f k , Q - это количество целочисленных циклов, обрабатываемых на этой центральной частоте.

Эквивалентное ядро ​​преобразования можно найти с помощью следующих замен:

  • Длина окна каждого бункера теперь зависит от номера бункера:
  • Относительная мощность каждого бина будет уменьшаться на более высоких частотах, поскольку они суммируются по меньшему количеству членов. Чтобы компенсировать это, мы нормализуем на N [ k ].
  • Любая оконная функция будет функцией длины окна, а также функцией номера окна. Например, эквивалентное окно Хэмминга будет
  • Наша цифровая частота ,, становится .

После этих модификаций мы остаемся с

Быстрый расчет [ править ]

Прямое вычисление преобразования постоянной добротности происходит медленно по сравнению с быстрым преобразованием Фурье (БПФ). Однако само БПФ может использоваться вместе с использованием ядра для выполнения эквивалентных вычислений, но намного быстрее. [3] Примерный вариант, обратный такой реализации, был предложен в 2006 году; он работает, возвращаясь к DFT, и подходит только для инструментов высоты тона. [4]

Развитие этого метода с улучшенной инвертируемостью включает выполнение CQT (через БПФ) октавно за октавой с использованием результатов фильтрации нижних частот и субдискретизации для последовательно более низких частот. [5] Реализации этого метода включают реализацию MATLAB и реализацию Python LibROSA. [6] LibROSA комбинирует метод субдискретизации с прямым методом БПФ (который она называет «псевдо-CQT») за счет того, что последний обрабатывает более высокие частоты в целом. [6]

Скольжения ДПФ может быть использован для более быстрого вычисления постоянной Q-преобразования, так как скольжение ДПФ не должен быть расстоянием между линейной частотой и одинаковым размером окна в бункер. [7]

Сравнение с преобразованием Фурье [ править ]

В общем, преобразование хорошо подходит для музыкальных данных, и это можно увидеть в некоторых его преимуществах по сравнению с быстрым преобразованием Фурье. Поскольку выходной сигнал преобразования представляет собой эффективную зависимость амплитуды / фазы от логарифмической частоты, требуется меньшее количество элементов разрешения по частоте для эффективного покрытия заданного диапазона, и это оказывается полезным, когда частоты охватывают несколько октав. Поскольку диапазон человеческого слуха охватывает примерно десять октав от 20 Гц до примерно 20 кГц, такое сокращение выходных данных является значительным.

Преобразование демонстрирует снижение разрешения по частоте с увеличением разрешения по частоте, что желательно для слуховых приложений. Преобразование отражает слуховую систему человека, при этом на более низких частотах спектральное разрешение лучше, а временное разрешение улучшается на более высоких частотах. В нижней части шкалы фортепиано (около 30 Гц) разница в 1 полутон составляет разницу примерно в 1,5 Гц, тогда как в верхней части музыкальной шкалы (около 5 кГц) разница в 1 полутон представляет собой разницу примерно в 1 полутон. 200 Гц. [8] Таким образом, для музыкальных данных экспоненциальное частотное разрешение преобразования с постоянной добротностью является идеальным.

Кроме того, в этом преобразовании гармоники музыкальных нот образуют образец, характерный для тембра инструмента. Предполагая, что относительная сила каждой гармоники одинакова, при изменении основной частоты относительное положение этих гармоник остается постоянным. Это может значительно упростить идентификацию инструментов. Постоянное Q-преобразование также может использоваться для автоматического распознавания музыкальных клавиш на основе накопленного содержимого цветности. [9]

По сравнению с преобразованием Фурье реализация этого преобразования более сложна. Это связано с различным количеством выборок, используемых при вычислении каждого частотного бина, что также влияет на длину любой реализованной оконной функции. [10]

Также обратите внимание, что, поскольку шкала частот является логарифмической, нет истинного члена нулевой частоты / постоянного тока, что в некоторых случаях может быть недостатком.

Ссылки [ править ]

  1. ^ Джудит С. Браун , Расчет постоянного Q спектрального преобразования , J. Acoust. Soc. Являюсь. Т. 89 (1): 425–434, 1991.
  2. ^ Непрерывное вейвлет-преобразование «Когда материнский вейвлет можно интерпретировать как оконную синусоиду (например, вейвлет Морле), вейвлет-преобразование можно интерпретировать как преобразование Фурье с постоянной добротностью. До появления теории вейвлетов преобразования Фурье с постоянной добротностью ( например, полученные из классического банка фильтров третьей октавы) было нелегко инвертировать, потому что базовые сигналы не были ортогональными ».
  3. ^ Джудит С. Браун и Миллер С. Пакетт, Эффективный алгоритм для вычисления постоянного Q-преобразования , J. Acoust. Soc. Являюсь. М., 92 (5): 2698–2701, 1992.
  4. ^ Фитцджеральд, Дерри; Cychowski, Marcin T .; Крэнитч, Мэтт (1 мая 2006 г.). «К обратному постоянному Q-преобразованию» . Конвенция Общества звукорежиссеров . Париж: Общество звукорежиссеров. 120 .
  5. ^ Schörkhuber, христианин; Клапури, Ансси (2010). "CONSTANT-Q TRANSFORM TOOLBOX ДЛЯ ОБРАБОТКИ МУЗЫКИ" . 7-я конференция по звуковому и музыкальному компьютингу . Барселона . Проверено 12 декабря 2018 . CS1 maint: discouraged parameter (link) бумага
  6. ^ а б МакФи, Брайан; Баттенберг, Эрик; Лостанлен, Винсент; Томе, Карл (12 декабря 2018 г.). "librosa: core / constantq.py на 8d26423" . GitHub . librosa . Проверено 12 декабря 2018 . CS1 maint: discouraged parameter (link)
  7. ^ Брэдфорд, R, Ффитч, J & Добсон, R 2008, раздвижные с постоянной-Q , в 11 - й Международной конференции по цифровому аудио эффекты (DAFx-08) Proceedings сентября 1-4th 2008 Эспоо, Финляндия . DAFx, Эспоо, Финляндия, стр. 363-369, Proc. Междунар. Конф. о цифровых звуковых эффектах (DAFx-08), 1/09/08.
  8. ^ http://newt.phys.unsw.edu.au/jw/graphics/notes.GIF
  9. ^ Хендрик Пурвинс, Бенджамин Бланкерц и Клаус Обермайер, Новый метод отслеживания модуляций в тональной музыке в формате аудиоданных , Международная объединенная конференция по нейронной сети (IJCNN'00). , 6: 270-275, 2000.
  10. ^ Бенджамин Бланкерц, Постоянное Q-преобразование , 1999.