В аудиологии и психоакустике концепция критических полос , введенная Харви Флетчером в 1933 г. [1] и уточненная в 1940 г. [2], описывает полосу частот «слухового фильтра», создаваемого улиткой , органом слуха во внутреннем пространстве. ухо . Грубо говоря, критическая полоса - это полоса звуковых частот, в которой второй тон будет мешать восприятию первого тона посредством слуховой маскировки .
Психофизиологически , биение и ощущение шероховатости слуха могут быть связаны с неспособностью механизма частотного анализа слуха распознавать входные сигналы, разность частот которых меньше критической полосы пропускания, и возникающее в результате нерегулярное «щекотание» [3] механической системы ( базилярной мембраны). ), который резонирует в ответ на такие входные данные. Критические полосы также тесно связаны с явлением слуховой маскировки - пониженной слышимостью звукового сигнала при наличии второго сигнала более высокой интенсивности в той же критической полосе. Явления маскировки имеют широкие последствия, начиная от сложной взаимосвязи между громкостью(система координат восприятия) и интенсивность (физическая система координат) алгоритмов сжатия звука .
Слуховые фильтры
Фильтры используются во многих аспектах аудиологии и психоакустики, включая периферическую слуховую систему. Фильтр - это устройство, которое усиливает одни частоты и ослабляет другие. В частности, полосовой фильтр позволяет пропускать диапазон частот в пределах полосы пропускания, останавливая частоты за пределами частот среза. [4]
Форма и организация базилярной мембраны означает, что разные частоты особенно сильно резонируют в разных точках вдоль мембраны. Это приводит к тонотопической организации чувствительности к диапазонам частот вдоль мембраны, которую можно смоделировать как набор перекрывающихся полосовых фильтров, известных как «слуховые фильтры». [5] Слуховые фильтры связаны с точками вдоль базилярной мембраны и определяют частотную избирательность улитки и, следовательно, различение различных звуков слушателем. [4] [6] Они нелинейны, зависят от уровня, и ширина полосы пропускания уменьшается от основания к вершине улитки, поскольку настройка базилярной мембраны изменяется с высокой на низкую. [4] [6] [7] Ширина полосы слухового фильтра называется критической полосой пропускания, как впервые было предложено Флетчером (1940). Если сигнал и маскирующий элемент представлены одновременно, то только маскирующие частоты, попадающие в критическую полосу пропускания, способствуют маскированию сигнала. Чем больше критическая полоса пропускания, тем ниже отношение сигнал / шум (SNR) и тем сильнее маскируется сигнал.
Еще одна концепция, связанная со слуховым фильтром, - это эквивалентная прямоугольная полоса пропускания (ERB). ERB показывает взаимосвязь между слуховым фильтром, частотой и критической полосой пропускания. ERB передает то же количество энергии, что и слуховой фильтр, которому он соответствует, и показывает, как оно изменяется в зависимости от входной частоты. [4] [6] При низких уровнях шума ERB аппроксимируется следующим уравнением в соответствии с Гласбергом и Муром: [6]
- ERB (f) = 24,7 * (4,37 f / 1000 + 1),
где ERB выражается в Гц, а f - центральная частота в Гц.
Считается, что каждый ERB эквивалентен примерно 0,9 мм на базилярной мембране. [6] [7] ERB можно преобразовать в шкалу, которая относится к частоте и показывает положение слухового фильтра вдоль базилярной мембраны. Например, число ERB, равное 3,36, соответствует частоте на апикальном конце базилярной мембраны, тогда как число ERB, равное 38,9, соответствует основанию, а значение 19,5 находится на полпути между ними. [6]
Одним из типов фильтров, используемых для моделирования слуховых фильтров, является гамматоновый фильтр . Он обеспечивает простой линейный фильтр , который, следовательно, легко реализовать, но сам по себе не может учитывать нелинейные аспекты слуховой системы; тем не менее, он используется в различных моделях слуховой системы . Варианты и улучшения гамматоновой модели слуховой фильтрации включают гамматоновый фильтр, всеполюсный и один-нулевой гамматоновые фильтры, двусторонний гамматоновый фильтр и каскадные модели фильтров, а также их различные зависящие от уровня и динамически нелинейные версии. [8]
Кривые психоакустической настройки
Формы слуховых фильтров обнаруживаются путем анализа психоакустической настройки, которые представляют собой графики, показывающие порог обнаружения тона субъектом в зависимости от параметров маскера. [9]
Чтобы получить истинное представление о слуховых фильтрах у одного субъекта, необходимо рассчитать множество кривых психоакустической настройки с сигналом на разных частотах. Для каждой измеряемой кривой психоакустической настройки необходимо рассчитать не менее пяти, но предпочтительно от тринадцати до пятнадцати пороговых значений с разной шириной надрезов. [10] Также необходимо рассчитать большое количество пороговых значений, поскольку слуховые фильтры асимметричны, поэтому пороговые значения также следует измерять с режектором, асимметричным частоте сигнала. [9] Из-за большого количества необходимых измерений время, необходимое для определения формы слуховых фильтров человека, очень велико. Чтобы сократить время, необходимое для поиска замаскированных пороговых значений, можно использовать метод возрастания. Если для расчета порогового значения используется метод возрастания, время, необходимое для расчета формы фильтра, значительно сокращается, поскольку для расчета порогового значения требуется около двух минут. [10] Это связано с тем, что порог регистрируется, когда субъект впервые слышит тон, а не когда он реагирует на определенный уровень стимула в определенном процентном соотношении.
Анатомия и физиология базилярной мембраны
Человеческое ухо состоит из трех частей: внешнего, среднего и внутреннего уха. Во внутреннем ухе находится улитка . Улитка представляет собой образование в форме улитки, которое обеспечивает передачу звука по нейросенсорным путям, а не по проводящим путям. [11] Улитка представляет собой сложную структуру, состоящую из трех слоев жидкости. Вестибульная лестница и средняя лестница разделены мембраной Рейсснера, тогда как средняя лестница и барабанная лестница разделены базилярной мембраной. [11] На схеме ниже показана сложная компоновка отсеков и их разделов: [4]
Базилярная мембрана расширяется по мере продвижения от основания к вершине. Следовательно, основание (самая тонкая часть) имеет большую жесткость, чем вершина. [4] Это означает, что амплитуда звуковой волны, проходящей через базилярную мембрану, изменяется по мере прохождения через улитку. [11] Когда вибрация проходит через улитку, жидкость в трех отделах заставляет базилярную мембрану реагировать волнообразно. Эта волна называется «бегущей волной»; этот термин означает, что базилярная мембрана не просто колеблется как единое целое от основания к вершине.
Когда звук подается в человеческое ухо, время, необходимое для прохождения волны через улитку, составляет всего 5 миллисекунд. [11]
Когда низкочастотные бегущие волны проходят через улитку, волна постепенно увеличивается по амплитуде, а затем почти сразу затухает. Размещение вибрации на улитке зависит от частоты предъявляемых стимулов. Например, более низкие частоты в основном стимулируют верхушку улитки по сравнению с более высокими частотами, которые стимулируют основание улитки. Этот признак физиологии базилярной мембраны может быть проиллюстрирован в виде карты частот-мест: [12]
Базилярная мембрана поддерживает кортиевый орган , расположенный внутри средней лестницы. [4] Кортиев орган состоит как из наружных, так и внутренних волосковых клеток. В одном ухе находится примерно от 15 000 до 16 000 таких волосковых клеток. [11] Наружные волосковые клетки имеют стереоцилии, выступающие к текториальной мембране, которая расположена над кортиевым органом. Стереоцилии реагируют на движение текториальной мембраны, когда звук вызывает вибрацию улитки. Когда это происходит, стереоцилии разделяются и образуется канал, позволяющий протекать химическим процессам. В конце концов сигнал достигает восьмого нерва, после чего обрабатывается в головном мозге. [11]
Отношение к маскировке
Слуховые фильтры тесно связаны с маскировкой в способах их измерения, а также в том, как они работают в слуховой системе. Как описано ранее, критическая полоса пропускания фильтра увеличивается в размере с увеличением частоты, наряду с этим фильтр становится более асимметричным с увеличением уровня.
Считается, что эти два свойства слухового фильтра способствуют распространению маскировки вверх, то есть низкие частоты маскируют высокие частоты лучше, чем наоборот. По мере того, как повышение уровня делает крутизну кривой низких частот более мелкой, за счет увеличения ее амплитуды низкие частоты маскируют высокие частоты больше, чем при более низком входном уровне.
Слуховой фильтр может уменьшить эффекты маскера при прослушивании сигнала в фоновом шуме с использованием прослушивания вне частоты. Это возможно, когда центральная частота маскера отличается от частоты сигнала. В большинстве ситуаций слушатель предпочитает слушать «через» слуховой фильтр, который сосредоточен на сигнале, однако, если присутствует маскер, это может быть неприемлемым. Слуховой фильтр, сконцентрированный на сигнале, может также содержать большое количество маскатора, что приводит к низкому SNR фильтра и уменьшению способности слушателей обнаруживать сигнал. Однако, если слушатель слушал через немного другой фильтр, который все еще содержал значительный объем сигнала, но меньше маскатора, SNR увеличивается, позволяя слушателю обнаружить сигнал. [4]
Первая диаграмма выше показывает слуховой фильтр, сосредоточенный на сигнале, и то, как часть маскатора попадает в этот фильтр. Это приводит к низкому SNR. На второй диаграмме показан следующий фильтр вдоль базилярной мембраны, который не центрирован по сигналу, но содержит значительную часть этого сигнала и меньше маскатора. Это снижает эффект маскирования за счет увеличения отношения сигнал / шум.
Сказанное выше относится к модели маскирования по спектру мощности. В целом эта модель основана на слуховой системе, содержащей массив слуховых фильтров, и выборе фильтра с сигналом в центре или с наилучшим соотношением сигнал / шум. Только маскировщик, попадающий в слуховой фильтр, способствует маскированию, и этот маскер определяет порог слышимости сигнала человеком. [6]
Нормальные и нарушенные слуховые фильтры
В «нормальном» ухе слуховой фильтр имеет форму, аналогичную показанной ниже. Этот график отражает частотную избирательность и настройку базилярной мембраны.
Настройка базилярной мембраны обусловлена его механической конструкции. У основания базилярной мембраны она узкая и жесткая и наиболее чувствительна к высоким частотам. Однако на вершине мембрана широкая и гибкая и наиболее чувствительна к низким частотам. Следовательно, разные участки базилярной мембраны вибрируют в зависимости от частоты звука и дают максимальный отклик на этой конкретной частоте.
Однако в пораженном ухе слуховой фильтр имеет другую форму по сравнению с «нормальным» ухом. [14]
Слуховой фильтр поврежденного уха более плоский и широкий по сравнению с нормальным ухом. Это связано с тем, что частотная избирательность и настройка базилярной мембраны снижается по мере повреждения внешних волосковых клеток. Когда повреждены только внешние волосковые клетки, фильтр становится шире на низкочастотной стороне. Когда повреждены как внешние, так и внутренние волосковые клетки, фильтр становится шире с обеих сторон. Это встречается реже. Расширение слухового фильтра происходит в основном на низкочастотной стороне фильтра. Это увеличивает восприимчивость к низкочастотной маскировке, то есть восходящему распространению маскировки, как описано выше. [6]
Смотрите также
- Громкость
- Психоакустика , Маскирующие эффекты
- Слуховая маскировка
- Созвучие и диссонанс
- Эквивалентная прямоугольная полоса пропускания
Рекомендации
- ^ https://archive.org/details/bstj12-4-377 | Технический журнал Bell System, октябрь 1933 г., "Громкость, ее определение, измерение и расчет"
- ^ Флетчер, Харви (1940). «Слуховые паттерны». Обзоры современной физики . 12 (1): 47–65. Bibcode : 1940RvMP ... 12 ... 47F . DOI : 10.1103 / RevModPhys.12.47 .
- ^ Кэмпбелл, М .; Greated, C. (1987). Путеводитель музыканта по акустике . Нью-Йорк: Книги Ширмера. ISBN 978-0-02-870161-5.
- ^ Б с д е е г ч I Гельфанд, С.А. (2004). Слух: введение в психологическую и физиологическую акустику (4-е изд.). Нью-Йорк: Марсель Деккер. ISBN 978-0-585-26606-0.
- ^ Munkong, R .; Бин-Хван Цзюань (май 2008 г.). «Слуховое восприятие и познание». Журнал обработки сигналов IEEE . 25 (3): 98–117. Bibcode : 2008ISPM ... 25 ... 98M . DOI : 10.1109 / MSP.2008.918418 .
- ^ Б с д е е г ч I Мур, BCJ (1998). Кохлеарная потеря слуха . Лондон: ISBN Whurr Publishers Ltd. 978-0-585-12256-4.
- ^ а б в Мур, BCJ (1986). «Параллели между частотной избирательностью, измеренной психофизически и в механике улитки». Сканд. Audio Suppl. (25): 129–52.
- ^ РФ Лион; А.Г. Кациамис; Э.М. Дракакис (2010). «История и будущее моделей слуховых фильтров» (PDF) . Proc. ISCAS . IEEE.
- ^ а б Glasberg, BR; Мур, BCJ (1990). «Получение формы слухового фильтра из данных с режекторным шумом». Слышать. Res . 47 (1–2): 103–138. DOI : 10.1016 / 0378-5955 (90) 90170-Т .
- ^ а б в Накаичи, Такеши; Ватануки, Кейсуке; Сакамото, Шиничи (2003). «Упрощенный метод измерения слуховых фильтров для слабослышащих слушателей» . Акустическая наука и техника . 24 (6): 365–375. DOI : 10.1250 / ast.24.365 .
- ^ а б в г д е Плевес, К. (2006). Анатомия и физиология уха .
- ^ «Променад вокруг улитки» . 2003 г.
- ^ Мур, BCJ; Гласберг, Б.Р. (1987). «Формулы, описывающие частотную избирательность как функцию частоты и уровня, и их использование при расчете схем возбуждения». Слуховые исследования . 28 (2–3): 209–225. DOI : 10.1016 / 0378-5955 (87) 90050-5 . ISSN 0378-5955 . PMID 3654390 .
- ^ Мур, BCJ (2003). Введение в психологию слуха (5-е изд.). Сан-Диего, Калифорния: Academic Press. ISBN 978-0-12-505627-4.
Внешние ссылки
- Василакис, П.Н., Фитц, К. (2007) . SRA: веб-инструмент исследования спектрального анализа и анализа шероховатости звуковых сигналов. При поддержке гранта Северо-Западного академического вычислительного консорциума Дж. Миддлтон, Университет Восточного Вашингтона