Звуковая локализация

Локализация звука - это способность слушателя определять местоположение или источник обнаруженного звука по направлению и расстоянию.

Механизмы локализации звука в слуховой системе млекопитающих широко изучены. Слуховая система использует несколько сигналов для локализации источника звука, включая разницу во времени и уровне (или разницу в интенсивности) между обоими ушами, спектральную информацию, временной анализ, корреляционный анализ и сопоставление с образцом.

Эти сигналы также используются другими животными, но могут быть различия в использовании, а также есть сигналы локализации, которые отсутствуют в слуховой системе человека, такие как эффекты движений ушей. Животные, обладающие способностью локализовать звук, имеют явное эволюционное преимущество.

Как звук достигает мозга

Звук - это результат восприятия механических колебаний, проходящих через среду, такую как воздух или вода. Через механизмы сжатия и разрежения звуковые волны проходят по воздуху, отражаются от ушной раковины и раковины наружного уха и попадают в слуховой проход. Звуковые волны вибрировать барабанную перепонку ( барабанную перепонку ), в результате чего три кости среднего уха вибрировать, который затем посылает энергию через овальное окно и в улитке , где он преобразуется в химический сигнал от волосковых клеток в органе Corti , которые синапсируют со спиральными ганглиозными волокнами, которые проходят через кохлеарный нерв в мозг.

Нейронные взаимодействия

В позвоночных , в -ушные различия во время , как известно , должны быть рассчитаны в превосходном оливарном ядра в стволе головного мозга . Согласно Джеффрессу , ^[1] этот расчет основан на линиях задержки : нейроны в верхних оливах , которые принимают иннервацию от каждого уха с различной соединительными аксонами длиной. Некоторые клетки более непосредственно связаны с одним ухом, чем с другим, поэтому они специфичны для определенной разницы во времени между слухами. Эта теория эквивалентна математической процедуре взаимной корреляции . Однако, поскольку теория Джеффресса неспособна учесть эффект приоритета , в котором только первый из нескольких идентичных звуков используется для определения местоположения звуков (что позволяет избежать путаницы, вызванной эхом), ее нельзя полностью использовать для объяснения реакции. Более того, ряд недавних физиологических наблюдений, сделанных в среднем мозге и стволе мозга мелких млекопитающих, поставили под сомнение обоснованность первоначальных идей Джеффресса. ^[2]

Нейроны, чувствительные к меж слуховой разнице уровней (ILD), возбуждаются стимуляцией одного уха и подавляются стимуляцией другого уха, так что величина ответа клетки зависит от относительной силы двух входов, которые, в свою очередь, зависят от на интенсивность звука в ушах.

В слуховом ядре среднего мозга, нижнем бугорке (IC), многие чувствительные к ILD нейроны имеют функции ответа, которые резко снижаются от максимальных до нулевых пиков в зависимости от ILD. Однако есть также много нейронов с гораздо более поверхностными функциями ответа, которые не опускаются до нулевых пиков.

Конус смятения

Большинство млекопитающих умеют определять местонахождение источника звука, используя межуральные временные различия и межуральные различия уровней. Однако такой разницы во времени или уровне не существует для звуков, исходящих по окружности круглых конических срезов, где ось конуса проходит вдоль линии между двумя ушами.

Следовательно, звуковые волны, возникающие в любой точке по заданной высоте наклона окружности, будут иметь неоднозначные координаты восприятия. То есть слушатель не сможет определить, исходит ли звук сзади, спереди, сверху, снизу или где-либо еще по окружности у основания конуса на любом заданном расстоянии от уха. Конечно, важность этих неоднозначностей исчезающе мала для источников звука очень близко или очень далеко от объекта, но именно эти промежуточные расстояния наиболее важны с точки зрения пригодности.

Эти неоднозначности можно устранить, наклонив голову, что может привести к сдвигу как амплитуды, так и фазы звуковых волн, поступающих в каждое ухо. Это переводит вертикальную ориентацию интерауральной оси по горизонтали, тем самым задействуя механизм локализации в горизонтальной плоскости. Более того, даже без изменения угла межушной оси (т.е. без наклона головы) слуховой аппарат может использовать интерференционные паттерны, создаваемые ушными раковинами, туловищем и даже временным перенацеливанием руки как продолжением ушной раковины. (например, обхватив ухо ладонью).

Как и в случае с другими сенсорными стимулами, устранение неоднозначности восприятия также достигается за счет интеграции множества сенсорных входов, особенно визуальных сигналов. Локализовав звук в пределах окружности круга на некотором воспринимаемом расстоянии, визуальные подсказки служат для определения местоположения звука. Кроме того, предварительное знание местоположения источника звука поможет определить его текущее местоположение.

Локализация звука слуховой системой человека

Локализация звука - это процесс определения местоположения источника звука . Объективно говоря, основной целью локализации звука является моделирование определенного звукового поля, включая источники звука, слушателя, средства массовой информации и среду распространения звука. Мозг использует тонкие различия в интенсивности, спектральных и временных сигналах, чтобы мы могли локализовать источники звука. ^[3]^[4] В этом разделе, чтобы более глубоко понять человеческий слуховой механизм, мы кратко обсудим теорию локализации человеческого уха.

Общее введение

Локализацию можно описать в терминах трехмерного положения: азимутального или горизонтального угла, возвышения или вертикального угла, а также расстояния (для статических звуков) или скорости (для движущихся звуков). ^[5]

Азимут звука определяется разницей во времени прихода между ушами , относительной амплитудой высокочастотных звуков (эффект тени) и асимметричными спектральными отражениями от различных частей нашего тела, включая туловище, плечи, и ушные раковины . ^[5]

Признаками расстояния являются потеря амплитуды, потеря высоких частот и отношение прямого сигнала к реверберированному сигналу. ^[5]

В зависимости от того, где находится источник, наша голова действует как барьер для изменения тембра , интенсивности и спектральных качеств звука, помогая мозгу сориентироваться, откуда исходит звук. ^[4] Эти крошечные различия между двумя ушами известны как межушные сигналы. ^[4]

Более низкие частоты и более длинные волны рассеивают звук вокруг головы, заставляя мозг сосредотачиваться только на сигналах фазировки от источника. ^[4]

Хельмут Хаас обнаружил, что мы можем различить источник звука, несмотря на дополнительные отражения на 10 децибел громче исходного волнового фронта, используя самый ранний приходящий волновой фронт. ^[4] Этот принцип известен как эффект Хааса , особая версия эффекта приоритета . ^[4] Хаас измерил разницу во времени между исходным звуком и отраженным звуком с точностью до 1 миллисекунды, увеличив объем, позволяя мозгу различать истинное местоположение исходного звука. Нервная система объединяет все ранние отражения в единое перцептивное целое, позволяя мозгу обрабатывать несколько разных звуков одновременно. ^[6] Нервная система будет комбинировать отражения, которые находятся в пределах 35 миллисекунд друг от друга и имеют одинаковую интенсивность. ^[6]

Теория дуплекса

Чтобы определить латеральное направление входа (влево, вперед, вправо), слуховая система анализирует следующую информацию о слуховых сигналах:

Теория дуплекса

В 1907 году лорд Рэлей использовал камертоны для создания монофонического возбуждения и изучил теорию боковой локализации звука на модели головы человека без ушной раковины. Он первым представил теорию локализации звука, основанную на интерауральных подсказках и различиях, известную как теория дуплекса. ^[7] Человеческие уши расположены по разные стороны головы, поэтому они имеют разные координаты в пространстве. Как показано на рис. 2, поскольку расстояния между акустическим источником и ушами различаются, между звуковыми сигналами двух ушей существует разница во времени и разность интенсивности. Мы называем эти виды различий как интерауральная разница во времени (ITD) и интерауральная разница в интенсивности (IID) соответственно.

рис.2 Теория дуплекса

ITD и IID

Межуральная разность уровней ( ILD ) между левым ухом (левым) и правым ухом (справа).

[ источник звука : развертка справа]

Из рисунка 2 видно, что независимо от источника B1 или источника B2, будет задержка распространения между двумя ушами, которая будет генерировать ITD. Одновременно человеческая голова и уши могут оказывать затенение на высокочастотные сигналы, которые генерируют IID.

Интерактивная разница во времени (ITD) Звук с правой стороны достигает правого уха раньше, чем левого уха. Слуховая система оценивает межуральные временные различия по: (а) фазовым задержкам на низких частотах и (б) групповым задержкам на высоких частотах.
Массовые эксперименты показывают, что ITD относится к частоте сигнала f. Предположим, что угловое положение акустического источника равно θ, радиус головки равен r, а скорость звука равна c, функция ITD определяется следующим образом: ^[8] ${\ displaystyle ITD = {\ begin {case} 300 \ times {\ text {r}} \ times \ sin \ theta / {\ text {c}}, & {\ text {if}} f \ leq {\ text {4000Hz}} \\ 200 \ times {\ text {r}} \ times \ sin \ theta / {\ text {c}}, & {\ text {if}} f> {\ text {4000Hz}} \ end {случаи}}}$ . В приведенной выше закрытой форме мы предположили, что 0 градусов находится справа перед головой, а против часовой стрелки положительно.
Интерактивная разница в интенсивности (IID) или межуральная разница уровней (ILD) Звук с правой стороны имеет более высокий уровень в правом ухе, чем в левом ухе, потому что голова затеняет левое ухо. Эти различия уровней сильно зависят от частоты и увеличиваются с увеличением частоты. Масштабные теоретические исследования показывают, что IID зависит от частоты сигнала f и углового положения акустического источника θ. Функция IID определяется следующим образом: ^[8] ${\ Displaystyle IID = 1.0 + (f / 1000) ^ {0.8} \ times \ sin \ theta}$
Для частот ниже 1000 Гц оцениваются в основном ITD ( фазовые задержки ), для частот выше 1500 Гц оцениваются в основном IID. Между 1000 Гц и 1500 Гц есть переходная зона, в которой играют роль оба механизма.
Точность локализации составляет 1 градус для источников перед слушателем и 15 градусов для источников по бокам. Люди могут различать межзубные промежутки времени в 10 микросекунд или меньше. ^[9]^[10]

Оценка для низких частот

Для частот ниже 800 Гц размеры головы (расстояние до уха 21,5 см, что соответствует межуральной временной задержке 625 мкс) меньше половины длины волны звуковых волн. Таким образом, слуховая система может без путаницы определять фазовые задержки между обоими ушами. Межуровневые различия уровней очень малы в этом частотном диапазоне, особенно ниже примерно 200 Гц, поэтому точная оценка направления входного сигнала практически невозможна на основе одних только разностей уровней. Когда частота падает ниже 80 Гц, становится трудно или невозможно использовать разницу во времени или разность уровней для определения бокового источника звука, потому что разность фаз между ушами становится слишком малой для направленной оценки. ^[11]

Оценка для высоких частот

Для частот выше 1600 Гц размеры головы больше длины звуковых волн. Однозначное определение входного направления на основе одной только межузельной фазы на этих частотах невозможно. Тем не менее, различия межурального уровня становятся больше, и эти различия уровней оцениваются слуховой системой. Также можно оценить групповые задержки между ушами, которые более выражены на более высоких частотах; то есть, если есть начало звука, задержка этого начала между ушами может использоваться для определения направления входа соответствующего источника звука. Этот механизм становится особенно важным в реверберирующей среде. После начала звука есть короткий промежуток времени, когда прямой звук достигает ушей, но еще не отраженный звук. Слуховая система использует этот короткий промежуток времени для оценки направления источника звука и сохраняет это обнаруженное направление до тех пор, пока отражения и реверберация не позволяют однозначно оценить направление. ^[12] Механизмы, описанные выше, не могут использоваться для различения источника звука впереди слушателя или позади слушателя; поэтому необходимо оценить дополнительные сигналы. ^[13]

Теория эффекта фильтрации ушной раковины

рис.4 HRTF

Мотивации

Теория дуплекса ясно указывает на то, что ITD и IID играют важную роль в локализации звука, но они могут иметь дело только с проблемами боковой локализации. Например, согласно теории дуплекса, если два акустических источника симметрично расположены на правой передней и правой задней части головы человека, они будут генерировать равные ITD и IID, что называется эффектом модели конуса. Однако человеческое ухо действительно может различить этот набор источников. Кроме того, в естественном слухе только одно ухо, что означает отсутствие ITD или IID, может различать источники с высокой точностью. Из-за недостатков дуплексной теории исследователи предложили теорию эффекта фильтрации ушной раковины. ^[14] Форма ушной раковины человека очень особенная. Он вогнутый со сложными складками и асимметричен по горизонтали или вертикали. Отраженные волны и прямые волны будут генерировать частотный спектр на барабанной перепонке, который связан с акустическими источниками. Затем слуховые нервы локализуют источники по этому частотному спектру. Поэтому была предложена соответствующая теория, названная теорией эффекта фильтрации ушной раковины. ^[15]

Математическая модель

Эти спектральные подсказки, генерируемые эффектом фильтрации ушной раковины, могут быть представлены как передаточная функция, относящаяся к голове (HRTF). Соответствующие выражения во временной области называются импульсной характеристикой, связанной с головой (HRIR). HRTF также называется передаточной функцией из свободного поля в определенную точку слухового прохода. Обычно мы распознаем HRTF как системы LTI: ^[8]

${\ displaystyle H_ {L} = H_ {L} (r, \ theta, \ varphi, \ omega, \ alpha) = P_ {L} (r, \ theta, \ varphi, \ omega, \ alpha) / P_ { 0} (г, \ omega)}$

${\ displaystyle H_ {R} = H_ {R} (r, \ theta, \ varphi, \ omega, \ alpha) = P_ {R} (r, \ theta, \ varphi, \ omega, \ alpha) / P_ { 0} (г, \ omega)}$ ,

где L и R обозначают левое и правое ухо соответственно. ${\ displaystyle P_ {L}}$ а также ${\ Displaystyle P_ {R}}$ представляют собой амплитуду звукового давления на входе в левый и правый слуховой проход. ${\ displaystyle P_ {0}}$ - амплитуда звукового давления в центре координаты головы, когда слушатель не существует. В целом, HRTF ${\ displaystyle H_ {L}}$ а также ${\ displaystyle H_ {R}}$ являются функциями углового положения источника ${\ displaystyle \ theta}$ , угол возвышения ${\ displaystyle \ varphi}$ , расстояние между источником и центром головы ${\ displaystyle r}$ угловая скорость ${\ displaystyle \ omega}$ и эквивалентный размер головы ${\ displaystyle \ alpha}$ .

База данных HRTF

В настоящее время основные институты, работающие над измерением базы данных HRTF, включают CIPIC ^[16] International Lab, MIT Media Lab, Высшую школу психоакустики в университете Ольденбурга, лабораторию нейрофизиологии в университете Висконсин-Мэдисон и лабораторию Эймса НАСА. . Базы данных HRIR людей с нормальным и нарушенным слухом и животных общедоступны.

инжир. 5 HRIR

Другие подсказки для локализации трехмерного пространства

Монофонические реплики

Наружное ухо человека , то есть структуры ушной раковины и наружного слухового прохода , образуют фильтры, выбирающие направление. В зависимости от направления ввода звука в средней плоскости активируются различные резонансы фильтра. Эти резонансы имплантируют специфичные для направления паттерны в частотные характеристики ушей, которые могут быть оценены слуховой системой для определения вертикальной локализации звука . Вместе с другими отражениями на голове, плечах и туловище, избирательно влияющих на направление, они формируют передаточные функции внешнего уха. Эти паттерны частотных характеристик уха очень индивидуальны и зависят от формы и размера внешнего уха. Если звук передается через наушники и был записан через другую голову с внешними поверхностями уха другой формы, диаграммы направленности отличаются от собственных, и проблемы возникнут при попытке оценить направления в средней плоскости этими чужеродными ушами. Как следствие, перестановки спереди и сзади или локализация внутри головы могут появляться при прослушивании записей фиктивной головы , или иначе называемых бинауральными записями. Было показано, что люди могут монофонически локализовать высокочастотный звук, но не низкочастотный звук. Однако бинауральная локализация была возможна с более низкими частотами. Вероятно, это связано с тем, что ушная раковина достаточно мала, чтобы взаимодействовать только со звуковыми волнами высокой частоты. ^[17] Кажется, что люди могут точно определить высоту только сложных звуков, включающих частоты выше 7000 Гц, при этом должна присутствовать ушная раковина. ^[18]

Динамические бинауральные реплики

Когда голова неподвижна, бинауральные сигналы для латеральной локализации звука (межуральная разница во времени и межуральная разница уровней) не дают информации о расположении звука в средней плоскости. Идентичные ITD и ILD могут создаваться звуками на уровне глаз или на любой высоте, если поперечное направление остается постоянным. Однако, если голова вращается, ITD и ILD изменяются динамически, и эти изменения различны для звуков на разных высотах. Например, если источник звука на уровне глаз находится прямо перед собой, а голова поворачивается влево, звук становится громче (и доходит до него раньше) в правом ухе, чем в левом. Но если источник звука находится прямо над головой, то при повороте головы изменения ITD и ILD не произойдет. Промежуточные возвышения производят промежуточные степени изменения, и если представление бинауральных сигналов двум ушам во время движения головы обратное, звук будет слышен позади слушателя. ^[13]^[19] Ганс Валлах ^[20] искусственно изменил бинауральные сигналы звука во время движений головы. Хотя звук объективно размещался на уровне глаз, динамические изменения ITD и ILD при повороте головы были такими, которые возникли бы, если бы источник звука был приподнят. В этой ситуации звук был слышен на синтезированной высоте. Тот факт, что источники звука объективно оставались на уровне глаз, не позволял монофоническим сигналам определять высоту, показывая, что именно динамическое изменение бинауральных сигналов во время движения головы позволило правильно локализовать звук в вертикальном измерении. Движения головы не обязательно должны производиться активно; точная вертикальная локализация произошла в аналогичной установке, когда вращение головы производилось пассивно, путем посадки субъекта с завязанными глазами на вращающееся кресло. Пока динамические изменения бинауральных сигналов сопровождали воспринимаемое вращение головы, синтезированное возвышение воспринималось. ^[13]

Расстояние до источника звука

^{[ необходима цитата ]}

Слуховая система человека имеет лишь ограниченные возможности для определения расстояния до источника звука. На близком расстоянии есть некоторые показания для определения расстояния, такие как крайние различия уровней (например, при шепоте в одно ухо) или определенные резонансы ушной раковины (видимая часть уха) на близком расстоянии.

Слуховая система использует эти подсказки для оценки расстояния до источника звука:

Коэффициент прямого / отраженного звука: в закрытых помещениях к слушателю поступают два типа звука: прямой звук достигает ушей слушателя, не отражаясь от стены. Отраженный звук хотя бы один раз отражался от стены, прежде чем достиг слушателя. Соотношение между прямым и отраженным звуком может указывать на расстояние до источника звука.
Громкость: далекие источники звука имеют меньшую громкость, чем близкие. Этот аспект может быть оценен особенно для хорошо известных источников звука.
Спектр звука: высокие частоты быстрее затухают в воздухе, чем низкие частоты. Поэтому удаленный источник звука звучит более приглушенно, чем близкий, потому что приглушаются высокие частоты. Для звука с известным спектром (например, речи) расстояние можно приблизительно оценить с помощью воспринимаемого звука.
ITDG: Начальный временной интервал задержки описывает разницу во времени между приходом прямой волны и первым сильным отражением от слушателя. Соседние источники создают относительно большую ITDG, причем первым отражениям нужно пройти более длинный путь, возможно, во много раз дольше. Когда источник находится далеко, прямая и отраженная звуковые волны имеют одинаковую длину пути.
Движение: Подобно зрительной системе, существует также явление параллакса движения в слуховом восприятии. Для движущегося слушателя близлежащие источники звука проходят быстрее, чем удаленные источники звука.
Разница в уровнях: очень близкие источники звука вызывают различный уровень между ушами.

Обработка сигналов

Звуковая обработка слуховой системы человека осуществляется в так называемых критических диапазонах . Диапазон слышимости разделен на 24 критических диапазона, каждая шириной 1 барк или 100 Мел . Для направленного анализа сигналы внутри критической полосы анализируются вместе.

Слуховая система может извлекать звук желаемого источника звука из мешающего шума. Это позволяет слушателю сосредоточиться только на одном говорящем, если говорят и другие говорящие ( эффект коктейльной вечеринки ). С помощью эффекта коктейльной вечеринки звук с мешающих направлений воспринимается приглушенным по сравнению со звуком с нужного направления. Слуховая система может увеличить отношение сигнал / шум до 15 дБ , что означает, что мешающий звук воспринимается как ослабленный до половины (или менее) от его фактической громкости . ^{[ необходима цитата ]}

Локализация в закрытых помещениях

В закрытых помещениях в уши слушателя поступает не только прямой звук от источника звука, но и звук, отражающийся от стен. Слуховая система анализирует только прямой звук ^[12], который поступает первым, для локализации звука, но не отраженный звук, который приходит позже ( закон фронта первой волны ). Таким образом, локализация звука остается возможной даже в эхо-среде. Это эхоподавление происходит в дорсальном ядре бокового лемниска (DNLL). ^[21]

Чтобы определить периоды времени, в которых преобладает прямой звук и которые можно использовать для оценки направленности, слуховая система анализирует изменения громкости в различных критических полосах, а также стабильность воспринимаемого направления. Если имеется сильная атака громкости в нескольких критических диапазонах и если воспринимаемое направление стабильно, эта атака, по всей вероятности, вызвана прямым звуком источника звука, который поступает недавно или который меняет характеристики своего сигнала. Этот короткий период времени используется слуховой системой для анализа направленности и громкости звука. Когда отражения приходят немного позже, они не так сильно увеличивают громкость внутри критических полос, но сигналы направления становятся нестабильными, потому что есть смесь звука нескольких направлений отражения. В результате слуховая система не запускает новый направленный анализ.

Это первое обнаруженное направление от прямого звука принимается за направление найденного источника звука, пока другие сильные атаки на громкость в сочетании со стабильной информацией о направлении не укажут, что возможен новый анализ направленности. (см. эффект Франссена )

Конкретные техники с приложениями

Стереосистема с аудиопередачей

Такая техника локализации звука дает нам настоящую виртуальную стереосистему . ^[22] Он использует «умные» манекены, такие как KEMAR, для сбора сигналов или методы DSP для моделирования процесса передачи от источников к ушам. После усиления, записи и передачи два канала принятых сигналов будут воспроизводиться через наушники или динамики. Этот подход к локализации использует электроакустические методы для получения пространственной информации исходного звукового поля путем перевода слухового аппарата слушателя в исходное звуковое поле. Самым значительным преимуществом этого является то, что его акустические образы живые и естественные. Кроме того, для воспроизведения акустического изображения 3D-системы необходимы только два независимых передаваемых сигнала.

инжир. 6 Локализация звука с помощью манекена

Стереосистема 3D паравиртуализации

Представителями такого рода систем являются SRS Audio Sandbox, Spatializer Audio Lab и Qsound Qxpander. ^[22] Они используют HRTF для моделирования принимаемых акустических сигналов в ушах с разных направлений с обычным стереовоспроизведением по двоичному каналу. Таким образом, они могут имитировать отраженные звуковые волны и улучшать субъективное восприятие пространства и окружающей среды. Поскольку они представляют собой стереосистемы с паравиртуализацией, их основная цель - имитировать информацию о стереозвуке. В традиционных стереосистемах используются датчики, которые сильно отличаются от человеческих ушей. Хотя эти датчики могут получать акустическую информацию с разных направлений, они не имеют той же частотной характеристики, что и слуховая система человека. Следовательно, когда применяется бинарный режим, слуховые системы человека по-прежнему не могут чувствовать поле трехмерных звуковых эффектов. Однако стереосистема с паравиртуализацией 3D преодолевает такие недостатки. Он использует принципы HRTF для сбора акустической информации из исходного звукового поля, а затем для создания живого трехмерного звукового поля через обычные наушники или динамики.

Многоканальное стерео виртуальное воспроизведение

Поскольку многоканальные стереосистемы требуют большого количества каналов воспроизведения, некоторые исследователи использовали технологии моделирования HRTF, чтобы уменьшить количество каналов воспроизведения. ^[22] Они используют только два динамика для имитации нескольких динамиков в многоканальной системе. Этот процесс называется виртуальным воспроизведением. По сути, такой подход использует как принцип межушной разности, так и теорию эффекта фильтрации ушной раковины. К сожалению, такой подход не может полностью заменить традиционную многоканальную стереосистему, такую как система объемного звучания 5.1 / 7.1 . Это потому, что, когда зона прослушивания относительно больше, имитационное воспроизведение через HRTF может вызвать инвертирование акустических изображений в симметричных положениях.

Животные

Поскольку у большинства животных два уха, многие эффекты слуховой системы человека можно найти и у других животных. Следовательно, межуральная разница во времени (межуральная разница фаз) и межуральная разница уровней играют роль в слухе многих животных. Но влияние на локализацию этих эффектов зависит от размера головы, расстояния до ушей, положения ушей и ориентации ушей.

Боковая информация (слева, вперед, справа)

Если уши расположены сбоку от головы, можно использовать такие же сигналы боковой локализации, как и для слуховой системы человека. Это означает: оценку межуральных разностей времени (межуральных фазовых разностей) для более низких частот и оценку межуральных разностей уровней для более высоких частот. Оценка межуральных фазовых различий полезна, если она дает однозначные результаты. Это так, если расстояние до уха меньше половины длины (максимальной длины волны) звуковых волн. Для животных с большей головой, чем у человека, диапазон оценки межуральных фазовых различий смещен в сторону более низких частот, для животных с меньшей головой этот диапазон смещен в сторону более высоких частот.

Самая низкая частота, которую можно локализовать, зависит от расстояния до ушей. Животные с большим расстоянием между ушами могут определять более низкие частоты, чем люди. Для животных с меньшим расстоянием до ушей наименьшая локализуемая частота выше, чем для людей.

Если уши расположены сбоку от головы, межуральные различия уровня проявляются для более высоких частот и могут быть оценены для задач локализации. Для животных с ушами на макушке головы не будет тени, и, следовательно, будет гораздо меньше межуральных различий в уровнях, которые можно было бы оценить. Многие из этих животных могут двигать ушами, и эти движения ушей можно использовать как сигнал латеральной локализации.

Odontocetes

Дельфины (и другие зубатки) полагаются на эхолокацию, чтобы помочь в обнаружении, идентификации, локализации и поимке добычи. Сигналы гидролокатора дельфинов хорошо подходят для определения местоположения нескольких небольших целей в трехмерной водной среде за счет использования высоконаправленной (ширина луча 3 дБ около 10 градусов), широкополосной (ширина полосы 3 дБ обычно составляет около 40 кГц; пиковые частоты от 40 кГц до 40 кГц). 120 кГц), короткие щелчки (около 40 мкс). Дельфины могут локализовать звуки как пассивно, так и активно (эхолокация) с разрешением около 1 градуса. Межмодальное сопоставление (между зрением и эхолокацией) предполагает, что дельфины воспринимают пространственную структуру сложных объектов, опрашиваемых с помощью эхолокации, что, вероятно, требует пространственного разрешения индивидуальных особенностей объекта и интеграции в целостное представление формы объекта. Хотя дельфины чувствительны к небольшой бинауральной интенсивности и разнице во времени, все больше данных свидетельствует о том, что дельфины используют зависимые от положения спектральные сигналы, полученные из хорошо развитых передаточных функций, связанных с головой, для локализации звука как в горизонтальной, так и в вертикальной плоскостях. Очень маленькое время интегрирования (264 мкс) позволяет локализовать несколько целей на разных расстояниях. Адаптация к локализации включает выраженную асимметрию черепа, носовых мешков и специализированных липидных структур во лбу и челюстях, а также акустически изолированное среднее и внутреннее ухо.

В средней плоскости (спереди, сверху, сзади, снизу)

У многих млекопитающих также есть ярко выраженные структуры в ушной раковине возле входа в ушной канал. Как следствие, могут появиться зависящие от направления резонансы, которые можно использовать как дополнительный сигнал локализации, аналогичный локализации в срединной плоскости в слуховой системе человека. Есть дополнительные сигналы локализации, которые также используются животными.

Наклон головы

Для локализации звука в средней плоскости (возвышения звука) также могут использоваться два детектора, которые расположены на разной высоте. Однако у животных приблизительную информацию о высоте можно получить, просто наклонив голову, при условии, что звук длится достаточно долго, чтобы завершить движение. Это объясняет врожденное поведение ^{[ неопределенного ]} склонения головы набок при попытке точно локализовать звук. Чтобы получить мгновенную локализацию более чем в двух измерениях с помощью сигналов разницы во времени или разности амплитуд, требуется более двух детекторов.

Локализация с сдвоенными ушами (мухи)

Крошечная паразитическая муха Ormia ochracea стала модельным организмом в экспериментах по локализации звука из-за своего уникального уха . Животное слишком маленькое, чтобы можно было рассчитать обычным способом разницу во времени звука, поступающего в два уха, но тем не менее оно может определять направление источников звука с исключительной точностью. В барабанной мембраны противоположных ушах непосредственно соединены механически, позволяя разрешение суб-микросекунды разницы во времени ^[23]^[24] и требует новой стратегии кодирования нейронная. ^[25] Хо ^[26] показал, что система сдвоенной барабанной перепонки у лягушек может вызывать повышенное неравенство межуральных вибраций, когда для головы животного доступны лишь небольшое время прибытия и различия в уровне звука. В настоящее время ведутся работы по созданию направленных микрофонов на основе барабанной перепонки.

Двухкоординатная локализация звука (совы)

Большинство сов - ночные или сумеречные хищные птицы . Поскольку они охотятся ночью, они должны полагаться на невизуальные чувства. Эксперименты Роджера Пейна ^[27] показали, что совы чувствительны к звукам, издаваемым их добычей, а не к теплу или запаху. Фактически, звуковые сигналы необходимы и достаточны для локализации мышей из отдаленного места, где они сидят. Чтобы это работало, совы должны уметь точно определять как азимут, так и высоту источника звука.

История

Термин «бинауральный» буквально означает «слышать двумя ушами» и был введен в 1859 году для обозначения практики прослушивания одного и того же звука обоими ушами или двух отдельных звуков, по одному через каждое ухо. Только в 1916 году Карл Штумпф (1848–1936), немецкий философ и психолог , различал дихотическое слушание, которое относится к стимуляции каждого уха разными раздражителями , и диотическое слушание, одновременное раздражение обоих ушей с помощью тот же стимул. ^[28]

Позже станет очевидно, что бинауральный слух, дихотический или диотический, является средством, с помощью которого происходит локализация звука. ^[28]^[29]^{[ необходима страница ]}

Научное рассмотрение бинаурального слуха началось еще до того, как это явление было названо так, с предположений, опубликованных в 1792 году Уильямом Чарльзом Уэллсом (1757–1817), основанными на его исследованиях бинокулярного зрения . ^[30] Джованни Баттиста Вентури (1746–1822) провел и описал эксперименты, в которых люди пытались локализовать звук, используя оба уха или одно ухо, заблокированное пальцем. Эта работа не получила дальнейшего развития и была восстановлена только после того, как другие выяснили, как работает локализация человеческого звука. ^[28]^[30] Лорд Рэлей (1842–1919) проводил те же эксперименты и приходил к результатам, не зная, что Вентури впервые провел их, почти семьдесят пять лет спустя. ^[30]

Чарльз Уитстон (1802–1875) работал над оптикой и смешиванием цветов, а также исследовал слух. Он изобрел устройство, которое он назвал «микрофоном», который включал в себя металлическую пластину над каждым ухом, каждая из которых была соединена с металлическими стержнями; он использовал это устройство для усиления звука. Он также проводил эксперименты, поднося камертоны к обоим ушам одновременно или по отдельности, пытаясь выяснить, как работает слух, которые он опубликовал в 1827 году. ^[30] Эрнст Генрих Вебер (1795–1878) и Август Зеебек (1805) –1849) и Уильям Чарльз Уэллс также попытались сравнить и противопоставить то, что стало известно как бинауральный слух, с принципами бинокулярной интеграции в целом. ^[30]

Понимание того, как различия в звуковых сигналах между двумя ушами вносят свой вклад в слуховой обработки таким образом, чтобы дать возможность локализации звука и направление значительно продвинулись после изобретения стетоскопа по Somerville Скотт Alison в 1859 году, который ввел термин «бинауральных». Элисон основала стетофон на стетоскопе , изобретенном Рене Теофилем Гиацинтом Лаэннеком (1781–1826); у стетофона было два отдельных «датчика», что позволяло пользователю слышать и сравнивать звуки, исходящие из двух отдельных мест. ^[30]

Смотрите также

Акустическая локация
Эхолокация животных
Бинауральный фьюжн
Обнаружение совпадений в нейробиологии
Эхолокация человека
Перцепционная локализация 3D-звука
Психоакустика
Пространственная потеря слуха

Внешние ссылки

auditoryneuroscience.com: Коллекция мультимедийных файлов и флэш-демонстраций, связанных с пространственным слухом.
Сборник справок о локализации звука
Научные статьи о способностях к локализации звука у разных видов млекопитающих.
Обработка разницы в интерауральной интенсивности в слуховых нейронах среднего мозга: эффекты временного раннего тормозного входа
Центр онлайн-обучения - Слух и аудирование
HearCom: Hearing in the Communication Society, исследовательский проект ЕС
Исследование "Локализация вне зоны прямой видимости (NLOS) для помещений", проведенное CMR в UNSW
Введение в локализацию звука
Звук и комната
Введение в акустическую голографию
Введение в акустическое формирование луча

[1] Джеффресс LA (1948). «Теория места локализации звука». Журнал сравнительной и физиологической психологии . 41 (1): 35–39. DOI : 10.1037 / h0061495 . PMID 18904764 .

[2] Schnupp J., Nelken I & King AJ 2011. Слуховые Neuroscience, MIT Press, глава 5.

[3] Блауэрт, Дж .: Пространственный слух: психофизика локализации звука человека; MIT Press; Кембридж, Массачусетс (1983)

[Thompson-4] Томпсон, Дэниел М. Понимание звука: получение максимальной отдачи от вашего проекта или профессиональной студии звукозаписи. Бостон, Массачусетс: Беркли, 2005. Печать.

[Roads-5] Дороги, Кертис. Учебник компьютерной музыки. Кембридж, Массачусетс: Массачусетский технологический институт, 2007. Печать.

[Benade-6] Бенаде, Артур Х. Основы музыкальной акустики. Нью-Йорк: Oxford UP, 1976. Печать.

[7] Рэлей Л. XII. О нашем восприятии направления звука [J]. Лондонский, Эдинбургский и Дублинский философский журнал и журнал Science, 1907, 13 (74): 214-232.

[:0-8] Чжоу X. Техника виртуальной реальности [J]. Телекоммуникационная наука, 1996, 12 (7): 46-50.

[9] Ян Питт. «Слуховое восприятие» . Архивировано из оригинала на 2010-04-10.

[10] ДеЛян Ван; Гай Дж. Браун (2006). Вычислительный анализ слуховой сцены: принципы, алгоритмы и приложения . Wiley interscience. ISBN 9780471741091. Для синусоидальных сигналов, представленных в горизонтальной плоскости, пространственное разрешение является самым высоким для звуков, исходящих из средней плоскости (непосредственно перед слушателем) с MAA примерно на 1 градус, и оно заметно ухудшается, когда стимулы перемещаются в сторону - например, MAA составляет около 7 градусов для звуков, исходящих под углом 75 градусов.

[11] ttp://acousticslab.org/psychoacoustics/PMFiles/Module07a.htm

[WNR-12] а б Wallach, H; Newman, EB; Розенцвейг, MR (июль 1949 г.). «Эффект приоритета в локализации звука». Американский журнал психологии . 62 (3): 315–336. DOI : 10.2307 / 1418275 . JSTOR 1418275 . PMID 18134356 .

[HW1940-13] а б в Валлах, Ганс (октябрь 1940 г.). «Роль движений головы, вестибулярных и визуальных сигналов в локализации звука». Журнал экспериментальной психологии . 27 (4): 339–368. DOI : 10.1037 / h0054629 .

[14] Batteau D W. Роль ушной раковины в локализации человека [J]. Труды Лондонского королевского общества B: Биологические науки, 1967, 168 (1011): 158-180.

[15] Музыкант А.Д., Батлер Р.А. Влияние спектральных сигналов на ушных раковинах на локализацию звука [J]. Журнал Американского акустического общества, 1984, 75 (4): 1195-1200.

[16] «База данных CIPIC HRTF» . Архивировано из оригинала на 2013-09-13.

[17] Роберт А. БАТЛЕР; Ричард А. ХУМАНСКИ (1992). «Локализация звука в вертикальной плоскости с высокочастотными спектральными репликами и без них» (PDF) . Восприятие и психофизика . 51 (2): 182–186. DOI : 10.3758 / bf03212242 . PMID 1549436 .

[18] Роффлер Сюзанна К .; Батлер Роберт А. (1968). «Факторы, влияющие на локализацию звука в вертикальной плоскости» . J. Acoust. Soc. Am . 43 (6): 1255–1259. DOI : 10.1121 / 1.1910976 . PMID 5659493 .

[19] Thurlow, WR "Audition" в Клинг, JW & Риггс, LA, экспериментальной психологии , 3е издание, Холт Райнхарт и Уинстон, 1971, стр. 267-268.

[20] Валлах, H (1939). «О локализации звука». Журнал Акустического общества Америки . 10 (4): 270–274. DOI : 10.1121 / 1.1915985 .

[21] Кидд, Шон А .; Келли, Джек Б. (1996-11-15). «Вклад дорсального ядра латерального лемниска в бинауральные ответы в нижнем бугорке крысы: интерауральные временные задержки» . Журнал неврологии . 16 (22): 7390–7397. DOI : 10.1523 / JNEUROSCI.16-22-07390.1996 . ISSN 0270-6474 . PMC 6578946 . PMID 8929445 .

[:1-22] Чжао Р. Исследование системы локализации звуковых сигналов [D], Научно-технический университет Китая, 2006 г.

[23] Майлз Р.Н., Роберт Д., Хой Р.Р. (декабрь 1995 г.). «Механически соединенные уши для направленного слуха у паразитоидной мухи Ormia ochracea». J Acoust Soc Am . 98 (6): 3059–70. DOI : 10.1121 / 1.413830 . PMID 8550933 .

[24] Роберт Д., Майлз Р.Н., Хой Р.Р. (1996). «Направленный слух путем механического сцепления у паразитоидной мухи Ormia ochracea». J Comp Physiol [A] . 179 (1): 29–44. DOI : 10.1007 / BF00193432 . PMID 8965258 . S2CID 21452506 .

[25] Мейсон А.С., Ошинский М.Л., Хой Р.Р. (апрель 2001 г.). «Сверхострый направленный слух в слуховой системе на микроуровне». Природа . 410 (6829): 686–90. DOI : 10.1038 / 35070564 . PMID 11287954 . S2CID 4370356 .

[26] Хо С.К., Нариньш П.М. (апрель 2006 г.). «Направленность ушей приемника перепада давления у северной леопардовой лягушки Rana pipiens pipiens». J Comp Physiol [A] . 192 (4): 417–29. DOI : 10.1007 / s00359-005-0080-7 . PMID 16380842 . S2CID 5881898 .

[27] Пэйн, Роджер С., 1962. Как сипуха обнаруживает добычу с помощью слуха. Живая птица, первый ежегодник Корнельской лаборатории орнитологии , 151–159.

[Wade2005-28] а б в Уэйд, штат Нью-Джерси; Оно, Х (2005). «От дихоптического к дихотическому: исторические контрасты между бинокулярным зрением и бинауральным слухом». Восприятие . 34 (6): 645–68. DOI : 10,1068 / p5327 . PMID 16042189 . S2CID 43674057 .

[Beyer-29] Бейер, Роберт Т. (1999). Звуки нашего времени: двести лет акустике . Нью-Йорк: Спрингер. ISBN 978-0-387-98435-3.

[Wade2008-30] а б в г д е Уэйд, Николас Дж .; Дойч, Диана (июль 2008 г.). «Бинауральный слух - до и после стетофона» (PDF) . Акустика сегодня . 4 (3): 16–27. DOI : 10.1121 / 1.2994724 .

[1]

Звуковая локализация

Как звук достигает мозга

Нейронные взаимодействия

Конус смятения

Локализация звука слуховой системой человека

Общее введение

Теория дуплекса

Теория дуплекса

ITD и IID

Оценка для низких частот

Оценка для высоких частот

Теория эффекта фильтрации ушной раковины

Мотивации

Математическая модель

База данных HRTF

Другие подсказки для локализации трехмерного пространства

Монофонические реплики

Динамические бинауральные реплики

Расстояние до источника звука

Обработка сигналов

Локализация в закрытых помещениях

Конкретные техники с приложениями

Стереосистема с аудиопередачей

Стереосистема 3D паравиртуализации

Многоканальное стерео виртуальное воспроизведение

Животные

Боковая информация (слева, вперед, справа)

Odontocetes

В средней плоскости (спереди, сверху, сзади, снизу)

Наклон головы

Локализация с сдвоенными ушами (мухи)

Двухкоординатная локализация звука (совы)

История

Смотрите также

Рекомендации

Внешние ссылки