Из Википедии, бесплатной энциклопедии
  (Перенаправлен с бинаурального слушания )
Перейти к навигации Перейти к поиску

Локализация звука - это способность слушателя определять местоположение или источник обнаруженного звука по направлению и расстоянию.

Механизмы локализации звука в слуховой системе млекопитающих широко изучены. Слуховая система использует несколько сигналов для локализации источника звука, включая разницу во времени и уровне (или разность интенсивности) между обоими ушами, спектральную информацию, временной анализ, корреляционный анализ и сопоставление образов.

Эти сигналы также используются другими животными, но могут быть различия в использовании, а также есть сигналы локализации, которые отсутствуют в слуховой системе человека, такие как эффекты движений ушей. Животные, обладающие способностью локализовать звук, имеют явное эволюционное преимущество.

Как звук достигает мозга [ править ]

Звук - это результат восприятия механических колебаний, проходящих через среду, такую ​​как воздух или вода. Через механизмы сжатия и разрежения звуковые волны проходят по воздуху, отражаются от ушной раковины и раковины наружного уха и попадают в слуховой проход. Звуковые волны вибрировать барабанную перепонку ( барабанную перепонку ), в результате чего три кости среднего уха вибрировать, который затем посылает энергию через овальное окно и в улитке , где он преобразуется в химический сигнал от волосковых клеток в органе Корти , который синапс на спиральных ганглиев волокон , что путешествие черезкохлеарный нерв в мозг.

Нейронные взаимодействия [ править ]

В позвоночных , в -ушные различия во время , как известно , должны быть рассчитаны в превосходном оливарном ядра в стволе головного мозга . Согласно Джеффрессу , [1] этот расчет основан на линиях задержки : нейроны в верхних оливах , которые принимают иннервацию от каждого уха с различной соединительными аксонами длиной. Некоторые клетки более непосредственно связаны с одним ухом, чем с другим, поэтому они специфичны для определенной разницы во времени между ушами. Эта теория эквивалентна математической процедуре взаимной корреляции . Однако, поскольку теория Джеффресса не может объяснить эффект приоритета, в котором только первый из нескольких идентичных звуков используется для определения местоположения звуков (что позволяет избежать путаницы, вызванной эхом), его нельзя полностью использовать для объяснения реакции. Более того, ряд недавних физиологических наблюдений, сделанных в среднем мозге и стволе мозга мелких млекопитающих, поставили под сомнение обоснованность первоначальных идей Джеффресса. [2]

Нейроны, чувствительные к меж слуховой разнице уровней (ILD), возбуждаются стимуляцией одного уха и подавляются стимуляцией другого уха, так что величина ответа клетки зависит от относительной силы двух входов, которые, в свою очередь, зависят от по интенсивности звука в ушах.

В слуховом ядре среднего мозга, нижнем холмике (IC), многие чувствительные к ILD нейроны имеют функции ответа, которые резко снижаются от максимальных до нулевых всплесков в зависимости от ILD. Однако есть также много нейронов с гораздо более неглубокими функциями ответа, которые не опускаются до нулевых пиков.

Конус замешательства [ править ]

Большинство млекопитающих умеют определять местоположение источника звука, используя межуральные временные различия и межуральные различия уровней. Однако такой разницы во времени или уровне не существует для звуков, исходящих по окружности круглых конических срезов, где ось конуса проходит вдоль линии между двумя ушами.

Следовательно, звуковые волны, возникающие в любой точке по заданной высоте наклона окружности, будут иметь неоднозначные координаты восприятия. Другими словами, слушатель не сможет определить, исходит ли звук сзади, спереди, сверху, снизу или где-либо еще по окружности у основания конуса на любом заданном расстоянии от уха. Конечно, важность этих неоднозначностей исчезающе мала для источников звука, очень близких или очень далеких от объекта, но именно эти промежуточные расстояния наиболее важны с точки зрения пригодности.

Эти неоднозначности можно устранить, наклонив голову, что может привести к сдвигу как амплитуды, так и фазы звуковых волн, поступающих в каждое ухо. Это переводит вертикальную ориентацию интерауральной оси по горизонтали, тем самым задействуя механизм локализации в горизонтальной плоскости. Более того, даже без изменения угла межуральной оси (то есть без наклона головы) слуховой аппарат может использовать интерференционные паттерны, создаваемые ушными раковинами, туловищем и даже временным перенацеливанием руки как продолжением ушной раковины. (например, обхватив ухо ладонью).

Как и в случае с другими сенсорными стимулами, устранение неоднозначности восприятия также достигается за счет интеграции множества сенсорных входов, особенно визуальных сигналов. Локализовав звук в пределах окружности на некотором воспринимаемом расстоянии, визуальные подсказки служат для определения местоположения звука. Более того, предварительное знание местоположения источника звука поможет определить его текущее местоположение.

Локализация звука слуховой системой человека [ править ]

Локализация звука - это процесс определения местоположения источника звука . Объективно говоря, основной целью локализации звука является моделирование определенного звукового поля, включая акустические источники, слушателя, средства массовой информации и среду распространения звука. Мозг использует тонкие различия в интенсивности, спектральных и временных характеристиках, чтобы мы могли локализовать источники звука. [3] [4] В этом разделе, чтобы глубже понять слуховой механизм человека, мы кратко обсудим теорию локализации человеческого уха.

Общее введение [ править ]

Локализацию можно описать в терминах трехмерного положения: азимутального или горизонтального угла, возвышения или вертикального угла, а также расстояния (для статических звуков) или скорости (для движущихся звуков). [5]

Азимут звука определяется разницей во времени прихода между ушами , относительной амплитудой высокочастотных звуков (эффект тени) и асимметричными спектральными отражениями от различных частей нашего тела, включая туловище, плечи, и ушные раковины . [5]

Признаками расстояния являются потеря амплитуды, потеря высоких частот и отношение прямого сигнала к реверберированному сигналу. [5]

В зависимости от того, где находится источник, наша голова действует как барьер для изменения тембра , интенсивности и спектральных качеств звука, помогая мозгу сориентироваться, откуда исходит звук. [4] Эти мельчайшие различия между двумя ушами известны как межушные сигналы. [4]

Более низкие частоты и более длинные волны рассеивают звук вокруг головы, заставляя мозг сосредотачиваться только на сигналах фазировки от источника. [4]

Гельмут Хаас обнаружил, что мы можем различить источник звука, несмотря на дополнительные отражения на 10 децибел громче, чем исходный фронт волны, используя фронт самой ранней волны. [4] Этот принцип известен как эффект Хааса , особая версия эффекта приоритета . [4] Хаас измерил разницу во времени между исходным звуком и отраженным звуком с точностью до 1 миллисекунды, увеличив объем, позволяя мозгу распознать истинное местоположение исходного звука. Нервная система объединяет все ранние отражения в единое перцептивное целое, позволяя мозгу обрабатывать несколько разных звуков одновременно. [6]Нервная система объединяет отражения, которые находятся в пределах 35 миллисекунд друг от друга и имеют одинаковую интенсивность. [6]

Теория дуплекса [ править ]

Чтобы определить латеральное направление ввода (влево, вперед, вправо), слуховая система анализирует следующую информацию о слуховых сигналах:

Теория дуплекса [ править ]

В 1907 году лорд Рэлей использовал камертоны для создания монофонического возбуждения и изучил теорию боковой локализации звука на модели головы человека без ушной раковины. Он первым представил теорию локализации звука, основанную на интерауральных ключах, которая известна как теория дуплекса. [7] Человеческие уши находятся по разные стороны головы, поэтому они имеют разные координаты в пространстве. Как показано на рис. 2, поскольку расстояния между акустическим источником и ушами различаются, между звуковыми сигналами двух ушей существует разница во времени и разница в интенсивности. Мы называем эти виды различий как интерактивная разница во времени (ITD) и интерактивная разница в интенсивности (IID) соответственно.

рис.2 Теория дуплекса

ITD и IID [ править ]

Межуральная разность уровней ( ILD ) между левым ухом (левым) и правым ухом (справа).
[ источник звука : развертка справа]

Из рисунка 2 видно, что независимо от источника B1 или источника B2, будет задержка распространения между двумя ушами, которая будет генерировать ITD. Одновременно человеческая голова и уши могут оказывать затенение на высокочастотные сигналы, которые генерируют IID.

  • Интерактивная разница во времени (ITD) Звук из правой стороны достигает правого уха раньше, чем левого уха. Слуховая система оценивает межуральные временные различия по: (а) задержкам фазы на низких частотах и ​​(б) групповым задержкам на высоких частотах.
  • Массовые эксперименты показывают, что ITD относится к частоте сигнала f. Предположим, что угловое положение акустического источника равно θ, радиус головки равен r, а скорость звука равна c, функция ITD определяется выражением [8] . В приведенной выше закрытой форме мы предположили, что 0 градусов находится справа перед головой, а против часовой стрелки положительно.
  • Интерактивная разница в интенсивности (IID) или межуральная разница уровней (ILD) Звук с правой стороны имеет более высокий уровень в правом ухе, чем в левом ухе, потому что голова затеняет левое ухо. Эти различия уровней сильно зависят от частоты и увеличиваются с увеличением частоты. Масштабные теоретические исследования показывают, что IID зависит от частоты сигнала f и углового положения акустического источника θ. Функция IID определяется следующим образом: [8]
  • Для частот ниже 1000 Гц оцениваются в основном ITD ( фазовые задержки ), для частот выше 1500 Гц оцениваются в основном IID. Между 1000 Гц и 1500 Гц есть переходная зона, где оба механизма играют роль.
  • Точность локализации составляет 1 градус для источников перед слушателем и 15 градусов для источников по бокам. Люди могут различать межзубные промежутки времени в 10 микросекунд или меньше. [9] [10]

Оценка низких частот [ править ]

Для частот ниже 800 Гц размеры головы (расстояние до уха 21,5 см, что соответствует межуральной временной задержке 625 мкс) меньше половины длины волны звуковых волн. Таким образом, слуховая система может без путаницы определять фазовые задержки между обоими ушами. Межуровневые различия в уровнях очень малы в этом диапазоне частот, особенно ниже примерно 200 Гц, поэтому точная оценка направления входного сигнала практически невозможна на основе одних только разностей уровней. Когда частота падает ниже 80 Гц, становится трудно или невозможно использовать разницу во времени или разность уровней для определения бокового источника звука, потому что разность фаз между ушами становится слишком малой для направленной оценки. [11]

Оценка для высоких частот [ править ]

Для частот выше 1600 Гц размеры головы больше длины звуковых волн. Однозначное определение направления входа на основе одной только межузельной фазы на этих частотах невозможно. Тем не менее, межуровневые различия становятся больше, и эти различия уровней оцениваются слуховой системой. Также групповые задержкимежду ушами можно оценить, и более выражен на более высоких частотах; то есть, если есть начало звука, задержка этого начала между ушами может использоваться для определения направления входа соответствующего источника звука. Этот механизм становится особенно важным в реверберационной среде. После начала звука есть короткий промежуток времени, когда прямой звук достигает ушей, но еще не отраженный звук. Слуховая система использует этот короткий промежуток времени для оценки направления источника звука и сохраняет это обнаруженное направление до тех пор, пока отражения и реверберация не позволяют однозначно оценить направление. [12]Описанные выше механизмы не могут использоваться для различения источника звука впереди слушателя или позади слушателя; поэтому необходимо оценивать дополнительные сигналы. [13]

Теория эффекта фильтрации ушной раковины [ править ]

рис.4 HRTF

Мотивации [ править ]

Теория дуплекса четко указывает, что ITD и IID играют важную роль в локализации звука, но они могут иметь дело только с проблемами боковой локализации. Например, согласно теории дуплекса, если два акустических источника симметрично расположены на правой передней и правой задней части головы человека, они будут генерировать равные ITD и IID, что называется эффектом модели конуса. Однако человеческое ухо действительно может различить этот набор источников. Кроме того, в естественном чувстве слуха только одно ухо, что означает отсутствие ITD или IID, может различать источники с высокой точностью. Из-за недостатков дуплексной теории исследователи предложили теорию эффекта фильтрации ушной раковины. [14]Форма ушной раковины человека очень особенная. Он вогнутый со сложными складками и асимметричен по горизонтали или вертикали. Отраженные волны и прямые волны будут генерировать частотный спектр на барабанной перепонке, связанный с акустическими источниками. Затем слуховые нервы локализуют источники по этому частотному спектру. Поэтому была предложена соответствующая теория, получившая название теории эффекта фильтрации ушной раковины. [15]

Математическая модель [ править ]

Эти спектральные подсказки, генерируемые эффектом фильтрации ушной раковины, могут быть представлены как передаточная функция, относящаяся к голове (HRTF). Соответствующие выражения во временной области называются импульсной характеристикой, связанной с головой (HRIR). HRTF также называется передаточной функцией из свободного поля в определенную точку слухового прохода. Обычно мы распознаем HRTF как системы LTI: [8]

,

где L и R обозначают левое и правое ухо соответственно. и представляют собой амплитуду звукового давления на входе в левый и правый слуховой проход. - амплитуда звукового давления в центре координаты головы, когда слушатель не существует. В общем, HRTF и являются функциями углового положения источника , угла возвышения , расстояния между источником и центром головы , угловой скорости и эквивалентного размера головы .

База данных HRTF [ править ]

В настоящее время основные институты, которые работают над измерением базы данных HRTF, включают CIPIC [16] International Lab, MIT Media Lab, Высшую школу психоакустики в университете Ольденбурга, лабораторию нейрофизиологии в Университете Висконсин-Мэдисон и лабораторию Эймса НАСА. . Базы данных HRIR от людей с нормальным и нарушенным слухом и от животных общедоступны.

инжир. 5 HRIR

Другие подсказки для локализации трехмерного пространства [ править ]

Монофонические реплики [ править ]

Наружное ухо человека , то есть структуры ушной раковины и наружного слухового прохода , образуют фильтры, выбирающие направление. В зависимости от направления ввода звука в средней плоскости активируются различные резонансы фильтра. Эти резонансы имплантируют специфические для направления паттерны в частотные характеристики ушей, которые могут быть оценены слуховой системой для определения вертикальной локализации звука . Вместе с другими отражениями в голове, плечах и туловище, избирательно влияющими на направление, они формируют передаточные функции внешнего уха. Эти закономерности в частотных характеристиках ухаочень индивидуальны и зависят от формы и размера наружного уха. Если звук передается через наушники и был записан через другую голову с внешними поверхностями уха другой формы, диаграммы направленности отличаются от собственных, и при попытке оценить направления в средней плоскости этими чужеродными ушами возникнут проблемы. Как следствие, перестановки спереди и сзади или локализация внутри головы могут появляться при прослушивании записей фиктивной головы , или иначе называемых бинауральными записями. Было показано, что люди могут монофонически локализовать высокочастотный звук, но не низкочастотный звук. Однако бинауральная локализация возможна с более низкими частотами. Вероятно, это связано с тем, что ушная раковина достаточно мала, чтобы взаимодействовать только со звуковыми волнами высокой частоты.[17] Кажется, что люди могут точно определить высоту только сложных звуков, включающих частоты выше 7000 Гц, при этом должна присутствовать ушная раковина. [18]

Динамические бинауральные реплики [ править ]

Когда голова неподвижна, бинауральные сигналы для латеральной локализации звука (межуральная разница во времени и межуральная разница уровней) не дают информации о расположении звука в средней плоскости. Идентичные ITD и ILD могут создаваться звуками на уровне глаз или на любой высоте, если поперечное направление остается постоянным. Однако, если голова повернута, ITD и ILD изменяются динамически, и эти изменения различны для звуков на разных высотах. Например, если источник звука на уровне глаз находится прямо перед собой, а голова поворачивается влево, звук становится громче (и поступает раньше) в правое ухо, чем в левое. Но если источник звука находится прямо над головой, при повороте головы изменения в ITD и ILD не произойдет. Промежуточные высоты производят промежуточные степени изменения,и если представление бинауральных сигналов двум ушам во время движения головы обратное, звук будет слышен позади слушателя.[13] [19] Ганс Валлах [20]искусственно изменял бинауральные реплики звука во время движений головы. Хотя звук объективно размещался на уровне глаз, динамические изменения ITD и ILD при повороте головы были такими, которые возникли бы, если бы источник звука был приподнят. В этой ситуации звук был слышен на синтезированной высоте. Тот факт, что источники звука объективно оставались на уровне глаз, не позволял монофоническим сигналам определять высоту, показывая, что именно динамическое изменение бинауральных сигналов во время движения головы позволило правильно локализовать звук в вертикальном измерении. Нет необходимости активно производить движения головы; точная вертикальная локализация произошла в аналогичной установке, когда вращение головы производилось пассивно, путем посадки субъекта с завязанными глазами на вращающийся стул.Пока динамические изменения бинауральных сигналов сопровождали воспринимаемое вращение головы, синтезированное возвышение воспринималось.[13]

Расстояние до источника звука [ править ]

[ необходима цитата ]

Слуховая система человека имеет лишь ограниченные возможности для определения расстояния до источника звука. На близком расстоянии есть некоторые показания для определения расстояния, такие как крайние различия уровней (например, при шепоте в одно ухо) или определенные резонансы ушной раковины (видимая часть уха) на близком расстоянии.

Слуховая система использует эти подсказки для оценки расстояния до источника звука:

  • Коэффициент прямого / отраженного звука: в закрытых помещениях к слушателю поступают два типа звука: прямой звук достигает ушей слушателя, не отражаясь от стены. Отраженный звук хотя бы один раз отражался от стены, прежде чем достиг слушателя. Соотношение между прямым и отраженным звуком может дать представление о расстоянии до источника звука.
  • Громкость: далекие источники звука имеют меньшую громкость, чем близкие. Этот аспект можно особенно оценить для известных источников звука.
  • Звуковой спектр: высокие частоты быстрее затухают воздухом, чем низкие частоты. Следовательно, удаленный источник звука звучит более приглушенно, чем близкий, поскольку приглушаются высокие частоты. Для звука с известным спектром (например, речи) расстояние можно приблизительно оценить с помощью воспринимаемого звука.
  • ITDG: Начальный временной интервал задержки описывает разницу во времени между приходом прямой волны и первым сильным отражением от слушателя. Соседние источники создают относительно большую ITDG, причем первым отражениям нужно пройти более длинный путь, возможно, во много раз дольше. Когда источник находится далеко, прямая и отраженная звуковые волны имеют одинаковую длину пути.
  • Движение: Подобно зрительной системе, в слуховом восприятии существует также явление параллакса движения . Для движущегося слушателя близлежащие источники звука проходят быстрее, чем удаленные источники звука.
  • Разница в уровнях: очень близкие источники звука вызывают различный уровень между ушами.

Обработка сигнала [ править ]

Обработка звука слуховой системой человека осуществляется в так называемых критических диапазонах . Диапазон слышимости разделен на 24 критических диапазона шириной 1 барк или 100 Мел каждая . Для направленного анализа сигналы внутри критической полосы анализируются вместе.

Слуховая система может извлекать звук желаемого источника звука из мешающего шума. Это позволяет слушателю сосредоточиться только на одном выступающем, если говорят и другие выступающие ( эффект коктейльной вечеринки ). С помощью эффекта коктейльной вечеринки звук с мешающих направлений воспринимается приглушенным по сравнению со звуком с нужного направления. Слуховая система может увеличить отношение сигнал / шум до 15  дБ , что означает, что мешающий звук воспринимается как ослабленный до половины (или меньше) его фактической громкости . [ необходима цитата ]

Локализация в закрытых помещениях [ править ]

В закрытых помещениях в уши слушателя поступает не только прямой звук от источника звука, но и звук, отражающийся от стен. Слуховая система анализирует только прямой звук [12], который поступает первым, для локализации звука, но не отраженный звук, который приходит позже ( закон фронта первой волны ). Таким образом, локализация звука остается возможной даже в эхогенной среде. Это эхоподавление происходит в дорсальном ядре латерального лемниска (DNLL). [21]

Чтобы определить периоды времени, в которых преобладает прямой звук и которые можно использовать для оценки направленности, слуховая система анализирует изменения громкости в различных критических полосах, а также стабильность воспринимаемого направления. Если имеется сильная атака громкости в нескольких критических диапазонах и если воспринимаемое направление стабильно, эта атака, по всей вероятности, вызвана прямым звуком источника звука, который поступает недавно или который меняет характеристики своего сигнала. Этот короткий период времени используется слуховой системой для анализа направленности и громкости звука. Когда отражения приходят немного позже, они не так сильно увеличивают громкость внутри критических полос, но сигналы направления становятся нестабильными, потому что есть смесь звука нескольких направлений отражения.В результате слуховая система не запускает новый направленный анализ.

Это первое обнаруженное направление от прямого звука принимается за направление найденного источника звука, пока другие сильные атаки на громкость в сочетании со стабильной информацией о направлении не укажут, что возможен новый анализ направленности. (см. эффект Франссена )

Особые методы работы с приложениями [ править ]

Стереосистема звуковой передачи [ править ]

Этот вид техники локализации звука дает нам настоящую виртуальную стереосистему . [22] Он использует "умные" манекены, такие как KEMAR, для сбора сигналов или методы цифровой обработки сигналов для моделирования процесса передачи от источников к ушам. После усиления, записи и передачи два канала принятых сигналов будут воспроизводиться через наушники или динамики. Этот подход локализации использует электроакустические методы для получения пространственной информации исходного звукового поля путем перевода слухового аппарата слушателя в исходное звуковое поле. Самым значительным преимуществом этого является то, что его акустические изображения живые и естественные. Кроме того, для воспроизведения акустического изображения 3D-системы требуется всего два независимых передаваемых сигнала.

инжир. 6 Локализация звука с помощью манекена

Стереосистема 3D паравиртуализации [ править ]

Представителями такого рода систем являются SRS Audio Sandbox, Spatializer Audio Lab и Qsound Qxpander. [22]Они используют HRTF для имитации акустических сигналов, принимаемых в ушах с разных направлений, с обычным стереовоспроизведением двоичных каналов. Таким образом, они могут имитировать отраженные звуковые волны и улучшать субъективное ощущение пространства и окружающего пространства. Поскольку они представляют собой стереосистемы с паравиртуализацией, их основная цель - имитировать стереозвук. В традиционных стереосистемах используются датчики, которые сильно отличаются от человеческих ушей. Хотя эти датчики могут получать акустическую информацию с разных направлений, они не имеют той же частотной характеристики, что и слуховая система человека. Следовательно, когда применяется бинарный режим, слуховые системы человека по-прежнему не могут ощущать поле трехмерных звуковых эффектов. Однако стереосистема с паравиртуализацией 3D преодолевает такие недостатки.Он использует принципы HRTF для извлечения акустической информации из исходного звукового поля, а затем для создания живого трехмерного звукового поля через обычные наушники или динамики.

Многоканальное стерео виртуальное воспроизведение [ править ]

Поскольку многоканальные стереосистемы требуют большого количества каналов воспроизведения, некоторые исследователи использовали технологии моделирования HRTF, чтобы уменьшить количество каналов воспроизведения. [22] Они используют только два динамика для имитации нескольких динамиков в многоканальной системе. Этот процесс называется виртуальным воспроизведением. По сути, такой подход использует как принцип межушных разностей, так и теорию эффекта фильтрации ушной раковины. К сожалению, такой подход не может полностью заменить традиционную многоканальную стереосистему, такую ​​как система объемного звучания 5.1 / 7.1 . Это связано с тем, что, когда зона прослушивания относительно больше, воспроизведение имитации через HRTF может вызвать инвертирование акустических изображений в симметричных положениях.

Животные [ править ]

Поскольку у большинства животных есть два уха, многие эффекты слуховой системы человека можно найти и у других животных. Таким образом, межуральная разница во времени (межуральная разница фаз) и межуральная разница уровней играют роль в слухе многих животных. Но влияние на локализацию этих эффектов зависит от размера головы, расстояния до ушей, положения ушей и ориентации ушей.

Боковая информация (слева, вперед, справа) [ править ]

Если уши расположены сбоку от головы, можно использовать такие же сигналы боковой локализации, как и для слуховой системы человека. Это означает: оценку межуральных разностей времени (межуральных фазовых разностей) для более низких частот и оценку разностей межуральных уровней для более высоких частот. Оценка межуральных фазовых различий полезна, если она дает однозначные результаты. Это так, если расстояние до уха меньше половины длины (максимальной одной длины волны) звуковых волн. Для животных с большей головой, чем у человека, диапазон оценки межуральных фазовых различий смещен в сторону более низких частот, для животных с меньшей головой этот диапазон смещен в сторону более высоких частот.

Самая низкая частота, которую можно локализовать, зависит от расстояния до уха. Животные с большим расстоянием между ушами могут определять более низкие частоты, чем люди. Для животных с меньшим расстоянием до ушей наименьшая локализуемая частота выше, чем для людей.

Если уши расположены сбоку от головы, межуральные различия уровня проявляются для более высоких частот и могут быть оценены для задач локализации. У животных с ушами на макушке не будет тени от головы, и, следовательно, будет гораздо меньше межуральных различий в уровнях, которые можно было бы оценить. Многие из этих животных могут двигать ушами, и эти движения ушей можно использовать в качестве сигнала боковой локализации.

Odontocetes [ править ]

Дельфины (и другие зубатки) полагаются на эхолокацию, чтобы помочь в обнаружении, идентификации, локализации и поимке добычи. Сигналы гидролокатора дельфинов хорошо подходят для определения местоположения нескольких небольших целей в трехмерной водной среде за счет использования высоконаправленной (ширина луча 3 дБ около 10 градусов), широкополосной (ширина полосы 3 дБ обычно составляет около 40 кГц; пиковые частоты от 40 кГц до 120 кГц), короткие щелчки (около 40 мкс). Дельфины могут локализовать звуки как пассивно, так и активно (эхолокация) с разрешением около 1 градуса. Межмодальное сопоставление (между зрением и эхолокацией) предполагает, что дельфины воспринимают пространственную структуру сложных объектов, опрашиваемых с помощью эхолокации, что, вероятно, требует пространственного разрешения индивидуальных особенностей объекта и интеграции в целостное представление формы объекта.Хотя дельфины чувствительны к небольшой бинауральной интенсивности и разнице во времени, все больше данных свидетельствует о том, что дельфины используют зависимые от положения спектральные сигналы, полученные из хорошо развитых передаточных функций, связанных с головой, для локализации звука как в горизонтальной, так и в вертикальной плоскостях. Очень маленькое время интегрирования (264 мкс) позволяет локализовать несколько целей на разных расстояниях. Адаптация к локализации включает выраженную асимметрию черепа, носовых мешков и специализированных липидных структур во лбу и челюстях, а также акустически изолированное среднее и внутреннее ухо.для локализации звука как в горизонтальной, так и в вертикальной плоскости. Очень маленькое время интегрирования (264 мкс) позволяет локализовать несколько целей на разных расстояниях. Адаптация к локализации включает выраженную асимметрию черепа, носовых мешков и специализированных липидных структур во лбу и челюстях, а также акустически изолированное среднее и внутреннее ухо.для локализации звука как в горизонтальной, так и в вертикальной плоскости. Очень маленькое время интегрирования (264 мкс) позволяет локализовать несколько целей на разных расстояниях. Адаптация к локализации включает выраженную асимметрию черепа, носовых мешков и специализированных липидных структур во лбу и челюстях, а также акустически изолированное среднее и внутреннее ухо.

В средней плоскости (спереди, сверху, сзади, снизу) [ править ]

У многих млекопитающих также есть ярко выраженные структуры в ушной раковине возле входа в ушной канал. Как следствие, могут появиться зависящие от направления резонансы, которые можно использовать как дополнительный сигнал локализации, аналогичный локализации в средней плоскости в слуховой системе человека. Существуют дополнительные сигналы локализации, которые также используются животными.

Наклон головы [ править ]

Для локализации звука в средней плоскости (возвышения звука) также могут использоваться два детектора, которые расположены на разной высоте. Однако у животных приблизительную информацию о высоте можно получить, просто наклонив голову, при условии, что звук длится достаточно долго, чтобы завершить движение. Это объясняет врожденное поведение [ неопределенного ] склонения головы набок при попытке точно локализовать звук. Чтобы получить мгновенную локализацию более чем в двух измерениях с помощью сигналов разности во времени или разности амплитуд, требуется более двух детекторов.

Локализация при сдвоенных ушах (мухи) [ править ]

Крошечная паразитическая муха Ormia ochracea стала модельным организмом в экспериментах по локализации звука из-за своего уникального уха . Животное слишком маленькое, чтобы можно было рассчитать обычным способом разницу во времени звука, поступающего в два уха, однако оно может определять направление источников звука с исключительной точностью. В барабанной мембраны противоположных ушах непосредственно соединены механически, позволяя разрешение суб-микросекунды разницы во времени [23] [24] и требует новой стратегии кодирования нейронная. [25] Хо [26] показал, что система связанной барабанной перепонки у лягушек может приводить к увеличению межуральных колебаний вибрации, когда только небольшиеВремя прибытия и разница в уровне звука были доступны для головы животного. В настоящее время ведутся работы по созданию направленных микрофонов на основе барабанной перепонки.

Двухкоординатная локализация звука (совы) [ править ]

Большинство сов - ночные или сумеречные хищные птицы . Поскольку они охотятся ночью, они должны полагаться на невизуальные чувства. Эксперименты Роджера Пейна [27] показали, что совы чувствительны к звукам, издаваемым их добычей, а не к теплу или запаху. Фактически, звуковые сигналы необходимы и достаточны для локализации мышей из отдаленного места, где они сидят. Чтобы это работало, совы должны уметь точно определять как азимут, так и высоту источника звука.

История [ править ]

Термин «бинауральный» буквально означает «слышать двумя ушами» и был введен в 1859 году для обозначения практики прослушивания одного и того же звука обоими ушами или двух отдельных звуков, по одному через каждое ухо. Только в 1916 году Карл Штумпф (1848–1936), немецкий философ и психолог , различал дихотическое слушание, которое относится к стимуляции каждого уха разными стимулами , и диотическое слушание, одновременное раздражение обоих ушей с помощью тот же стимул. [28]

Позже станет очевидно, что бинауральный слух, дихотический или диотический, является средством, с помощью которого происходит локализация звука. [28] [29] [ необходима страница ]

Научное рассмотрение бинаурального слуха началось до того, как это явление было названо так, с предположений, опубликованных в 1792 году Уильямом Чарльзом Уэллсом (1757–1817), основанными на его исследованиях бинокулярного зрения . [30] Джованни Баттиста Вентури (1746–1822) провел и описал эксперименты, в которых люди пытались локализовать звук, используя оба уха или одно ухо, заблокированное пальцем. Эта работа не получила дальнейшего развития и была восстановлена ​​только после того, как другие выяснили, как работает локализация человеческого звука. [28] [30] Лорд Рэлей (1842–1919) проводил те же эксперименты и приходил к результатам, не зная, что Вентури впервые провел их, почти семьдесят пять лет спустя. [30]

Чарльз Уитстон (1802–1875) работал над оптикой и смешиванием цветов, а также исследовал слух. Он изобрел устройство, которое он назвал «микрофоном», который состоял из металлических пластин над каждым ухом, каждая из которых была соединена с металлическими стержнями; он использовал это устройство для усиления звука. Он также проводил эксперименты, поднося камертоны к обоим ушам одновременно или по отдельности, пытаясь выяснить, как работает слух, которые он опубликовал в 1827 году. [30] Эрнст Генрих Вебер (1795–1878) и Август Зеебек (1805) –1849) и Уильям Чарльз Уэллс также попытались сравнить и противопоставить то, что стало известно как бинауральный слух, с принципами бинокулярной интеграции в целом. [30]

Понимание того, как различия в звуковых сигналах между двумя ушами вносят свой вклад в слуховой обработки таким образом, чтобы дать возможность локализации звука и направление значительно продвинулись после изобретения стетоскопа по Somerville Скотт Alison в 1859 году, который ввел термин «бинауральных». Элисон основала стетофон на стетоскопе , который был изобретен Рене Теофилем Гиацинтом Лаэннеком (1781–1826); у стетофона было два отдельных «звукоснимателя», позволяющих пользователю слышать и сравнивать звуки, исходящие из двух отдельных мест. [30]

См. Также [ править ]

  • Акустическая локация
  • Эхолокация животных
  • Бинауральный фьюжн
  • Обнаружение совпадений в нейробиологии
  • Эхолокация человека
  • Локализация 3D звука на основе восприятия
  • Психоакустика
  • Пространственная потеря слуха

Ссылки [ править ]

  1. ^ Джеффресс LA (1948). «Теория места локализации звука». Журнал сравнительной и физиологической психологии . 41 (1): 35–39. DOI : 10.1037 / h0061495 . PMID  18904764 .
  2. ^ Schnupp J., Nelken I & King AJ 2011. Слуховые Neuroscience, MIT Press, глава 5.
  3. ^ Blauert, J .: Пространственный слух: психофизика локализации звука человека; MIT Press; Кембридж, Массачусетс (1983)
  4. ^ a b c d e f Томпсон, Дэниел М. Понимание звука: получение максимальной отдачи от вашего проекта или профессиональной студии звукозаписи. Бостон, Массачусетс: Беркли, 2005. Печать.
  5. ^ a b c Дороги, Кертис. Учебник компьютерной музыки. Кембридж, Массачусетс: Массачусетский технологический институт, 2007. Печать.
  6. ^ a b Бенаде, Артур Х. Основы музыкальной акустики. Нью-Йорк: Oxford UP, 1976. Печать.
  7. ^ Рэлей Л. XII. О нашем восприятии направления звука [J]. Лондонский, Эдинбургский и Дублинский философский журнал и научный журнал, 1907, 13 (74): 214-232.
  8. ^ a b c Чжоу X. Техника виртуальной реальности [J]. Телекоммуникационная наука, 1996, 12 (7): 46-50.
  9. Ян Питт. «Слуховое восприятие» . Архивировано из оригинала на 2010-04-10.
  10. ^ ДеЛян Ван; Гай Дж. Браун (2006). Вычислительный анализ слуховой сцены: принципы, алгоритмы и приложения . Wiley interscience. ISBN 9780471741091. Для синусоидальных сигналов, представленных в горизонтальной плоскости, пространственное разрешение является самым высоким для звуков, исходящих из средней плоскости (непосредственно перед слушателем) с MAA примерно на 1 градус, и оно заметно ухудшается, когда стимулы перемещаются в сторону - например, MAA составляет около 7 градусов для звуков, исходящих под углом 75 градусов.
  11. ^ http://acousticslab.org/psychoacoustics/PMFiles/Module07a.htm
  12. ^ a b Валлах, H; Newman, EB; Розенцвейг, MR (июль 1949 г.). «Эффект приоритета в локализации звука». Американский журнал психологии . 62 (3): 315–336. DOI : 10.2307 / 1418275 . JSTOR 1418275 . PMID 18134356 .  
  13. ^ a b c Валлах, Ганс (октябрь 1940 г.). «Роль движений головы, вестибулярных и визуальных сигналов в локализации звука». Журнал экспериментальной психологии . 27 (4): 339–368. DOI : 10.1037 / h0054629 .
  14. ^ Batteau D W. Роль ушной раковины в локализации человека [J]. Труды Лондонского королевского общества B: Биологические науки, 1967, 168 (1011): 158-180.
  15. ^ Музыкант А.Д., Батлер Р.А. Влияние спектральных сигналов на ушных раковинах на локализацию звука [J]. Журнал Американского акустического общества, 1984, 75 (4): 1195-1200.
  16. ^ "База данных CIPIC HRTF" . Архивировано из оригинала на 2013-09-13.
  17. ^ Роберт А. БАТЛЕР; Ричард А. ХУМАНСКИ (1992). «Локализация звука в вертикальной плоскости с высокочастотными спектральными подсказками и без них» (PDF) . Восприятие и психофизика . 51 (2): 182–186. DOI : 10.3758 / bf03212242 . PMID 1549436 .  
  18. ^ Роффлер Сюзанна К .; Батлер Роберт А. (1968). «Факторы, влияющие на локализацию звука в вертикальной плоскости» . J. Acoust. Soc. Am . 43 (6): 1255–1259. DOI : 10.1121 / 1.1910976 . PMID 5659493 . 
  19. ^ Thurlow, WR "Audition" в Клинг, JW & Риггс, LA, экспериментальной психологии , 3е издание, Холт Райнхарт и Уинстон, 1971, стр. 267-268.
  20. Перейти ↑ Wallach, H (1939). «О локализации звука». Журнал Акустического общества Америки . 10 (4): 270–274. DOI : 10.1121 / 1.1915985 .
  21. ^ Кидд, Шон А .; Келли, Джек Б. (1996-11-15). «Вклад дорсального ядра латерального лемниска в бинауральные ответы в нижнем бугорке крысы: интерауральные временные задержки» . Журнал неврологии . 16 (22): 7390–7397. DOI : 10.1523 / JNEUROSCI.16-22-07390.1996 . ISSN 0270-6474 . PMC 6578946 . PMID 8929445 .   
  22. ^ a b c Чжао Р. Исследование системы локализации звуковых сигналов [D], Научно-технический университет Китая, 2006 г.
  23. Майлз Р.Н., Роберт Д., Хой Р.Р. (декабрь 1995 г.). «Механически соединенные уши для направленного слуха у паразитоидной мухи Ormia ochracea». J Acoust Soc Am . 98 (6): 3059–70. DOI : 10.1121 / 1.413830 . PMID 8550933 . 
  24. ^ Роберт Д., Майлз Р. Н., Хой Р. Р. (1996). «Направленный слух путем механического сцепления у паразитоидной мухи Ormia ochracea». J Comp Physiol [A] . 179 (1): 29–44. DOI : 10.1007 / BF00193432 . PMID 8965258 . S2CID 21452506 .  
  25. ^ Mason AC, Oshinsky ML, Hoy RR (апрель 2001). «Сверхострый направленный слух в слуховой системе на микросхеме». Природа . 410 (6829): 686–90. DOI : 10.1038 / 35070564 . PMID 11287954 . S2CID 4370356 .  
  26. ^ Ho CC, Наринс PM (апрель 2006). «Направленность ушей приемника перепада давления у северной леопардовой лягушки Rana pipiens pipiens». J Comp Physiol [A] . 192 (4): 417–29. DOI : 10.1007 / s00359-005-0080-7 . PMID 16380842 . S2CID 5881898 .  
  27. Пэйн, Роджер С., 1962. Как сипуха обнаруживает добычу с помощью слуха. Живая птица, первый ежегодник Корнельской лаборатории орнитологии , 151–159
  28. ^ a b c Уэйд, штат Нью-Джерси; Оно, Х (2005). «От дихоптического к дихотическому: исторические контрасты между бинокулярным зрением и бинауральным слухом». Восприятие . 34 (6): 645–68. DOI : 10,1068 / p5327 . PMID 16042189 . S2CID 43674057 .  
  29. ^ Бейер, Роберт Т. (1999). Звуки нашего времени: двести лет акустике . Нью-Йорк: Спрингер. ISBN 978-0-387-98435-3.
  30. ^ a b c d e f Уэйд, Николас Дж .; Дойч, Диана (июль 2008 г.). «Бинауральный слух - до и после стетофона» (PDF) . Акустика сегодня . 4 (3): 16–27. DOI : 10.1121 / 1.2994724 .

Внешние ссылки [ править ]

  • auditoryneuroscience.com: Коллекция мультимедийных файлов и флэш-демонстраций, связанных с пространственным слухом
  • Сборник справок о локализации звука
  • Научные статьи о способностях к локализации звука у разных видов млекопитающих.
  • Обработка разницы в интерауральной интенсивности в слуховых нейронах среднего мозга: эффекты временного раннего тормозного входа
  • Центр онлайн-обучения - Слух и аудирование
  • HearCom: Hearing in the Communication Society, исследовательский проект ЕС
  • Исследование «Локализация вне зоны прямой видимости (NLOS) для помещений», проведенное CMR в UNSW
  • Введение в локализацию звука
  • Звук и комната
  • Введение в акустическую голографию
  • Введение в акустическое формирование луча