Психоакустика — это раздел психофизики , включающий научное изучение восприятия звука и аудиологии — того, как люди воспринимают различные звуки. В частности, это отрасль науки, изучающая психологические реакции, связанные со звуком (включая шум , речь и музыку ). Психоакустика является междисциплинарной областью многих областей, включая психологию, акустику, электронную инженерию, физику, биологию, физиологию и информатику. [1]
Слух — это не чисто механическое явление распространения волн , но также сенсорное и перцептивное событие; другими словами, когда человек что-то слышит, это что-то достигает уха в виде механической звуковой волны, распространяющейся по воздуху, но внутри уха преобразуется в нейронные потенциалы действия . Наружные волосковые клетки (ВВК) улитки млекопитающих обеспечивают повышенную чувствительность и лучшее [ необходимо уточнение ] частотное разрешение механической реакции улитковой перегородки. Затем эти нервные импульсы поступают в мозг, где они воспринимаются. Следовательно, во многих задачах акустики, например, при обработке звука, выгодно учитывать не только механику окружающей среды, но и тот факт, что и ухо, и мозг участвуют в процессе прослушивания человеком. [ требуется уточнение ] [ нужна цитата ]
Внутреннее ухо , например, выполняет значительную обработку сигналов при преобразовании звуковых сигналов в нейронные стимулы, поэтому определенные различия между формами сигналов могут быть незаметны. [2] Методы сжатия данных , такие как MP3 , используют этот факт. [3] Кроме того, ухо имеет нелинейную реакцию на звуки различной интенсивности; этот нелинейный отклик называется громкостью . Телефонные сети и системы шумоподавления используют этот факт, нелинейно сжимая выборки данных перед передачей, а затем расширяя их для воспроизведения. [4] Другой эффект нелинейного отклика уха заключается в том, что звуки, близкие по частоте, создают фантомные ноты биений или продукты интермодуляционных искажений. [5]
Термин «психоакустика» также возникает в дискуссиях о когнитивной психологии и влиянии личных ожиданий, предубеждений и предрасположенностей на относительную оценку и сравнение звуковой эстетики и остроты слушателей, а также на различные определения слушателей относительного качества различных музыкальных произведений. инструментов и исполнителей. Выражение, что человек «слышит то, что хочет (или ожидает) услышать», может иметь место в таких дискуссиях. [ нужна ссылка ]
Человеческое ухо может номинально слышать звуки в диапазоне от 20 Гц (0,02 кГц) до 20 000 Гц (20 кГц). Верхний предел имеет тенденцию к снижению с возрастом; большинство взрослых не слышат выше 16 кГц. Самая низкая частота, которая была идентифицирована как музыкальный тон, составляет 12 Гц в идеальных лабораторных условиях. [6] Тоны в диапазоне от 4 до 16 Гц можно воспринимать через осязание тела .
Частотное разрешение уха составляет около 3,6 Гц в пределах октавы 1000–2000 Гц. То есть изменения высоты тона более 3,6 Гц могут быть восприняты в клинических условиях. [6] Тем не менее, даже меньшие различия высоты тона могут быть восприняты другими способами. Например, интерференцию двух тонов часто можно услышать как повторяющееся изменение громкости тона. Эта амплитудная модуляция происходит с частотой, равной разнице частот двух тонов, и называется биением .
Шкала полутонов , используемая в западной нотной записи, представляет собой не линейную шкалу частот, а логарифмическую . Другие шкалы были получены непосредственно из экспериментов с человеческим слуховым восприятием, такие как шкала мела и шкала Барка (они используются при изучении восприятия, но обычно не в музыкальных композициях), и они имеют приблизительно логарифмическую частоту на высокочастотном конце. , но почти линейный на низкочастотном конце.
Диапазон интенсивности слышимых звуков огромен. Барабанные перепонки человека чувствительны к изменениям звукового давления и могут обнаруживать изменения давления от нескольких микропаскалей (мкПа) до более чем 100 кПа . По этой причине уровень звукового давления также измеряется логарифмически, при этом все давления относятся к 20 мкПа (или 1,97385× 10-10 атм ). Поэтому нижний предел слышимости определяется как 0 дБ , а верхний предел не так четко определен. Верхний предел - это скорее вопрос предела, при котором ухо будет физически повреждено или может причинить вред.потеря слуха, вызванная шумом .
Более тщательное исследование нижних пределов слышимости определяет, что минимальный порог, при котором можно услышать звук, зависит от частоты. Измеряя эту минимальную интенсивность для тестирования тонов различных частот, можно получить частотно-зависимую кривую абсолютного порога слышимости (ATH). Как правило, ухо показывает пик чувствительности (т. е. его самый низкий ATH) между 1–5 кГц, хотя порог меняется с возрастом, а более старые уши демонстрируют снижение чувствительности выше 2 кГц. [7]
ATH является самым низким из контуров равной громкости . Контуры равной громкости показывают уровень звукового давления (дБ SPL) в диапазоне слышимых частот, которые воспринимаются как имеющие одинаковую громкость. Контуры равной громкости были впервые измерены Флетчером и Мансоном в Bell Labs в 1933 году с использованием чистых тонов, воспроизводимых через наушники, а собранные ими данные называются кривыми Флетчера-Мансона . Поскольку субъективную громкость было трудно измерить, кривые Флетчера-Мансона были усреднены по многим испытуемым.
Робинсон и Дадсон усовершенствовали процесс в 1956 году, чтобы получить новый набор кривых равной громкости для фронтального источника звука, измеренных в безэховой камере . Кривые Робинсона-Дадсона были стандартизированы как ISO 226 в 1986 году. В 2003 году ISO 226 был пересмотрен как контур равной громкости с использованием данных, собранных в результате 12 международных исследований.
Локализация звука — это процесс определения местоположения источника звука. Мозг использует тонкие различия в громкости, тоне и времени между двумя ушами, чтобы мы могли локализовать источники звука. [8] Локализация может быть описана в терминах трехмерного положения: азимута или горизонтального угла, зенита или вертикального угла и расстояния (для статических звуков) или скорости (для движущихся звуков). [9] Люди, как и большинство четвероногих животных , способны определять направление по горизонтали, но в меньшей степени по вертикали из-за симметричного расположения ушей. Некоторые виды сових уши расположены асимметрично, и они могут улавливать звук во всех трех плоскостях, что является приспособлением для охоты на мелких млекопитающих в темноте. [10]
В этом разделе не цитируются никакие источники . ( июнь 2016 г. ) |
Предположим, что слушатель может слышать данный акустический сигнал в условиях тишины. Когда сигнал воспроизводится во время воспроизведения другого звука (маскер), сигнал должен быть сильнее, чтобы слушатель мог его услышать. Маскеру не обязательно иметь частотные компоненты исходного сигнала для маскирования. Маскированный сигнал можно услышать, даже если он слабее маскирующего. Маскировка происходит, когда сигнал и маскирующий сигнал воспроизводятся вместе — например, когда один человек шепчет, а другой кричит — и слушатель не слышит более слабый сигнал, поскольку он маскируется более громким маскирующим. Маскирование также может произойти с сигналом до запуска маскирования или после его остановки. Например, один внезапный громкий звук хлопка может сделать звуки, которые непосредственно предшествуют или следуют за ним, неслышимыми. Эффекты обратной маскировкислабее, чем прямая маскировка. Маскирующий эффект широко изучался в психоакустических исследованиях. Можно изменить уровень маскирующего устройства и измерить порог, а затем построить диаграмму кривой психофизической настройки, которая выявит аналогичные особенности. Эффекты маскировки также используются при кодировании звука с потерями, например в MP3 .
При представлении гармонического ряда частот в соотношении 2 f , 3 f , 4 f , 5 f и т. д . (где f - конкретная частота) люди склонны воспринимать высоту звука как f . Звуковой пример можно найти на YouTube. [11]
Психоакустическая модель обеспечивает высококачественное сжатие сигнала с потерями , описывая, какие части данного цифрового аудиосигнала можно удалить (или агрессивно сжать) безопасно, то есть без значительных потерь в (сознательно) воспринимаемом качестве звука.
Это может объяснить, почему резкий хлопок в ладоши может показаться болезненно громким в тихой библиотеке, но едва заметным после того, как машина даст обратный эффект на оживленной городской улице. Это значительно улучшает общую степень сжатия, и психоакустический анализ обычно приводит к сжатым музыкальным файлам, размер которых составляет от 1/10 до 1/12 размера высококачественных оригиналов, но с заметно меньшей пропорциональной потерей качества. Такое сжатие характерно почти для всех современных форматов сжатия аудио с потерями. Некоторые из этих форматов включают Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (используется для цифрового аудиовещания ).в некоторых странах) и ATRAC , сжатие, используемое в MiniDisc и некоторых моделях Walkman .
Психоакустика в значительной степени основана на анатомии человека , особенно на ограничениях уха в восприятии звука, как было указано ранее. Подводя итог, эти ограничения таковы:
Алгоритм сжатия может назначать более низкий приоритет звукам за пределами диапазона человеческого слуха. Тщательно перемещая биты от неважных компонентов к важным, алгоритм гарантирует, что звуки, которые слушатель, скорее всего, воспримет, будут представлены наиболее точно.
Психоакустика включает темы и исследования, имеющие отношение к музыкальной психологии и музыкальной терапии . Теоретики, такие как Бенджамин Борец , считают, что некоторые результаты психоакустики имеют смысл только в музыкальном контексте. [12]
Пластинки серии Environments Ирва Тейбеля ( 1969–79) являются ранним примером коммерчески доступных звуков, выпущенных специально для улучшения психологических способностей. [13]
Психоакустика долгое время находилась в симбиотических отношениях с информатикой . Первооткрыватели Интернета Дж. К. Р. Ликлайдер и Боб Тейлор оба закончили дипломную работу в области психоакустики, а BBN Technologies изначально специализировалась на консультировании по вопросам акустики, прежде чем приступить к созданию первой сети с коммутацией пакетов .
Ликлайдер написал статью под названием «Дуплексная теория восприятия высоты тона». [14]
Психоакустика применяется во многих областях разработки программного обеспечения, где разработчики отображают проверенные и экспериментальные математические закономерности в цифровой обработке сигналов. Многие кодеки сжатия звука, такие как MP3 и Opus , используют психоакустическую модель для увеличения степени сжатия. Успех обычных аудиосистем для воспроизведения музыки в театрах и домах можно объяснить психоакустикой [15] , а психоакустические соображения привели к появлению новых аудиосистем, таких как психоакустический синтез звукового поля . [16] Кроме того, ученые экспериментировали с ограниченным успехом по созданию нового акустического оружия, излучающего частоты, которые могут повредить, повредить или убить.[17] Психоакустика также используется в сонификации , чтобы сделать несколько независимых измерений данных слышимыми и легко интерпретируемыми. [18] Это обеспечивает слуховое руководство без необходимости пространственного звука и в компьютерных играх с ультразвуковой обработкой [19] и других приложениях, таких какполеты дронов и хирургия под визуальным контролем . [20] Это также применяется сегодня в музыке, где музыканты и художники продолжают создавать новые слуховые ощущения, маскируя нежелательные частоты инструментов, усиливая другие частоты. Еще одним приложением является разработка небольших громкоговорителей или громкоговорителей более низкого качества, которые могут использовать явлениенедостающие основы для создания эффекта басовых нот на более низких частотах, чем физически способны воспроизводить громкоговорители (см. ссылки).
Производители автомобилей проектируют свои двигатели и даже двери так, чтобы они издавали определенный звук. [21]
Викискладе есть медиафайлы, связанные с психоакустикой . |