Психоакустика


Из Википедии, свободной энциклопедии
  (Перенаправлено из психоакустики )
Перейти к навигации Перейти к поиску

Психоакустика — это раздел психофизики , включающий научное изучение восприятия звука и аудиологии — того, как люди воспринимают различные звуки. В частности, это отрасль науки, изучающая психологические реакции, связанные со звуком (включая шум , речь и музыку ). Психоакустика является междисциплинарной областью многих областей, включая психологию, акустику, электронную инженерию, физику, биологию, физиологию и информатику. [1]

Задний план

Слух — это не чисто механическое явление распространения волн , но также сенсорное и перцептивное событие; другими словами, когда человек что-то слышит, это что-то достигает уха в виде механической звуковой волны, распространяющейся по воздуху, но внутри уха преобразуется в нейронные потенциалы действия . Наружные волосковые клетки (ВВК) улитки млекопитающих обеспечивают повышенную чувствительность и лучшее [ необходимо уточнение ] частотное разрешение механической реакции улитковой перегородки. Затем эти нервные импульсы поступают в мозг, где они воспринимаются. Следовательно, во многих задачах акустики, например, при обработке звука, выгодно учитывать не только механику окружающей среды, но и тот факт, что и ухо, и мозг участвуют в процессе прослушивания человеком. [ требуется уточнение ] [ нужна цитата ]

Внутреннее ухо , например, выполняет значительную обработку сигналов при преобразовании звуковых сигналов в нейронные стимулы, поэтому определенные различия между формами сигналов могут быть незаметны. [2] Методы сжатия данных , такие как MP3 , используют этот факт. [3] Кроме того, ухо имеет нелинейную реакцию на звуки различной интенсивности; этот нелинейный отклик называется громкостью . Телефонные сети и системы шумоподавления используют этот факт, нелинейно сжимая выборки данных перед передачей, а затем расширяя их для воспроизведения. [4] Другой эффект нелинейного отклика уха заключается в том, что звуки, близкие по частоте, создают фантомные ноты биений или продукты интермодуляционных искажений. [5]

Термин «психоакустика» также возникает в дискуссиях о когнитивной психологии и влиянии личных ожиданий, предубеждений и предрасположенностей на относительную оценку и сравнение звуковой эстетики и остроты слушателей, а также на различные определения слушателей относительного качества различных музыкальных произведений. инструментов и исполнителей. Выражение, что человек «слышит то, что хочет (или ожидает) услышать», может иметь место в таких дискуссиях. [ нужна ссылка ]

Пределы восприятия

Контур равной громкости . Обратите внимание на пиковую чувствительность около 2–4 кГц, в середине диапазона голосовых частот .

Человеческое ухо может номинально слышать звуки в диапазоне от 20 Гц (0,02 кГц) до 20 000 Гц (20 кГц). Верхний предел имеет тенденцию к снижению с возрастом; большинство взрослых не слышат выше 16 кГц. Самая низкая частота, которая была идентифицирована как музыкальный тон, составляет 12 Гц в идеальных лабораторных условиях. [6] Тоны в диапазоне от 4 до 16 Гц можно воспринимать через осязание тела .

Частотное разрешение уха составляет около 3,6 Гц в пределах октавы 1000–2000 Гц. То есть изменения высоты тона более 3,6 Гц могут быть восприняты в клинических условиях. [6] Тем не менее, даже меньшие различия высоты тона могут быть восприняты другими способами. Например, интерференцию двух тонов часто можно услышать как повторяющееся изменение громкости тона. Эта амплитудная модуляция происходит с частотой, равной разнице частот двух тонов, и называется биением .

Шкала полутонов , используемая в западной нотной записи, представляет собой не линейную шкалу частот, а логарифмическую . Другие шкалы были получены непосредственно из экспериментов с человеческим слуховым восприятием, такие как шкала мела и шкала Барка (они используются при изучении восприятия, но обычно не в музыкальных композициях), и они имеют приблизительно логарифмическую частоту на высокочастотном конце. , но почти линейный на низкочастотном конце.

Диапазон интенсивности слышимых звуков огромен. Барабанные перепонки человека чувствительны к изменениям звукового давления и могут обнаруживать изменения давления от нескольких микропаскалей (мкПа) до более чем 100 кПа . По этой причине уровень звукового давления также измеряется логарифмически, при этом все давления относятся к 20 мкПа (или 1,97385× 10-10 атм ). Поэтому нижний предел слышимости определяется как 0 дБ , а верхний предел не так четко определен. Верхний предел - это скорее вопрос предела, при котором ухо будет физически повреждено или может причинить вред.потеря слуха, вызванная шумом .

Более тщательное исследование нижних пределов слышимости определяет, что минимальный порог, при котором можно услышать звук, зависит от частоты. Измеряя эту минимальную интенсивность для тестирования тонов различных частот, можно получить частотно-зависимую кривую абсолютного порога слышимости (ATH). Как правило, ухо показывает пик чувствительности (т. е. его самый низкий ATH) между 1–5 кГц, хотя порог меняется с возрастом, а более старые уши демонстрируют снижение чувствительности выше 2 кГц. [7]

ATH является самым низким из контуров равной громкости . Контуры равной громкости показывают уровень звукового давления (дБ SPL) в диапазоне слышимых частот, которые воспринимаются как имеющие одинаковую громкость. Контуры равной громкости были впервые измерены Флетчером и Мансоном в Bell Labs в 1933 году с использованием чистых тонов, воспроизводимых через наушники, а собранные ими данные называются кривыми Флетчера-Мансона . Поскольку субъективную громкость было трудно измерить, кривые Флетчера-Мансона были усреднены по многим испытуемым.

Робинсон и Дадсон усовершенствовали процесс в 1956 году, чтобы получить новый набор кривых равной громкости для фронтального источника звука, измеренных в безэховой камере . Кривые Робинсона-Дадсона были стандартизированы как ISO 226 в 1986 году. В 2003 году ISO 226 был пересмотрен как контур равной громкости с использованием данных, собранных в результате 12 международных исследований.

Звуковая локализация

Локализация звука — это процесс определения местоположения источника звука. Мозг использует тонкие различия в громкости, тоне и времени между двумя ушами, чтобы мы могли локализовать источники звука. [8] Локализация может быть описана в терминах трехмерного положения: азимута или горизонтального угла, зенита или вертикального угла и расстояния (для статических звуков) или скорости (для движущихся звуков). [9] Люди, как и большинство четвероногих животных , способны определять направление по горизонтали, но в меньшей степени по вертикали из-за симметричного расположения ушей. Некоторые виды сових уши расположены асимметрично, и они могут улавливать звук во всех трех плоскостях, что является приспособлением для охоты на мелких млекопитающих в темноте. [10]

Маскирующие эффекты

График маскирования звука

Предположим, что слушатель может слышать данный акустический сигнал в условиях тишины. Когда сигнал воспроизводится во время воспроизведения другого звука (маскер), сигнал должен быть сильнее, чтобы слушатель мог его услышать. Маскеру не обязательно иметь частотные компоненты исходного сигнала для маскирования. Маскированный сигнал можно услышать, даже если он слабее маскирующего. Маскировка происходит, когда сигнал и маскирующий сигнал воспроизводятся вместе — например, когда один человек шепчет, а другой кричит — и слушатель не слышит более слабый сигнал, поскольку он маскируется более громким маскирующим. Маскирование также может произойти с сигналом до запуска маскирования или после его остановки. Например, один внезапный громкий звук хлопка может сделать звуки, которые непосредственно предшествуют или следуют за ним, неслышимыми. Эффекты обратной маскировкислабее, чем прямая маскировка. Маскирующий эффект широко изучался в психоакустических исследованиях. Можно изменить уровень маскирующего устройства и измерить порог, а затем построить диаграмму кривой психофизической настройки, которая выявит аналогичные особенности. Эффекты маскировки также используются при кодировании звука с потерями, например в MP3 .

Отсутствует фундаментальный

При представлении гармонического ряда частот в соотношении 2 f , 3 f , 4 f , 5 f и т. д . (где f - конкретная частота) люди склонны воспринимать высоту звука как f . Звуковой пример можно найти на YouTube. [11]

Программное обеспечение

Перцептивное аудиокодирование использует алгоритмы, основанные на психоакустике.

Психоакустическая модель обеспечивает высококачественное сжатие сигнала с потерями , описывая, какие части данного цифрового аудиосигнала можно удалить (или агрессивно сжать) безопасно, то есть без значительных потерь в (сознательно) воспринимаемом качестве звука.

Это может объяснить, почему резкий хлопок в ладоши может показаться болезненно громким в тихой библиотеке, но едва заметным после того, как машина даст обратный эффект на оживленной городской улице. Это значительно улучшает общую степень сжатия, и психоакустический анализ обычно приводит к сжатым музыкальным файлам, размер которых составляет от 1/10 до 1/12 размера высококачественных оригиналов, но с заметно меньшей пропорциональной потерей качества. Такое сжатие характерно почти для всех современных форматов сжатия аудио с потерями. Некоторые из этих форматов включают Dolby Digital (AC-3), MP3 , Opus , Ogg Vorbis , AAC , WMA , MPEG-1 Layer II (используется для цифрового аудиовещания ).в некоторых странах) и ATRAC , сжатие, используемое в MiniDisc и некоторых моделях Walkman .

Психоакустика в значительной степени основана на анатомии человека , особенно на ограничениях уха в восприятии звука, как было указано ранее. Подводя итог, эти ограничения таковы:

  • Ограничение высокой частоты
  • Абсолютный порог слышимости
  • Временная маскировка (прямая маскировка, обратная маскировка)
  • Одновременное маскирование (также известное как спектральное маскирование)

Алгоритм сжатия может назначать более низкий приоритет звукам за пределами диапазона человеческого слуха. Тщательно перемещая биты от неважных компонентов к важным, алгоритм гарантирует, что звуки, которые слушатель, скорее всего, воспримет, будут представлены наиболее точно.

Музыка

Психоакустика включает темы и исследования, имеющие отношение к музыкальной психологии и музыкальной терапии . Теоретики, такие как Бенджамин Борец , считают, что некоторые результаты психоакустики имеют смысл только в музыкальном контексте. [12]

Пластинки серии Environments Ирва Тейбеля ( 1969–79) являются ранним примером коммерчески доступных звуков, выпущенных специально для улучшения психологических способностей. [13]

Прикладная психоакустика

Психоакустическая модель

Психоакустика долгое время находилась в симбиотических отношениях с информатикой . Первооткрыватели Интернета Дж. К. Р. Ликлайдер и Боб Тейлор оба закончили дипломную работу в области психоакустики, а BBN Technologies изначально специализировалась на консультировании по вопросам акустики, прежде чем приступить к созданию первой сети с коммутацией пакетов .

Ликлайдер написал статью под названием «Дуплексная теория восприятия высоты тона». [14]

Психоакустика применяется во многих областях разработки программного обеспечения, где разработчики отображают проверенные и экспериментальные математические закономерности в цифровой обработке сигналов. Многие кодеки сжатия звука, такие как MP3 и Opus , используют психоакустическую модель для увеличения степени сжатия. Успех обычных аудиосистем для воспроизведения музыки в театрах и домах можно объяснить психоакустикой [15] , а психоакустические соображения привели к появлению новых аудиосистем, таких как психоакустический синтез звукового поля . [16] Кроме того, ученые экспериментировали с ограниченным успехом по созданию нового акустического оружия, излучающего частоты, которые могут повредить, повредить или убить.[17] Психоакустика также используется в сонификации , чтобы сделать несколько независимых измерений данных слышимыми и легко интерпретируемыми. [18] Это обеспечивает слуховое руководство без необходимости пространственного звука и в компьютерных играх с ультразвуковой обработкой [19] и других приложениях, таких какполеты дронов и хирургия под визуальным контролем . [20] Это также применяется сегодня в музыке, где музыканты и художники продолжают создавать новые слуховые ощущения, маскируя нежелательные частоты инструментов, усиливая другие частоты. Еще одним приложением является разработка небольших громкоговорителей или громкоговорителей более низкого качества, которые могут использовать явлениенедостающие основы для создания эффекта басовых нот на более низких частотах, чем физически способны воспроизводить громкоговорители (см. ссылки).

Производители автомобилей проектируют свои двигатели и даже двери так, чтобы они издавали определенный звук. [21]

Смотрите также

Связанные поля

  • Когнитивная нейробиология музыки
  • Музыкальная психология

Психоакустические темы

  • A-взвешивание , обычно используемая передаточная функция воспринимаемой громкости.
  • ABX-тест
  • Слуховые иллюзии
  • Слуховой анализ сцены, в т.ч. Восприятие 3D-звука, локализация
  • Бинауральные ритмы
  • Слепое разделение сигналов
  • Комбинированный тон (также тон Тартини)
  • Иллюзия шкалы Дойча
  • Эквивалентная прямоугольная полоса пропускания (ERB)
  • Эффект Франссена
  • Иллюзия глиссандо
  • эффект Хааса
  • Гиперзвуковой эффект
  • Языковая обработка
  • эффект левитина
  • Мисофония
  • Музыкальный тюнинг
  • Воздействие шума на здоровье
  • Октавная иллюзия
  • Питч (музыка)
  • Эффект приоритета
  • Психолингвистика
  • Теория искажения скорости
  • Звуковая локализация
  • Звук царапанья ногтями по доске
  • Маскировка звука
  • Распознавание речи
  • Тембр
  • Парадокс тритона

использованная литература

Примечания

  1. ^ Баллоу, Г. (2008). Справочник для звукорежиссеров (Четвертое изд.). Берлингтон: Focal Press. п. 43.
  2. ^ Кристофер Дж. Плак (2005). Чувство слуха . Рутледж. ISBN 978-0-8058-4884-7.
  3. ^ Ларс Альзен; Кларенс Сонг (2003). Звуковой бластер в прямом эфире! Книга . Без Крахмального Пресса. ISBN 978-1-886411-73-9.
  4. ^ Рудольф Ф. Граф (1999). Современный словарь электроники . Новинки. ISBN 978-0-7506-9866-5.
  5. ^ Джек Кац; Роберт Ф. Буркард и Ларри Медвецкий (2002). Справочник по клинической аудиологии . Липпинкотт Уильямс и Уилкинс. ISBN 978-0-683-30765-8.
  6. ^ a b Олсон, Гарри Ф. (1967). Музыка, физика и техника . Дуврские публикации. стр. 248–251. ISBN 978-0-486-21769-7.
  7. ^ Фастл, Хьюго; Цвикер, Эберхард (2006). Психоакустика: факты и модели . Спрингер. стр. 21–22. ISBN 978-3-540-23159-2.
  8. ^ Томпсон, Дэниел М. Понимание аудио: получение максимальной отдачи от вашего проекта или профессиональной студии звукозаписи. Бостон, Массачусетс: Беркли, 2005. Печать.
  9. ^ Дороги, Кертис. Учебник по компьютерной музыке. Кембридж, Массачусетс: Массачусетский технологический институт, 2007. Печать.
  10. ^ Льюис, Д.П. (2007): Уши и слух совы. Страницы совы [онлайн]. Доступно: http://www.owlpages.com/articles.php?section=Owl+Physiology&title=Hearing [2011, 5 апреля]
  11. ^ Акустический, Музыкальный. «Отсутствующий фундамент» . Ютуб . Архивировано из оригинала 20 декабря 2021 г .. Проверено 19 августа 2019 г.
  12. ^ Стерн, Джонатан (2003). Звуковое прошлое: культурные истоки воспроизведения звука . Дарем: Издательство Университета Дьюка. ISBN 9780822330134.
  13. ^ Каммингс, Джим. «На этой неделе умер Ирв Тейбель: создатель пластинок «Environments» 1970-х» . Ухо Земли . Проверено 18 ноября 2015 г.
  14. ^ Ликлайдер, JCR (январь 1951 г.). «Дуплексная теория восприятия высоты тона» (PDF) . Журнал Акустического общества Америки . 23 (1): 147. Бибкод : 1951ASAJ...23..147L . дои : 10.1121/1.1917296 . Архивировано (PDF) из оригинала 02 сентября 2016 г.
  15. ^ Цимер, Тим (2020). «Обычный стереофонический звук». Синтез звукового поля психоакустической музыки . Текущие исследования в области систематического музыковедения. 7 . Чам: Спрингер. стр. 171–202. doi : 10.1007/978-3-030-23033-3_7 . ISBN 978-3-030-23033-3. S2CID  201142606 .
  16. ^ Цимер, Тим (2020). Синтез звукового поля психоакустической музыки . Текущие исследования в области систематического музыковедения. 7 . Чам: Спрингер. doi : 10.1007/978-3-030-23033-3 . ISBN 978-3-030-23032-6. ISSN  2196-6974 . S2CID  201136171 .
  17. ^ "Архивная копия" . Архивировано из оригинала 19 июля 2010 г. Проверено 06 февраля 2010 г. .CS1 maint: заархивированная копия как заголовок ( ссылка )
  18. ^ Цимер, Тим; Шультейс, Хольгер; Блэк, Дэвид; Кикинис, Рон (2018). «Психоакустическая интерактивная сонификация для навигации на короткие расстояния». Acta Acustica объединилась с Acustica . 104 (6): 1075–1093. doi : 10.3813/AAA.919273 . S2CID 125466508 . 
  19. ^ КУРАТ. «Игры и обучение малоинвазивной хирургии» . КУРАТ . Университет Бремена . Проверено 15 июля 2020 г.
  20. ^ Цимер, Тим; Нучпрайун, Наттавут; Шультейс, Хольгер (2019). «Психоакустическая сонификация как пользовательский интерфейс для взаимодействия человека и машины» (PDF) . Международный журнал общества информатики . 12 (1). архив : 1912.08609 . doi : 10.13140/RG.2.2.14342.11848 . Проверено 15 июля 2020 г.
  21. ↑ Тарми , Джеймс (5 августа 2014 г.). «Двери Mercedes имеют фирменный звук: вот как» . Блумберг Бизнес . Проверено 10 августа 2020 г.

Источники

  • Э. Ларсен и Р. М. Аартс (2004), Расширение полосы пропускания звука. Применение психоакустики, обработки сигналов и проектирования громкоговорителей. , Дж. Уайли.
  • Ларсен Э.; Аартс Р.М. (март 2002 г.). «Воспроизведение низкочастотных сигналов через небольшие громкоговорители» (PDF) . Журнал Общества аудиотехники . 50 (3): 147–64.[ мертвая ссылка ]
  • Оохаши Т .; Кавай Н.; Нишина Е.; Хонда М.; Яги Р.; Накамура С.; Моримото М.; Маекава Т .; Йонекура Ю.; Шибасаки Х. (февраль 2006 г.). «Роль биологической системы, отличной от слуховой воздушной проводимости, в возникновении гиперзвукового эффекта» . Исследования мозга . 1073–1074: 339–347. doi : 10.1016/j.brainres.2005.12.096 . PMID  16458271 .

внешняя ссылка

  • Музыкальный слух — восприятие звука
  • Мюллер С., Шнайдер П., Перстерер А., Опиц М., Нефьодова М.В., Бергер М. (1993). «[Прикладная психоакустика в космическом полете]». Wien Med Wochenschr (на немецком языке). 143 (23–24): 633–5. PMID  8178525 .— Моделирование слуха в свободном поле с помощью наушников.
  • GPSYCHO — модель психоакустики и формирования шума с открытым исходным кодом для кодировщиков MP3 на основе ISO.
  • Определение: перцептивное кодирование звука
  • Java-апплет, демонстрирующий маскирование
  • Временная маскировка
  • Концепции гиперфизики — звук и слух
  • MP3 как стандартный объект
Получено с https://en.wikipedia.org/w/index.php?title=Psychoacoustics&oldid=1061310118 "