Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Графики зависимости шкалы смола от шкалы Герца
A440 Play . 440 Гц = 549,64 мэлОб этом звуке 

Шкалы Mel (после слова мелодии ) [1] является перцептивного шкала из смол судить слушателей , чтобы быть равными в расстоянии друг от друга. Контрольная точка между этой шкалой и нормальным измерением частоты определяется путем присвоения перцепционной высоты тона 1000 мес тону 1000 Гц , что на 40 дБ выше порога слушателя. Выше примерно 500 Гц слушатели оценивают все более длинные интервалы для получения равных приращений высоты тона.

Формула [ править ]

Популярная формула для преобразования ф герц в м Mels является: [2]

История и другие формулы [ править ]

Не существует единой формулы мел-шкалы. [3] Популярная формула из книги О'Шонесси может быть выражена с помощью различных логарифмических оснований:

Соответствующие обратные выражения:

Были опубликованы кривые и таблицы по психофизическим шкалам высоты тона, начиная с кривых Стейнберга 1937 года [4], основанных на едва заметных различиях в высоте тона. Вскоре последовали новые кривые в работах Флетчера и Мансона 1937 года [5], Флетчера 1938 года [6] и Стивенса 1937 года [1] и Стивенса и Фолькманна 1940 года [7] с использованием различных экспериментальных методов и подходов к анализу.

В 1949 году Кениг опубликовал приближение, основанное на отдельных линейных и логарифмических сегментах с разрывом на 1000 Гц. [8]

Гуннар Фант предложил популярную в настоящее время линейно-логарифмическую формулу в 1949 году, но с угловой частотой 1000 Гц. [9]

Альтернативное выражение формулы, не зависящее от выбора основания логарифма, отмечено в Fant (1968): [10] [11]

В 1976 году Махоул и Коселл опубликовали популярную сейчас версию с угловой частотой 700 Гц. [12] As Ganchev et al. заметили: «Формулы [с 700] по сравнению с [Фанта с 1000] обеспечивают более близкое приближение к шкале Мела для частот ниже 1000 Гц за счет более высокой неточности для частот выше 1000 Гц». [13] Однако выше 7 кГц ситуация меняется, и версия с частотой 700 Гц снова подходит лучше.

Данные, которыми мотивированы некоторые из этих формул, приведены в таблице Беранека (1949), измеренной по кривым Стивенса и Фолькманна: [14]

Формула с частотой прерывания 625 Гц дана Линдси и Норманом (1977); [15] формула не появляется в их первом издании 1972 года:

Для прямого сравнения с другими формулами это эквивалентно:

Большинство формул мел-шкалы дают ровно 1000 мелей при 1000 Гц. Частота прерывания (например, 700 Гц, 1000 Гц или 625 Гц) - единственный свободный параметр в обычной форме формулы. Некоторые формулы частотной шкалы non-mel используют ту же форму, но с гораздо более низкой частотой прерывания, не обязательно сопоставленной с 1000 при 1000 Гц; например, шкала ERB-скорости Глазберга и Мура (1990) использует точку разрыва 228,8 Гц [16], а карта частота улитки – место Гринвуда (1990) использует 165,3 Гц. [17]

Другие функциональные формы мелкой шкалы были исследованы Umesh et al .; они указывают на то, что традиционные формулы с логарифмической областью и линейной областью не соответствуют данным кривых Стивенса и Фолькмана, а также некоторым другим формам, основанным на следующей таблице данных измерений, которые они сделали на этих кривых: [18]

Критика [ править ]

Ученик Стивенса, Дональд Д. Гринвуд, который работал над экспериментами со шкалой мела в 1956 году, считает, что шкала смещена из-за экспериментальных ошибок. В 2009 году он отправил в список рассылки, [19]

Я бы спросил, зачем использовать шкалу Мела сейчас, если она кажется необъективной? Если кому-то нужна шкала Мела, он должен сделать это заново, тщательно контролируя систематическую ошибку порядка и используя множество предметов - больше, чем в прошлом - и используя как музыкантов, так и не музыкантов для поиска любых различий в исполнении, которые могут регулироваться музыкантом. / отличия от музыкантов или различия в предметах в целом.

См. Также [ править ]

  • Шкала коры
  • Мел-частотный кепстр
  • Кривые Флетчера – Мансона

Ссылки [ править ]

  1. ^ а б Стивенс, Стэнли Смит; Фолькманн; Джон и Ньюман, Эдвин Б. (1937). «Шкала для измерения психологической величины высоты звука» . Журнал Акустического общества Америки . 8 (3): 185–190. Bibcode : 1937ASAJ .... 8..185S . DOI : 10.1121 / 1.1915893 . Архивировано из оригинала на 2013-04-14.
  2. Дуглас О'Шонесси (1987). Речевое общение: человек и машина . Эддисон-Уэсли. п. 150. ISBN 978-0-201-16520-3.
  3. ^ У. Диксон Уорд (1970). «Музыкальное восприятие». В Джерри В. Тобиас (ред.). Основы современной слуховой теории . 1 . Академическая пресса. п. 412. Никто еще не утверждал, что определил «шкалу Mel».
  4. ^ Джон С. Стейнберг (1937). «Позиции раздражения в улитке чистыми тонами» . Журнал Акустического общества Америки . 8 (3): 176–180. Bibcode : 1937ASAJ .... 8..176S . DOI : 10.1121 / 1.1915891 .
  5. Харви Флетчер и В.А. Мансон (1937). «Связь между громкостью и маскировкой». Журнал Акустического общества Америки . 9 (1): 1–10. Bibcode : 1937ASAJ .... 9 .... 1F . DOI : 10.1121 / 1.1915904 .
  6. ^ Харви Флетчер (1938). «Громкость, маскировка и их связь с процессом слуха и проблема измерения шума» . Журнал Акустического общества Америки . 9 (4): 275–293. Bibcode : 1938ASAJ .... 9..275F . DOI : 10.1121 / 1.1915935 .
  7. Перейти ↑ Stevens, S. & Volkmann, J. (1940). «Отношение высоты звука к частоте: пересмотренная шкала». Американский журнал психологии . 53 (3): 329–353. DOI : 10.2307 / 1417526 . JSTOR 1417526 . 
  8. ^ В. Кениг (1949). «Новая частотная шкала для акустических измерений». Белл Телефонный лабораторный отчет . 27 : 299–301.
  9. ^ Гуннар Фант (1949) "Analys пр де Svenska konsonantljuden: talets allmänna svängningsstruktur", LM Ericsson Protokoll H / P 1064
  10. ^ Фант, Гуннар. (1968). Анализ и синтез речевых процессов. В Б. Мальмберге (ред.), Справочник по фонетике (стр. 173–177). Амстердам: Северная Голландия.
  11. ^ Джонатан Харрингтон и Стив Кэссиди (1999). Приемы акустики речи . Springer. п. 18. ISBN 978-0-7923-5731-5.
  12. ^ Джон Makhoul и Линн Cosell (1976). «LPCW: вокодер LPC с линейным прогнозированием искажения спектра». ICASSP '76. Международная конференция IEEE по акустике, речи и обработке сигналов . ICASSP 1976 . 1 . IEEE. С. 466–469. DOI : 10.1109 / ICASSP.1976.1170013 .
  13. Т. Ганчев; Н. Факотакис и Г. Коккинакис (2005), «Сравнительная оценка различных реализаций MFCC для задачи проверки говорящего», Труды SPECOM-2005 , стр. 191–194, CiteSeerX 10.1.1.75.8303 
  14. ^ Beranek, Лео Л. (1949). Акустические измерения . Нью-Йорк: Макгроу-Хилл.
  15. ^ Линдси, Питер Х .; И Норман, Дональд А. (1977). Обработка информации человеком: Введение в психологию (2-е изд.). Нью-Йорк: Academic Press.
  16. ^ BCJ Moore и BR Glasberg, "Предлагаемые формулы для расчета ширины полосы пропускания слухового фильтра и схем возбуждения" Журнал Акустического общества Америки 74: 750-753, 1983.
  17. Перейти ↑ Greenwood, DD (1990). Частотно-позиционная функция улитки для нескольких видов - 29 лет спустя. Журнал Американского акустического общества , 87, 2592–2605.
  18. ^ Umesh, S. и Cohen, L. и Nelson, D. (1999), "Подгонка шкалы mel", Proc. ICASSP 1999 : 217–220, ISBN 978-0-7803-5041-0CS1 maint: несколько имен: список авторов ( ссылка )
  19. ^ http://lists.mcgill.ca/scripts/wa.exe?A2=ind0907d&L=auditory&P=389

Внешние ссылки [ править ]

  • СМИ, связанные с шкалой Мел на Викискладе?
  • Преобразование Гц – мел, мел – Гц (используется уравнение О'Шонесси)
  • Фолькманн, Дж; Стивенс, СС; Ньюман, Е.Б. (1937). «Шкала для измерения психологической величины высоты звука» . Журнал акустического общества Америки . 8 (3): 208. Bibcode : 1937ASAJ .... 8..208V . DOI : 10.1121 / 1.1901999 .
  • Справочник по акустической экологии