Шкалы Mel (после слова мелодии ) [1] является перцептивного шкала из смол судить слушателей , чтобы быть равными в расстоянии друг от друга. Контрольная точка между этой шкалой и нормальным измерением частоты определяется путем присвоения перцепционной высоты тона 1000 мес тону 1000 Гц , что на 40 дБ выше порога слушателя. Выше примерно 500 Гц слушатели оценивают все более длинные интервалы для получения равных приращений высоты тона.
Формула [ править ]
Популярная формула для преобразования ф герц в м Mels является: [2]
История и другие формулы [ править ]
Не существует единой формулы мел-шкалы. [3] Популярная формула из книги О'Шонесси может быть выражена с помощью различных логарифмических оснований:
Соответствующие обратные выражения:
Были опубликованы кривые и таблицы по психофизическим шкалам высоты тона, начиная с кривых Стейнберга 1937 года [4], основанных на едва заметных различиях в высоте тона. Вскоре последовали новые кривые в работах Флетчера и Мансона 1937 года [5], Флетчера 1938 года [6] и Стивенса 1937 года [1] и Стивенса и Фолькманна 1940 года [7] с использованием различных экспериментальных методов и подходов к анализу.
В 1949 году Кениг опубликовал приближение, основанное на отдельных линейных и логарифмических сегментах с разрывом на 1000 Гц. [8]
Гуннар Фант предложил популярную в настоящее время линейно-логарифмическую формулу в 1949 году, но с угловой частотой 1000 Гц. [9]
Альтернативное выражение формулы, не зависящее от выбора основания логарифма, отмечено в Fant (1968): [10] [11]
В 1976 году Махоул и Коселл опубликовали популярную сейчас версию с угловой частотой 700 Гц. [12] As Ganchev et al. заметили: «Формулы [с 700] по сравнению с [Фанта с 1000] обеспечивают более близкое приближение к шкале Мела для частот ниже 1000 Гц за счет более высокой неточности для частот выше 1000 Гц». [13] Однако выше 7 кГц ситуация меняется, и версия с частотой 700 Гц снова подходит лучше.
Данные, которыми мотивированы некоторые из этих формул, приведены в таблице Беранека (1949), измеренной по кривым Стивенса и Фолькманна: [14]
Данные шкалы Беранека 1949 г. по Стивенсу и Фолькманну 1940 г. Гц 20 160 394 670 1000 1420 1900 г. 2450 3120 4000 5100 6600 9000 14000 мел 0 250 500 750 1000 1250 1500 1750 2000 г. 2250 2500 2750 3000 3250
Формула с частотой прерывания 625 Гц дана Линдси и Норманом (1977); [15] формула не появляется в их первом издании 1972 года:
Для прямого сравнения с другими формулами это эквивалентно:
Большинство формул мел-шкалы дают ровно 1000 мелей при 1000 Гц. Частота прерывания (например, 700 Гц, 1000 Гц или 625 Гц) - единственный свободный параметр в обычной форме формулы. Некоторые формулы частотной шкалы non-mel используют ту же форму, но с гораздо более низкой частотой прерывания, не обязательно сопоставленной с 1000 при 1000 Гц; например, шкала ERB-скорости Глазберга и Мура (1990) использует точку разрыва 228,8 Гц [16], а карта частота улитки – место Гринвуда (1990) использует 165,3 Гц. [17]
Другие функциональные формы мелкой шкалы были исследованы Umesh et al .; они указывают на то, что традиционные формулы с логарифмической областью и линейной областью не соответствуют данным кривых Стивенса и Фолькмана, а также некоторым другим формам, основанным на следующей таблице данных измерений, которые они сделали на этих кривых: [18]
Umesh et al. Данные шкалы мела 1999 г. от Стивенса и Фолькманна 1940 Гц 40 161 200 404 693 867 1000 2022 год 3000 3393 4109 5526 6500 7743 12000 мел 43 год 257 300 514 771 928 1000 1542 2000 г. 2142 2314 2600 2771 2914 3228
Критика [ править ]
Ученик Стивенса, Дональд Д. Гринвуд, который работал над экспериментами со шкалой мела в 1956 году, считает, что шкала смещена из-за экспериментальных ошибок. В 2009 году он отправил в список рассылки, [19]
Я бы спросил, зачем использовать шкалу Мела сейчас, если она кажется необъективной? Если кому-то нужна шкала Мела, он должен сделать это заново, тщательно контролируя систематическую ошибку порядка и используя множество предметов - больше, чем в прошлом - и используя как музыкантов, так и не музыкантов для поиска любых различий в исполнении, которые могут регулироваться музыкантом. / отличия от музыкантов или различия в предметах в целом.
См. Также [ править ]
- Шкала коры
- Мел-частотный кепстр
- Кривые Флетчера – Мансона
Ссылки [ править ]
- ^ а б Стивенс, Стэнли Смит; Фолькманн; Джон и Ньюман, Эдвин Б. (1937). «Шкала для измерения психологической величины высоты звука» . Журнал Акустического общества Америки . 8 (3): 185–190. Bibcode : 1937ASAJ .... 8..185S . DOI : 10.1121 / 1.1915893 . Архивировано из оригинала на 2013-04-14.
- ↑ Дуглас О'Шонесси (1987). Речевое общение: человек и машина . Эддисон-Уэсли. п. 150. ISBN 978-0-201-16520-3.
- ^ У. Диксон Уорд (1970). «Музыкальное восприятие». В Джерри В. Тобиас (ред.). Основы современной слуховой теории . 1 . Академическая пресса. п. 412.
Никто еще не утверждал, что определил «шкалу Mel».
- ^ Джон С. Стейнберг (1937). «Позиции раздражения в улитке чистыми тонами» . Журнал Акустического общества Америки . 8 (3): 176–180. Bibcode : 1937ASAJ .... 8..176S . DOI : 10.1121 / 1.1915891 .
- ↑ Харви Флетчер и В.А. Мансон (1937). «Связь между громкостью и маскировкой». Журнал Акустического общества Америки . 9 (1): 1–10. Bibcode : 1937ASAJ .... 9 .... 1F . DOI : 10.1121 / 1.1915904 .
- ^ Харви Флетчер (1938). «Громкость, маскировка и их связь с процессом слуха и проблема измерения шума» . Журнал Акустического общества Америки . 9 (4): 275–293. Bibcode : 1938ASAJ .... 9..275F . DOI : 10.1121 / 1.1915935 .
- Перейти ↑ Stevens, S. & Volkmann, J. (1940). «Отношение высоты звука к частоте: пересмотренная шкала». Американский журнал психологии . 53 (3): 329–353. DOI : 10.2307 / 1417526 . JSTOR 1417526 .
- ^ В. Кениг (1949). «Новая частотная шкала для акустических измерений». Белл Телефонный лабораторный отчет . 27 : 299–301.
- ^ Гуннар Фант (1949) "Analys пр де Svenska konsonantljuden: talets allmänna svängningsstruktur", LM Ericsson Protokoll H / P 1064
- ^ Фант, Гуннар. (1968). Анализ и синтез речевых процессов. В Б. Мальмберге (ред.), Справочник по фонетике (стр. 173–177). Амстердам: Северная Голландия.
- ^ Джонатан Харрингтон и Стив Кэссиди (1999). Приемы акустики речи . Springer. п. 18. ISBN 978-0-7923-5731-5.
- ^ Джон Makhoul и Линн Cosell (1976). «LPCW: вокодер LPC с линейным прогнозированием искажения спектра». ICASSP '76. Международная конференция IEEE по акустике, речи и обработке сигналов . ICASSP 1976 . 1 . IEEE. С. 466–469. DOI : 10.1109 / ICASSP.1976.1170013 .
- ↑ Т. Ганчев; Н. Факотакис и Г. Коккинакис (2005), «Сравнительная оценка различных реализаций MFCC для задачи проверки говорящего», Труды SPECOM-2005 , стр. 191–194, CiteSeerX 10.1.1.75.8303
- ^ Beranek, Лео Л. (1949). Акустические измерения . Нью-Йорк: Макгроу-Хилл.
- ^ Линдси, Питер Х .; И Норман, Дональд А. (1977). Обработка информации человеком: Введение в психологию (2-е изд.). Нью-Йорк: Academic Press.
- ^ BCJ Moore и BR Glasberg, "Предлагаемые формулы для расчета ширины полосы пропускания слухового фильтра и схем возбуждения" Журнал Акустического общества Америки 74: 750-753, 1983.
- Перейти ↑ Greenwood, DD (1990). Частотно-позиционная функция улитки для нескольких видов - 29 лет спустя. Журнал Американского акустического общества , 87, 2592–2605.
- ^ Umesh, S. и Cohen, L. и Nelson, D. (1999), "Подгонка шкалы mel", Proc. ICASSP 1999 : 217–220, ISBN 978-0-7803-5041-0CS1 maint: несколько имен: список авторов ( ссылка )
- ^ http://lists.mcgill.ca/scripts/wa.exe?A2=ind0907d&L=auditory&P=389
Внешние ссылки [ править ]
- СМИ, связанные с шкалой Мел на Викискладе?
- Преобразование Гц – мел, мел – Гц (используется уравнение О'Шонесси)
- Фолькманн, Дж; Стивенс, СС; Ньюман, Е.Б. (1937). «Шкала для измерения психологической величины высоты звука» . Журнал акустического общества Америки . 8 (3): 208. Bibcode : 1937ASAJ .... 8..208V . DOI : 10.1121 / 1.1901999 .
- Справочник по акустической экологии