МУШРА

MUSHRA расшифровывается как MUltiple Stimuli with Hidden Reference и Anchor и представляет собой методологию для проведения теста прослушивания кодека для оценки воспринимаемого качества вывода от алгоритмов сжатия звука с потерями . Он определен рекомендацией ITU-R BS.1534-3. ^[1] Методология MUSHRA рекомендуется для оценки «промежуточного качества звука». Для очень небольших искажений звука рекомендуется Рекомендация ITU-R BS.1116-3 (ABC / HR).

Основное преимущество перед методологией оценки среднего мнения (MOS) (которая служит той же цели) заключается в том, что MUSHRA требует меньшего числа участников для получения статистически значимых результатов. ^{[ необходима цитата ]} Это связано с тем, что все кодеки представлены одновременно на одних и тех же выборках, поэтому для статистического анализа можно использовать парный t-критерий или дисперсионный анализ с повторными измерениями . Кроме того, шкала от 0 до 100, используемая MUSHRA, позволяет оценивать очень небольшие различия.

В MUSHRA слушателю предоставляется ссылка (помеченная как таковая), определенное количество тестовых образцов, скрытая версия ссылки и один или несколько якорей. В рекомендации указывается, что в тестовые сигналы должны быть включены якорь низкого и среднего диапазона. Обычно это низкочастотная версия эталона с частотой 7 кГц и 3,5 кГц. Якоря предназначены для калибровки шкалы, чтобы незначительные артефакты не подвергались чрезмерному наказанию. Это особенно важно при сравнении или объединении результатов из разных лабораторий.

Поведение слушателя [ править ]

И тесты MUSHRA, и ITU BS.1116 ^[2] требуют обученных экспертов-слушателей, которые знают, как звучат типичные артефакты и где они могут возникать. Слушатели-эксперты также лучше усваивают шкалу оценок, что приводит к более воспроизводимым результатам, чем у неподготовленных слушателей. Таким образом, с обученными слушателями требуется меньше слушателей для достижения статистически значимых результатов .

Предполагается, что предпочтения опытных слушателей и наивных слушателей схожи, и поэтому результаты экспертных слушателей также являются предсказательными для потребителей. В соответствии с этим предположением Schinkel-Bielefeld et al. ^{[3] не} обнаружили различий в порядке ранжирования между опытными слушателями и неподготовленными слушателями при использовании тестовых сигналов, содержащих только тембр и отсутствие пространственных артефактов. Однако Рамси и др. ^[4] показали, что для сигналов, содержащих пространственные артефакты, опытные слушатели взвешивают пространственные артефакты немного сильнее, чем неподготовленные слушатели, которые в первую очередь фокусируются на тембровых артефактах.

В дополнение к этому, было показано, что опытные слушатели больше используют опцию для многократного прослушивания меньших участков тестируемых сигналов и выполнения большего количества сравнений между тестируемыми сигналами и эталонными. ^[3] В отличие от наивного слушателя, который составляет рейтинг предпочтений, опытный слушатель, следовательно, производит оценку качества звука, оценивая различия между тестируемым сигналом и несжатым оригиналом, что и является реальной целью MUSHRA-теста.

Предварительный или последующий просмотр [ править ]

В руководстве MUSHRA упоминается несколько возможностей оценки надежности слушателя.

Самый простой и распространенный - дисквалификация слушателей, которые оценивают скрытую ссылку ниже 90 баллов MUSHRA для более чем 15 процентов всех тестовых заданий. Скрытая ссылка должна быть оценена в 100 баллов MUSHRA, так что это, очевидно, ошибка. Хотя может случиться так, что скрытый эталонный сигнал и высококачественный сигнал перепутаны, рейтинг ниже 90 следует давать только тогда, когда слушатель уверен, что номинальный сигнал отличается от исходного эталонного сигнала.

Другая возможность оценить работу слушателя - это eGauge ^[5], структура, основанная на анализе дисперсии. Он вычисляет согласованность , повторяемость и различимость , хотя только последние два рекомендуются для предварительной или последующей проверки. Согласие анализирует, насколько слушатель согласен с остальными слушателями. Воспроизводимость учитывает дисперсию при повторной оценке того же тестового сигнала по сравнению с дисперсией других тестовых сигналов и различимостьюанализирует, могут ли слушатели различать тестовые сигналы в разных условиях. Поскольку eGauge требует прослушивания каждого тестового сигнала дважды, применить это требует больше усилий, чем отправлять экранных слушателей на основе рейтингов скрытых ссылок. Однако, если слушатель доказал, что является надежным слушателем с помощью eGauge, он или она также может считаться надежным слушателем для будущих тестов прослушивания, при условии, что характер теста не изменится; Надежный слушатель для теста прослушивания стереозвука не обязательно одинаково хорошо воспринимает артефакты в тестовых элементах формата 5.1 или 22.2.

Тестовые задания [ править ]

Важно выбрать критические тестовые задания; элементы, которые трудно кодировать и которые могут вызывать артефакты. При этом образцы должны быть экологичными; они должны быть репрезентативными для вещательного материала, а не для некоторых синтетических сигналов, специально разработанных так, чтобы их было трудно кодировать. Метод выбора критического материала представлен Ekeroot et al. которые предлагают ранжирование по процедуре исключения. ^[6] Хотя это хороший способ выбрать наиболее важные элементы теста, он не гарантирует включение множества элементов теста, подверженных различным артефактам.

В идеале характер элемента теста MUSHRA не должен слишком сильно меняться в течение всего срока действия этого элемента. В противном случае слушателю может быть сложно определить рейтинг, если разные части элементов отображают разные или более сильные артефакты, чем другие. ^[7] Часто более короткие элементы приводят к меньшей изменчивости, чем более длинные, поскольку они более стационарны. ^[8] Однако даже при попытке выбрать стационарные объекты экологически значимые стимулы очень часто будут иметь участки, которые несколько более критичны, чем остальная часть сигнала. Таким образом, слушатели, которые сосредотачиваются на разных частях сигнала, могут оценивать его по-разному. В этом случае более критичные слушатели, кажется, лучше распознают наиболее критические области стимула, чем менее критичные слушатели. ^[9]

Язык тестовых заданий [ править ]

В то время как в тестах ITU-T P.800 ^[10], которые обычно используются для оценки кодеков качества телефона, тестируемые речевые элементы всегда должны быть на родном языке слушателей, в тестах MUSHRA это не обязательно. Исследование с участием слушателей китайского и немецкого языков не обнаружило значительной разницы между оценкой заданий теста по иностранному и родному языкам. Однако слушателям нужно больше времени и больше сравнивать при оценке заданий на иностранном языке. ^[11]Таким образом, похоже, что слушатели компенсируют любые трудности, которые могут возникнуть при оценке предметов на иностранном языке. Такая компенсация невозможна в тестах ACR ITU-T P.800, где элементы слышны только один раз и сравнение с эталоном невозможно. Там предметы на иностранном языке оцениваются как более низкого качества при низком уровне владения языком слушателями. ^[12]

Ссылки [ править ]

^ Рекомендация ITU-R BS.1534
^ МСЭ-R BS.1116 (февраль 2015). «Методы субъективной оценки небольших нарушений в аудиосистемах» . Цитировать журнал требует |journal=( помощь )
^ ^a ^b Шинкель-Билефельд, Н., Лотце, Н. и Нагель, Ф. (май 2013 г.). «Оценка качества звука опытными и неопытными слушателями». Журнал акустического общества Америки . 133 (5): 3246. DOI : 10,1121 / 1,4805210 .CS1 maint: несколько имен: список авторов ( ссылка )
^ Рамси, Фрэнсис; Зелински, Славомир; Касье, Рафаэль; Беч, Сорен (31 мая 2005 г.). «Взаимосвязь между оценками опытных слушателей качества многоканального звука и предпочтениями наивных слушателей» . Журнал акустического общества Америки . 117 (6): 3832–3840. DOI : 10.1121 / 1.1904305 . ISSN 0001-4966 .
^ Гаэтан, Лорхо; Гийом, Ле Рей; Ник, Захаров (13.06.2010). «eGauge - мера экспертных знаний оценщика при оценке качества звука» . Труды Общества инженеров аудио. 38-я Международная конференция по оценке качества звука .
^ Jonas, Ekeroot; Ян, Берг; Арне, Нюкянен (25 апреля 2014 г.). «Критичность звуковых стимулов для тестов на прослушивание - продолжительность прослушивания во время выполнения задачи по ранжированию» . 136-й съезд Общества звукорежиссеров .
^ Макс, Нойендорф; Фредерик, Нагель (2011-10-19). «Исследовательские исследования перцепционной стационарности в тесте на прослушивание - Часть I: сигналы реального мира из пользовательских тестов на прослушивание» . Цитировать журнал требует |journal=( помощь )
^ Фредерик, Нагель; Макс, Нойендорф (2011-10-19). "Исследовательские исследования перцепционной стационарности в тесте на слушание - Часть II: Синтетические сигналы с изменяющимися во времени артефактами" . Цитировать журнал требует |journal=( помощь )
^ Надя, Шинкель-Билефельд (2017-05-11). «Оценка качества звука в тестах MUSHRA - Влияние между настройкой петли и рейтингом слушателей» . 142-й съезд Общества звукорежиссеров .
↑ ITU-T P.800 (август 1996 г.). «P.800: Методы субъективного определения качества передачи» . Цитировать журнал требует |journal=( помощь )
^ Надя, Шинкель-Билефельд; Чжан, Цзяньдун; Цинь, Или; Катарина, Лещановский, Анна; Фу, Шаньшань (2017-05-11). «Труднее ли воспринимать артефакт кодирования в предметах на иностранном языке? - Исследование с участием слушателей, говорящих на китайском и немецком языках» . Цитировать журнал требует |journal=( помощь )
^ Блашкова, Любица; Голуб, янв (2008). «Как неродные слушатели воспринимают качество передаваемого голоса?» (PDF) . Связь . 10.4 : 11–15.

Внешние ссылки [ править ]

RateIt: графический интерфейс для проведения экспериментов MUSHRA
MUSHRAM - интерфейс Matlab для тестов прослушивания MUSHRA
Интерфейс Max / MSP для тестов прослушивания MUSHRA
Инструмент оценки звука на основе браузера для запуска множества различных тестов, включая MUSHRA - кодирование не требуется
BeaqleJS: фреймворк на основе HTML5 и JavaScript для тестов прослушивания
Сервер MushraJS +: основан на MushraJS с сервером mochiweb, который является веб-сервером Erlang.

[BS1534-2-1] Рекомендация ITU-R BS.1534

[2] МСЭ-R BS.1116 (февраль 2015). «Методы субъективной оценки небольших нарушений в аудиосистемах» . Цитировать журнал требует |journal=( помощь )

[:0-3] Шинкель-Билефельд, Н., Лотце, Н. и Нагель, Ф. (май 2013 г.). «Оценка качества звука опытными и неопытными слушателями». Журнал акустического общества Америки . 133 (5): 3246. DOI : 10,1121 / 1,4805210 .CS1 maint: несколько имен: список авторов ( ссылка )

[4] Рамси, Фрэнсис; Зелински, Славомир; Касье, Рафаэль; Беч, Сорен (31 мая 2005 г.). «Взаимосвязь между оценками опытных слушателей качества многоканального звука и предпочтениями наивных слушателей» . Журнал акустического общества Америки . 117 (6): 3832–3840. DOI : 10.1121 / 1.1904305 . ISSN 0001-4966 .

[5] Гаэтан, Лорхо; Гийом, Ле Рей; Ник, Захаров (13.06.2010). «eGauge - мера экспертных знаний оценщика при оценке качества звука» . Труды Общества инженеров аудио. 38-я Международная конференция по оценке качества звука .

[6] Jonas, Ekeroot; Ян, Берг; Арне, Нюкянен (25 апреля 2014 г.). «Критичность звуковых стимулов для тестов на прослушивание - продолжительность прослушивания во время выполнения задачи по ранжированию» . 136-й съезд Общества звукорежиссеров .

[7] Макс, Нойендорф; Фредерик, Нагель (2011-10-19). «Исследовательские исследования перцепционной стационарности в тесте на прослушивание - Часть I: сигналы реального мира из пользовательских тестов на прослушивание» . Цитировать журнал требует |journal=( помощь )

[8] Фредерик, Нагель; Макс, Нойендорф (2011-10-19). "Исследовательские исследования перцепционной стационарности в тесте на слушание - Часть II: Синтетические сигналы с изменяющимися во времени артефактами" . Цитировать журнал требует |journal=( помощь )

[9] Надя, Шинкель-Билефельд (2017-05-11). «Оценка качества звука в тестах MUSHRA - Влияние между настройкой петли и рейтингом слушателей» . 142-й съезд Общества звукорежиссеров .

[10] ITU-T P.800 (август 1996 г.). «P.800: Методы субъективного определения качества передачи» . Цитировать журнал требует |journal=( помощь )

[11] Надя, Шинкель-Билефельд; Чжан, Цзяньдун; Цинь, Или; Катарина, Лещановский, Анна; Фу, Шаньшань (2017-05-11). «Труднее ли воспринимать артефакт кодирования в предметах на иностранном языке? - Исследование с участием слушателей, говорящих на китайском и немецком языках» . Цитировать журнал требует |journal=( помощь )

[12] Блашкова, Любица; Голуб, янв (2008). «Как неродные слушатели воспринимают качество передаваемого голоса?» (PDF) . Связь . 10.4 : 11–15.

[1]