Перцепционная оценка качества речи ( PESQ ) - это семейство стандартов, включающих методологию тестирования для автоматической оценки качества речи, которую испытывает пользователь телефонной системы. Он был стандартизирован как Рекомендация ITU-T P.862 [1] в 2001 году. PESQ используется для объективного тестирования качества голоса производителями телефонов, поставщиками сетевого оборудования и операторами связи. Для его использования требуется лицензия. Первое издание POLQA, преемника PESQ (Рекомендация ITU-T P.863 [2] ), вступило в силу в 2011 году.
Объем измерений
PESQ был разработан для моделирования субъективных тестов, обычно используемых в электросвязи (например, Рекомендация ITU-T P.800) для оценки качества голоса, воспринимаемого людьми. Следовательно, в качестве тестовых сигналов используются образцы истинного голоса. Для того чтобы охарактеризовать качество прослушивания, воспринимаемое пользователями, чрезвычайно важно загрузить современное телекоммуникационное оборудование сигналами, подобными речи. Многие системы оптимизированы для речи и непредсказуемо реагируют на неречевые сигналы (например, тоны, шум). Рекомендации по правильному применению образцов голосового тестирования определены в руководстве по применению PESQ, содержащемся в Рекомендации МСЭ-Т P.862.3. [3]
Семейство полных эталонных объективных измерений качества голоса МСЭ-Т началось в 1997 году с Рекомендации МСЭ-Т P.861 (PSQM), которая была заменена МСЭ-Т P.862 (PESQ) [1] в 2001 году. дополнен Рекомендациями ITU-T P.862.1 [4] (преобразование оценок PESQ в шкалу MOS), ITU-T P.862.2 [5] (широкополосные измерения) и ITU-T P.862.3 [3] (руководство по применению) . Первое издание ITU-T P.863 ( POLQA ) [2] вступило в силу в 2011 году. Руководство по применению Рекомендации ITU-T P.863 было утверждено в 2019 году и опубликовано как ITU-T P.863.1. [6]
Помимо перечисленных выше полных эталонных методов, список объективных стандартов измерения качества речи ITU-T также включает ITU-T P.563 [7] (алгоритм без эталона).
Типология тестирования
В зависимости от информации, которая предоставляется алгоритму, алгоритмы проверки качества речи можно разделить на две основные категории:
- Алгоритм «полного эталона» (FR) имеет доступ к исходному эталонному сигналу и использует его для сравнения (т. Е. Анализа различий). Он может сравнивать каждую выборку опорного сигнала (сторона говорящего) с каждой соответствующей выборкой ухудшенного сигнала (сторона слушателя). Измерения FR обеспечивают высочайшую точность и повторяемость, но могут применяться только для специальных тестов в реальных сетях (например, инструменты тестирования двигателя для тестов мобильной сети).
- Алгоритм «без опорного сигнала» (NR) использует только ухудшенный сигнал для оценки качества и не имеет информации об исходном опорном сигнале. Алгоритмы NR (например, Рекомендация МСЭ-Т P.563 [7] ) являются оценками только с низкой точностью, поскольку исходные голосовые характеристики (например, говорящий мужчина или женщина, фоновый шум, неголосовой) эталонного источника полностью неизвестны. . Обычный вариант алгоритмов NR даже не анализирует декодированный аудиосигнал, а работает над анализом цифрового битового потока на уровне IP-пакетов. Следовательно, измерение ограничивается анализом транспортного потока.
PESQ - это алгоритм с полным эталоном, который анализирует речевой сигнал выборка за выборкой после временного выравнивания соответствующих фрагментов эталонного и тестового сигналов. PESQ может применяться для обеспечения сквозной оценки качества (E2E) сети или для характеристики отдельных компонентов сети.
Результаты PESQ в основном моделируют средние оценки мнений (MOS), которые охватывают шкалу от 1 (плохо) до 5 (отлично). Функция отображения на MOS-LQO описана в Рекомендации МСЭ-Т P.862.1. [4]
Смотрите также
- Перцепционный объективный анализ качества слушания (POLQA)
- Перцепционная оценка качества видео (PEVQ)
- Перцепционная оценка качества звука (PEAQ)
- Индекс качества речи слуховых аппаратов (HASQI)
Рекомендации
- ^ a b «P.862: Перцепционная оценка качества речи (PESQ): объективный метод сквозной оценки качества речи в узкополосных телефонных сетях и речевых кодеках» . www.itu.int . Проверено 20 апреля 2021 .
- ^ а б «P.863: Перцепционное объективное прогнозирование качества прослушивания» . www.itu.int . Проверено 11 апреля 2021 .
- ^ а б «P.862.3: Руководство по применению для объективного измерения качества на основе Рекомендаций P.862, P.862.1 и P.862.2» . www.itu.int . Проверено 20 апреля 2021 .
- ^ а б «P.862.1: Функция сопоставления для преобразования необработанных результатов P.862 в MOS-LQO» . www.itu.int . Проверено 11 апреля 2021 .
- ^ «P.862.2: Широкополосное расширение Рекомендации P.862 для оценки широкополосных телефонных сетей и речевых кодеков» . www.itu.int . Проверено 11 апреля 2021 .
- ^ «P.863.1: Руководство по применению Рекомендации МСЭ-T P.863» . www.itu.int . Проверено 11 апреля 2021 .
- ^ а б «P.563: Несимметричный метод объективной оценки качества речи в узкополосных телефонных приложениях» . www.itu.int . Проверено 11 апреля 2021 .
Внешние ссылки
- Примечание по применению 1GA49: Измерение качества психоакустического звука с помощью анализатора звука R&S UPV
- Примечание по применению 1MA119: Измерение PESQ для GSM с помощью R & SCMUgo
- Примечание по применению 1MA136: Измерение PESQ для CDMA2000 с помощью R & SCMUgo
- Примечание по применению 1MA137: Измерение PESQ для WCDMA с помощью R & SCMUgo
- Примечание по применению 1MA149: Измерения VoIP для WiMAX