Перцептивная оценка качества речи

Перцепционная оценка качества речи ( PESQ ) - это семейство стандартов, включающих методологию тестирования для автоматической оценки качества речи, которую испытывает пользователь телефонной системы. Он был стандартизирован как Рекомендация ITU-T P.862 ^[1] в 2001 году. PESQ используется для объективного тестирования качества голоса производителями телефонов, поставщиками сетевого оборудования и операторами связи. Для его использования требуется лицензия. Первое издание POLQA, преемника PESQ (Рекомендация ITU-T P.863 ^[2] ), вступило в силу в 2011 году.

Объем измерений

PESQ был разработан для моделирования субъективных тестов, обычно используемых в электросвязи (например, Рекомендация ITU-T P.800) для оценки качества голоса, воспринимаемого людьми. Следовательно, в качестве тестовых сигналов используются образцы истинного голоса. Для того чтобы охарактеризовать качество прослушивания, воспринимаемое пользователями, чрезвычайно важно загрузить современное телекоммуникационное оборудование сигналами, подобными речи. Многие системы оптимизированы для речи и непредсказуемо реагируют на неречевые сигналы (например, тоны, шум). Рекомендации по правильному применению образцов голосового тестирования определены в руководстве по применению PESQ, содержащемся в Рекомендации МСЭ-Т P.862.3. ^[3]

Генеалогия родственных стандартов

Семейство полных эталонных объективных измерений качества голоса МСЭ-Т началось в 1997 году с Рекомендации МСЭ-Т P.861 (PSQM), которая была заменена МСЭ-Т P.862 (PESQ) ^[1] в 2001 году. дополнен Рекомендациями ITU-T P.862.1 ^[4] (преобразование оценок PESQ в шкалу MOS), ITU-T P.862.2 ^[5] (широкополосные измерения) и ITU-T P.862.3 ^[3] (руководство по применению) . Первое издание ITU-T P.863 ( POLQA ) ^[2] вступило в силу в 2011 году. Руководство по применению Рекомендации ITU-T P.863 было утверждено в 2019 году и опубликовано как ITU-T P.863.1. ^[6]

Помимо перечисленных выше полных эталонных методов, список объективных стандартов измерения качества речи ITU-T также включает ITU-T P.563 ^[7] (алгоритм без эталона).

Типология тестирования

В зависимости от информации, которая предоставляется алгоритму, алгоритмы проверки качества речи можно разделить на две основные категории:

Алгоритм «полного эталона» (FR) имеет доступ к исходному эталонному сигналу и использует его для сравнения (т. Е. Анализа различий). Он может сравнивать каждую выборку опорного сигнала (сторона говорящего) с каждой соответствующей выборкой ухудшенного сигнала (сторона слушателя). Измерения FR обеспечивают высочайшую точность и повторяемость, но могут применяться только для специальных тестов в реальных сетях (например, инструменты тестирования двигателя для тестов мобильной сети).
Алгоритм «без опорного сигнала» (NR) использует только ухудшенный сигнал для оценки качества и не имеет информации об исходном опорном сигнале. Алгоритмы NR (например, Рекомендация МСЭ-Т P.563 ^[7] ) являются оценками только с низкой точностью, поскольку исходные голосовые характеристики (например, говорящий мужчина или женщина, фоновый шум, неголосовой) эталонного источника полностью неизвестны. . Обычный вариант алгоритмов NR даже не анализирует декодированный аудиосигнал, а работает над анализом цифрового битового потока на уровне IP-пакетов. Следовательно, измерение ограничивается анализом транспортного потока.

PESQ - это алгоритм с полным эталоном, который анализирует речевой сигнал выборка за выборкой после временного выравнивания соответствующих фрагментов эталонного и тестового сигналов. PESQ может применяться для обеспечения сквозной оценки качества (E2E) сети или для характеристики отдельных компонентов сети.

Результаты PESQ в основном моделируют средние оценки мнений (MOS), которые охватывают шкалу от 1 (плохо) до 5 (отлично). Функция отображения на MOS-LQO описана в Рекомендации МСЭ-Т P.862.1. ^[4]

Смотрите также

Перцепционный объективный анализ качества слушания (POLQA)
Перцепционная оценка качества видео (PEVQ)
Перцепционная оценка качества звука (PEAQ)
Индекс качества речи слуховых аппаратов (HASQI)

Внешние ссылки

Примечание по применению 1GA49: Измерение качества психоакустического звука с помощью анализатора звука R&S UPV
Примечание по применению 1MA119: Измерение PESQ для GSM с помощью R & SCMUgo
Примечание по применению 1MA136: Измерение PESQ для CDMA2000 с помощью R & SCMUgo
Примечание по применению 1MA137: Измерение PESQ для WCDMA с помощью R & SCMUgo
Примечание по применению 1MA149: Измерения VoIP для WiMAX

[:1-1] «P.862: Перцепционная оценка качества речи (PESQ): объективный метод сквозной оценки качества речи в узкополосных телефонных сетях и речевых кодеках» . www.itu.int . Проверено 20 апреля 2021 .

[:0-2] а ^б «P.863: Перцепционное объективное прогнозирование качества прослушивания» . www.itu.int . Проверено 11 апреля 2021 .

[:2-3] а ^б «P.862.3: Руководство по применению для объективного измерения качества на основе Рекомендаций P.862, P.862.1 и P.862.2» . www.itu.int . Проверено 20 апреля 2021 .

[:3-4] а ^б «P.862.1: Функция сопоставления для преобразования необработанных результатов P.862 в MOS-LQO» . www.itu.int . Проверено 11 апреля 2021 .

[5] «P.862.2: Широкополосное расширение Рекомендации P.862 для оценки широкополосных телефонных сетей и речевых кодеков» . www.itu.int . Проверено 11 апреля 2021 .

[6] «P.863.1: Руководство по применению Рекомендации МСЭ-T P.863» . www.itu.int . Проверено 11 апреля 2021 .

[:4-7] а ^б «P.563: Несимметричный метод объективной оценки качества речи в узкополосных телефонных приложениях» . www.itu.int . Проверено 11 апреля 2021 .

[1]