Перцептивная оценка качества речи


Перцепционная оценка качества речи ( PESQ ) — это семейство стандартов, включающее методологию тестирования для автоматизированной оценки качества речи с точки зрения пользователя телефонной системы . Он был стандартизирован как Рекомендация ITU-T P.862 [1] в 2001 году. PESQ используется для объективного тестирования качества голосовой связи производителями телефонов, поставщиками сетевого оборудования и операторами связи. Для его использования требуется лицензия. Первое издание преемника PESQ POLQA (Рекомендация ITU-T P.863 [2] ) вступило в силу в 2011 году.

PESQ был разработан для моделирования субъективных тестов, обычно используемых в телекоммуникациях (например, Рекомендация МСЭ-Т P.800) для оценки качества голоса, воспринимаемого людьми. Следовательно, в качестве тестовых сигналов он использует настоящие голосовые образцы. Чтобы охарактеризовать качество прослушивания, воспринимаемое пользователями, крайне важно нагружать современное телекоммуникационное оборудование речевыми сигналами. Многие системы оптимизированы для работы с речью и могут непредсказуемым образом реагировать на неречевые сигналы (например, тональные сигналы, шум). Рекомендации по правильному использованию образцов голосовых тестов определены в руководстве по применению PESQ, содержащемся в Рекомендации МСЭ-Т P.862.3. [3]

Семейство полных эталонных объективных измерений качества речи ITU-T началось в 1997 году с Рекомендации ITU-T P.861 (PSQM), которая была заменена ITU-T P.862 (PESQ) [1] в 2001 году. P.862 был позже дополнены Рекомендациями ITU-T P.862.1 [4] (сопоставление оценок PESQ со шкалой MOS), ITU-T P.862.2 [5] (широкополосные измерения) и ITU-T P.862.3 [3] (руководство по применению) . Первое издание ITU-T P.863 ( POLQA ) [2] вступило в силу в 2011 году. Руководство по применению Рекомендации ITU-T P.863 было утверждено в 2019 году и опубликовано как ITU-T P.863.1. [6]

Помимо перечисленных выше полных эталонных методов, в список объективных стандартов измерения качества речи ITU-T также входит ITU-T P.563 [7] (алгоритм без эталона).

В зависимости от информации, предоставляемой алгоритму, алгоритмы тестирования качества речи можно разделить на две основные категории:

PESQ представляет собой алгоритм полного эталона, который анализирует речевой сигнал по выборке после временного выравнивания соответствующих фрагментов эталонного и тестового сигнала. PESQ может применяться для обеспечения сквозной (E2E) оценки качества сети или для характеристики отдельных сетевых компонентов.