Адаптивная многоскоростная широкополосная связь


Adaptive Multi-Rate Wideband ( AMR-WB ) — это запатентованный широкополосный стандарт кодирования речевого звука, разработанный на основе адаптивного многоскоростного кодирования с использованием методологии, аналогичной алгебраическому линейному предсказанию с кодовым возбуждением (ACELP). AMR-WB обеспечивает улучшенное качество речи благодаря более широкой полосе частот речи 50–7000 Гц по сравнению с узкополосными речевыми кодерами, которые в целом оптимизированы для качества проводной POTS 300–3400 Гц. AMR-WB был разработан Nokia [1] и VoiceAge и впервые был определен 3GPP. [2]

AMR-WB кодируется как G.722.2, стандартный речевой кодек ITU-T , официально известный как широкополосное кодирование речи со скоростью около 16 кбит/с с использованием Adaptive Multi-Rate Wideband (AMR-WB) . G.722.2 AMR-WB — это тот же кодек, что и 3GPP AMR-WB. Соответствующие спецификации 3GPP: TS 26.190 для речевого кодека [3] и TS 26.194 для детектора голосовой активности. [4]

Распространенное расширение файла для формата файла AMR-WB — .awb. Также существует другой формат хранения для AMR-WB, который подходит для приложений с более высокими требованиями к формату хранения, например произвольный доступ или синхронизация с видео. Этот формат является указанным в 3GPP форматом контейнера 3GP , основанным на базовом формате медиафайлов ISO . [7] 3GP также позволяет использовать битовые потоки AMR-WB для стереозвука.

AMR-WB работает, как и AMR , с девятью различными битрейтами. Самая низкая скорость передачи данных, обеспечивающая отличное качество речи в чистой среде, составляет 12,65 кбит/с. Более высокие скорости передачи полезны в условиях фонового шума и для музыки. Кроме того, более низкие скорости передачи 6,60 и 8,85 кбит/с обеспечивают приемлемое качество, особенно по сравнению с узкополосными кодеками.

Частоты от 6,4 кГц до 7 кГц передаются только в режиме максимального битрейта (23,85 кбит/с), а в остальных режимах декодер генерирует звуки, используя данные более низкой частоты (75–6400 Гц) вместе со случайным шумом. (чтобы имитировать полосу высоких частот). [8]

Примечания: «Режим кодека можно менять каждые 20 мс в каналах 3G WCDMA и каждые 40 мс в каналах GSM/GERAN. (Для совместимости Tandem Free Operation с GSM/GERAN скорость смены режима ограничена в 3G до 40 мс в AMR- кодеры WB.)" [9]