Из Википедии, бесплатной энциклопедии
  (Перенаправлено из Adaptive Multi-Rate )
Перейти к навигации Перейти к поиску

Adaptive Multi-Rate ( AMR , AMR-NB или GSM-AMR ) аудио кодек представляет собой формат сжатия аудио оптимизирован для кодирования речи . Речевой кодек AMR состоит из многоскоростного узкополосного речевого кодека, который кодирует узкополосные (200–3400 Гц) сигналы с переменной скоростью передачи в диапазоне от 4,75 до 12,2 кбит / с с качеством речи [3], начиная с 7,4 кбит / с. [4]

AMR был принят в качестве стандартного речевого кодека с помощью 3GPP в октябре 1999 года и в настоящее время широко используется в GSM [5] и UMTS . Он использует адаптацию канала для выбора одной из восьми различных скоростей передачи данных в зависимости от состояния канала.

AMR - это также формат файла для хранения речевого звука с использованием кодека AMR. Многие современные мобильные телефоны могут хранить короткие аудиозаписи в формате AMR, и существуют как бесплатные, так и проприетарные программы (см. Поддержка программного обеспечения ) для преобразования между этим и другими форматами, хотя AMR является речевым форматом и вряд ли даст идеальные результаты для других форматов. аудио. Распространенное расширение имени файла - .amr. Также существует другой формат хранения для AMR, который подходит для приложений с более высокими требованиями к формату хранения, таких как произвольный доступ или синхронизация с видео. Этот формат является специфицированным 3GPP контейнерным форматом 3GP , основанным на базовом формате медиафайлов ISO. [6]

Использование [ править ]

Кадры содержат 160 выборок и имеют длину 20 миллисекунд. [1] AMR использует различные методы, такие как ACELP , DTX , VAD и CNG . Использование AMR требует оптимизированной адаптации линии связи, которая выбирает лучший режим кодека для удовлетворения требований местного радиоканала и пропускной способности. Если условия радиосвязи плохие, кодирование источника сокращается, а кодирование каналаувеличена. Это улучшает качество и надежность сетевого соединения, в то же время жертвуя некоторой четкостью голоса. В конкретном случае AMR это улучшение составляет где-то около отношения сигнал / шум = 4–6 дБ для удобной связи. Новая интеллектуальная система позволяет оператору сети определять приоритеты емкости или качества для каждой базовой станции.

Всего существует 14 режимов кодека AMR, восемь доступны в канале с полной скоростью (FR) и шесть - в канале с половинной скоростью (HR) .

Особенности [ править ]

  • Частота дискретизации 8 кГц / 13 бит (160 отсчетов для кадров 20 мс), фильтруется до 200–3400 Гц.
  • Кодек AMR использует восемь исходных кодеков с битрейтами 12,2, 10,2, 7,95, 7,40, 6,70, 5,90, 5,15 и 4,75 кбит / с.
  • Создает длину кадра 95, 103, 118, 134, 148, 159, 204 или 244 бит для битовых скоростей AMR FR 4,75, 5,15, 5,90, 6,70, 7,40, 7,95, 10,2 или 12,2 кбит / с соответственно. Длины кадров AMR HR различаются.
  • AMR использует прерывистую передачу (DTX) с обнаружением голосовой активности (VAD) и генерацией комфортного шума (CNG) для уменьшения использования полосы пропускания в периоды тишины.
  • Алгоритмическая задержка составляет 20 мс на кадр. Для скоростей передачи 12,2 нет никакой задержки упреждающего "алгоритма". Для других скоростей задержка упреждения составляет 5 мс. Обратите внимание, что существует «фиктивная» задержка упреждающего просмотра 5 мс, чтобы обеспечить плавное покадровое переключение режима с остальными скоростями.
  • AMR - это гибридный речевой кодер, который передает как параметры речи, так и сигнал формы волны.
    • Кодирование с линейным предсказанием (LPC) используется для синтеза речи из остаточной формы волны. Параметры LPC кодируются как пары спектральных линий (LSP).
    • Остаточный сигнал кодируется с использованием линейного предсказания с возбуждением алгебраическим кодом (ACELP).
  • Сложность алгоритма оценивается в 5 баллов по относительной шкале, где G.711 - 1, а G.729a - 15.
  • Тестирование PSQM в идеальных условиях дает средние оценки 4,14 для AMR (12,2 кбит / с) по сравнению с 4,45 для G.711 (μ-закон) [ необходима ссылка ]
  • Тестирование PSQM при нагрузке на сеть дает средние оценки мнения 3,79 для AMR (12,2 кбит / с) по сравнению с 4,13 для G.711 (μ-закон)

Вопросы лицензирования и патентов [ править ]

AMR кодеки включают несколько патентов от Nokia , Ericsson , NTT и VoiceAge, [7] [8] последний является лицензия администратором для АСКУЭ патентных пулов . VoiceAge также принимает заявки на патенты для определения их возможной соответствия этим стандартам. Однако очень сложно определить, действительно ли существуют какие-либо патенты на так называемые изобретения, связанные с кодеками AMR / AMR-WB, поскольку изобретатели (и их юристы) делают все возможное, чтобы скрыть патенты, связанные с AMR / AMR-кодеками. Технология Всемирного банка [ необходима ссылка ]. Очевидно, все эти патенты скрыты от всех других исследований и широкой аудитории, которая, возможно, могла бы обнаружить предшествующий уровень техники в заявленных «изобретениях», запатентованных патентообладателями кодеков AMR / AMR-WB. [9] [10]

Первоначальный взнос за профессиональные инструменты для создания контента и продукты «канал реального времени» составляет 6500 долларов США. [ когда? ] Минимальный годовой гонорар составляет 10 000 долларов, без учета первоначального взноса в первый год. Стоимость лицензии за канал снижается с 0,99 доллара до 0,50 доллара в зависимости от объема, до максимум 2 миллионов долларов в год. [7] [8]

В категории продуктов для персональных компьютеров, например медиаплееров, декодер AMR лицензируется бесплатно. Плата за лицензию на проданный кодировщик падает с 0,40 до 0,30 доллара в зависимости от объема до максимум 300 000 долларов в год. Минимальный годовой гонорар не применяется к лицензированным продуктам, которые подпадают под категорию продуктов для персональных компьютеров и используют только бесплатный декодер. [7] [8]

Дополнительная информация:

  • Информация о лицензировании VoiceAge , включая цены на лицензирование кодеков AMR
  • Правовые вопросы 3GPP
  • Патентная платформа 3G и ее политика лицензирования
  • Кодеки AMR как общие библиотеки - юридические уведомления об использовании библиотек amrnb и amrwb на основе эталонной реализации

Поддержка программного обеспечения [ править ]

  • 3GPP TS 26.073 - Речевой кодек AMR (исходный код C) - эталонная реализация [11]
  • Audacity (бета-версия 1.3) через библиотеки интеграции FFmpeg [12] (как входной, так и выходной формат)
  • FFmpeg с библиотеками OpenCORE AMR [13]
  • Android [14] Используется для диктофона.
  • Кодеки AMR как общие библиотеки  - сайт разработки библиотек amrnb и amrwb. Эти библиотеки основаны на эталонной реализации и были созданы для предотвращения встраивания потенциально запатентованного исходного кода во многие проекты с открытым исходным кодом.
  • Программное обеспечение с открытым исходным кодом для преобразования формата .amr: RetroCode , Amr2Wav , оба находятся на ранней стадии разработки.
  • AMR Player - это бесплатное программное обеспечение для воспроизведения аудиофайлов AMR и может конвертировать AMR из / в аудиоформат MP3 / WAV.
  • Nokia Multimedia Converter 2.0 может преобразовывать (создавать) образцы, можно использовать инструмент преобразования Nokia для создания файлов .amr и .awb. Он также работает в Windows 7, если установка выполняется в режиме совместимости с XP.
  • сервис онлайн-конвертации media.io (ничего устанавливать не нужно)
  • MPlayer ( SMPlayer , KMPlayer [15] )
  • Parole Media Player 0.8.1 (в Ubuntu 16.04)
  • QuickTime Player и мультимедийный фреймворк
  • RealPlayer версии 11 и новее
  • VLC media player версии 1.1.0 и более поздних (только формат ввода, не формат вывода)
  • ffdshow
  • Apple iPhone (может воспроизводить файлы AMR)
  • iOS и macOS (iMessage)
  • Смартфоны BlackBerry (используются для формата файлов диктофона, в то время как BlackBerry 10 не может воспроизводить формат AMR)
  • Пакет кодеков K-Lite
  • Классический домашний кинотеатр Media Player, около 1.7.1
  • foobar2000 с компонентом foo_input_amr

См. Также [ править ]

  • Адаптивная многоскоростная широкополосная связь (AMR-WB)
  • Расширенная адаптивная многоскоростная передача - широкополосный (AMR-WB +)
  • Половинная ставка
  • Полная ставка
  • Расширенная полная скорость (EFR)
  • Частота выборки
  • ИС-641
  • 3GP
  • Сравнение форматов кодирования аудио
  • Профиль аудио-видео RTP

Ссылки [ править ]

  1. ^ a b «3GPP TS 26.090 - Функции обработки речи обязательного речевого кодека; речевой кодек с адаптивной многоскоростной передачей (AMR); функции транскодирования» . 3GPP . Проверено 21 июля 2010 .
  2. ^ «3GPP TS 26.071 - Обязательные функции обработки речи речевого кодека; речевой кодек AMR; Общее описание» . 3GPP . Проверено 21 июля 2010 .
  3. ^ "Что такое качественная голосовая связь?" . ITworld . Проверено 26 июля 2019 года .
  4. ^ RFC 4867 - Формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков Стр.
  5. ^ http://www.eetimes.com/electronics-news/4139026/Sorting-Through-GSM-Codecs-A-Tutorial
  6. ^ RFC 4867 - Формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков Стр.
  7. ^ a b c Корпорация VoiceAge (14 октября 2007 г.). «Условия лицензирования AMR» . VoiceAge Corporation. Архивировано из оригинала на 2007-10-14 . Проверено 12 сентября 2009 .
  8. ^ a b c Корпорация VoiceAge (июнь 2007 г.). «Условия лицензирования AMR» . VoiceAge Corporation. Архивировано из оригинала на 2007-10-14 . Проверено 12 сентября 2009 .
  9. ^ VoiceAge Corporation. «Лицензирование - патентные заявки» . VoiceAge Corporation. Архивировано из оригинала на 2007-10-14 . Проверено 12 сентября 2009 .
  10. ^ VoiceAge Corporation (2007-10-14). «Лицензирование - патентные заявки» . Archive.org. Архивировано из оригинала на 2007-10-14 . Проверено 12 сентября 2009 .
  11. ^ 3GPP (2008-12-11) 3GPP TS 26.073 - речевой кодек AMR, проверено 8 сентября 2009 г.
  12. Проверено 28 февраля 2010 г.
  13. ^ Общая документация FFmpeg - внешняя библиотека AMR , последнее посещение - 8 июля 2009 г.
  14. ^ Android AMR кодеки , загруженные на 2009-07-08 Архивированных 18 февраля 2009, в Wayback Machine
  15. ^ Настройки внутреннего аудиодекодера KMPlayer, архивировано 22октября2014 г. на Wayback Machine , проверено 22 октября 2014 г.

Внешние ссылки [ править ]

  • 3GPP TS 26.090 - Обязательные функции обработки речи речевым кодеком; Речевой кодек с адаптивной многоскоростной передачей (AMR); Функции перекодирования
  • 3GPP TS 26.071 - Функции обработки речи обязательного речевого кодека; Речевой кодек AMR; Общее описание
  • Спецификации кодеков 3GPP; 3G и выше / GSM, 26 серия
  • RFC 4867  - Формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков
  • RFC 4281  - Параметр кодеков для типов носителей "Bucket"