Adaptive Multi-Rate ( AMR , AMR-NB или GSM-AMR ) аудио кодек представляет собой формат сжатия аудио оптимизирован для кодирования речи . Речевой кодек AMR состоит из многоскоростного узкополосного речевого кодека, который кодирует узкополосные (200–3400 Гц) сигналы с переменной скоростью передачи в диапазоне от 4,75 до 12,2 кбит / с с качеством речи [3], начиная с 7,4 кбит / с. [4]
Расширение имени файла | .amr, .3ga |
---|---|
Тип интернет-СМИ | аудио / AMR, аудио / 3gpp, аудио / 3gpp2 |
Первый выпуск | 23 июня 1999 [1] [2] |
Последний релиз | 14.0.0 (17 марта 2017 г . ) |
Тип формата | Формат сжатия звука, формат аудиофайла |
AMR был принят в качестве стандартного речевого кодека с помощью 3GPP в октябре 1999 года и в настоящее время широко используется в GSM [5] и UMTS . Он использует адаптацию канала для выбора одной из восьми различных скоростей передачи данных в зависимости от состояния канала.
AMR - это также формат файла для хранения речевого звука с использованием кодека AMR. Многие современные мобильные телефоны могут хранить короткие аудиозаписи в формате AMR, и существуют как бесплатные, так и проприетарные программы (см. Поддержка программного обеспечения ) для преобразования между этим и другими форматами, хотя AMR является речевым форматом и вряд ли даст идеальные результаты для других форматов. аудио. Распространенное расширение имени файла - .amr
. Также существует другой формат хранения для AMR, который подходит для приложений с более высокими требованиями к формату хранения, таких как произвольный доступ или синхронизация с видео. Этот формат является специфицированным 3GPP контейнерным форматом 3GP , основанным на базовом формате медиафайлов ISO. [6]
Применение
Кадры содержат 160 выборок и имеют длину 20 миллисекунд. [1] AMR использует различные методы, такие как ACELP , DTX , VAD и CNG . Использование AMR требует оптимизированной адаптации линии связи, которая выбирает лучший режим кодека для удовлетворения требований местного радиоканала и пропускной способности. Если условия радиосвязи плохие, кодирование источника сокращается, а кодирование канала увеличивается. Это улучшает качество и надежность сетевого соединения, в то же время жертвуя некоторой четкостью голоса. В конкретном случае AMR это улучшение составляет где-то около отношения сигнал / шум = 4–6 дБ для удобной связи. Новая интеллектуальная система позволяет оператору сети определять приоритеты емкости или качества для каждой базовой станции.
Всего существует 14 режимов кодека AMR, восемь доступны в канале с полной скоростью (FR) и шесть - в канале с половинной скоростью (HR) .
Режим | Битрейт (кбит / с) | Канал | Совместим с |
---|---|---|---|
AMR_12.20 | 12.20 | FR | ETSI GSM расширенная полная скорость |
AMR_10.20 | 10.20 | FR | |
AMR_7.95 | 7,95 | FR / HR | |
AMR_7.40 | 7,40 | FR / HR | TIA / EIA IS-641 TDMA с улучшенной полной скоростью |
AMR_6.70 | 6,70 | FR / HR | ARIB 6,7 кбит / с расширенная полная скорость |
AMR_5.90 | 5,90 | FR / HR | |
AMR_5.15 | 5,15 | FR / HR | |
AMR_4.75 | 4,75 | FR / HR | |
AMR_SID | 1,80 | FR / HR |
Функции
- Частота дискретизации 8 кГц / 13 бит (160 отсчетов для кадров 20 мс), фильтруется до 200–3400 Гц.
- Кодек AMR использует восемь исходных кодеков со скоростью передачи данных 12,2, 10,2, 7,95, 7,40, 6,70, 5,90, 5,15 и 4,75 кбит / с.
- Создает длину кадра 95, 103, 118, 134, 148, 159, 204 или 244 бит для битовых скоростей AMR FR 4,75, 5,15, 5,90, 6,70, 7,40, 7,95, 10,2 или 12,2 кбит / с соответственно. Длины кадров AMR HR различаются.
- AMR использует прерывистую передачу (DTX) с обнаружением голосовой активности (VAD) и генерацией комфортного шума (CNG) для уменьшения использования полосы пропускания в периоды тишины.
- Алгоритмическая задержка составляет 20 мс на кадр. Для скоростей передачи 12,2 нет никакой задержки упреждающего "алгоритма". Для других скоростей задержка упреждения составляет 5 мс. Обратите внимание, что существует «фиктивная» задержка упреждающего просмотра 5 мс, чтобы обеспечить плавное покадровое переключение режима с остальными скоростями.
- AMR - это гибридный речевой кодер, который передает как параметры речи, так и сигнал формы волны.
- Кодирование с линейным предсказанием (LPC) используется для синтеза речи из остаточной формы волны. Параметры LPC кодируются как пары спектральных линий (LSP).
- Остаточный сигнал кодируется с использованием линейного предсказания с возбуждением алгебраическим кодом (ACELP).
- Сложность алгоритма оценивается в 5 баллов по относительной шкале, где G.711 - 1, а G.729a - 15.
- Тестирование PSQM в идеальных условиях дает средние оценки 4,14 для AMR (12,2 кбит / с) по сравнению с 4,45 для G.711 (μ-закон) [ необходима ссылка ]
- Тестирование PSQM при нагрузке на сеть дает средние оценки мнения 3,79 для AMR (12,2 кбит / с) по сравнению с 4,13 для G.711 (μ-закон)
Лицензионные и патентные вопросы
AMR кодеки включают несколько патентов от Nokia , Ericsson , NTT и VoiceAge, [7] [8] последний является лицензия администратором для АСКУЭ патентных пулов . VoiceAge также принимает заявки на патенты для определения их возможной соответствия этим стандартам. Однако очень сложно определить, действительно ли существуют какие-либо патенты на так называемые изобретения, связанные с кодеками AMR / AMR-WB, поскольку изобретатели (и их юристы) делают все возможное, чтобы скрыть патенты, связанные с AMR / AMR-кодеками. WB Technology [ ссылка обязательна ] . Очевидно, все эти патенты скрыты от всех других исследований и широкой аудитории, которая, возможно, могла бы обнаружить предшествующий уровень техники в заявленных «изобретениях», запатентованных патентообладателями кодеков AMR / AMR-WB. [9] [10]
Первоначальная плата за профессиональные инструменты для создания контента и продукты «канал реального времени» составляет 6 500 долларов США. [ когда? ] Минимальный годовой гонорар составляет 10 000 долларов, без учета первоначального взноса в первый год. Стоимость лицензии за канал снижается с 0,99 доллара до 0,50 доллара в зависимости от объема, до максимум 2 миллионов долларов в год. [7] [8]
В категории продуктов для персональных компьютеров, например медиаплееров, декодер AMR лицензируется бесплатно. Плата за лицензию на проданный кодировщик падает с 0,40 до 0,30 доллара в зависимости от объема до максимум 300 000 долларов в год. Минимальный годовой роялти не применяется к лицензированным продуктам, которые подпадают под категорию продуктов для персональных компьютеров и используют только бесплатный декодер. [7] [8]
Больше информации:
- Информация о лицензировании VoiceAge , включая цены на лицензирование кодеков AMR
- Правовые вопросы 3GPP
- Патентная платформа 3G и ее политика лицензирования
- Кодеки AMR как общие библиотеки - юридические уведомления об использовании библиотек amrnb и amrwb на основе эталонной реализации
Программная поддержка
- 3GPP TS 26.073 - Речевой кодек AMR (исходный код C) - эталонная реализация [11]
- Audacity (бета-версия 1.3) через библиотеки интеграции FFmpeg [12] (как входной, так и выходной формат)
- FFmpeg с библиотеками OpenCORE AMR [13]
- Android [14] Используется для диктофона.
- Кодеки AMR как общие библиотеки - сайт разработки библиотек amrnb и amrwb. Эти библиотеки основаны на эталонной реализации и были созданы для предотвращения встраивания потенциально запатентованного исходного кода во многие проекты с открытым исходным кодом.
- Программное обеспечение с открытым исходным кодом для преобразования формата .amr: RetroCode , Amr2Wav , оба находятся на ранней стадии разработки.
- AMR Player - это бесплатное программное обеспечение для воспроизведения аудиофайлов AMR и может конвертировать AMR из / в аудиоформат MP3 / WAV.
- Nokia Multimedia Converter 2.0 может преобразовывать (создавать) образцы, можно использовать инструмент преобразования Nokia для создания файлов .amr и .awb. Он также работает в Windows 7, если установка выполняется в режиме совместимости с XP.
- сервис онлайн-конвертации media.io (ничего устанавливать не нужно)
- MPlayer ( SMPlayer , KMPlayer [15] )
- Parole Media Player 0.8.1 (в Ubuntu 16.04)
- QuickTime Player и мультимедийный фреймворк
- RealPlayer версии 11 и новее
- VLC media player версии 1.1.0 и более поздних (только формат ввода, не формат вывода)
- ffdshow
- Apple iPhone (может воспроизводить файлы AMR)
- iOS и macOS (iMessage)
- Смартфоны BlackBerry (используются для формата файлов диктофона, в то время как BlackBerry 10 не может воспроизводить формат AMR)
- Пакет кодеков K-Lite
- Классический домашний кинотеатр Media Player, около 1.7.1
- foobar2000 с компонентом foo_input_amr
Смотрите также
- Адаптивная многоскоростная широкополосная связь (AMR-WB)
- Расширенная адаптивная многоскоростная передача - широкополосный (AMR-WB +)
- Половинная ставка
- Полная ставка
- Расширенная полная скорость (EFR)
- Частота выборки
- ИС-641
- 3GP
- Сравнение форматов кодирования аудио
- Профиль аудио-видео RTP
Рекомендации
- ^ a b «3GPP TS 26.090 - Функции обработки речи обязательного речевого кодека; речевой кодек с адаптивной многоскоростной передачей (AMR); функции транскодирования» . 3GPP . Проверено 21 июля 2010 .
- ^ «3GPP TS 26.071 - Обязательный речевой кодек, функции обработки речи; речевой кодек AMR; Общее описание» . 3GPP . Проверено 21 июля 2010 .
- ^ "Что такое качественная голосовая связь?" . ITworld . Проверено 26 июля 2019 года .
- ^ RFC 4867 - Формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков Стр.
- ^ http://www.eetimes.com/electronics-news/4139026/Sorting-Through-GSM-Codecs-A-Tutorial
- ^ RFC 4867 - Формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков Стр.
- ^ а б в Корпорация VoiceAge (14 октября 2007 г.). «Условия лицензирования AMR» . VoiceAge Corporation. Архивировано из оригинала на 2007-10-14 . Проверено 12 сентября 2009 .
- ^ а б в VoiceAge Corporation (июнь 2007 г.). «Условия лицензирования AMR» . VoiceAge Corporation. Архивировано из оригинала на 2007-10-14 . Проверено 12 сентября 2009 .
- ^ VoiceAge Corporation. «Лицензирование - патентные заявки» . VoiceAge Corporation. Архивировано из оригинала на 2007-10-14 . Проверено 12 сентября 2009 .
- ^ Корпорация VoiceAge (14 октября 2007 г.). «Лицензирование - патентные заявки» . Archive.org. Архивировано из оригинала на 2007-10-14 . Проверено 12 сентября 2009 .
- ^ 3GPP (2008-12-11) 3GPP TS 26.073 - речевой кодек AMR, проверено 8 сентября 2009 г.
- ↑ Проверено 28 февраля 2010 г.
- ^ Общая документация FFmpeg - внешняя библиотека AMR , последнее посещение - 8 июля 2009 г.
- ^ Android AMR кодеки , загруженные на 2009-07-08 Архивированных 18 февраля 2009, в Wayback Machine
- ^ Настройки внутреннего аудиодекодера KMPlayer Архивировано 22октября2014 г. на Wayback Machine , проверено 22 октября 2014 г.
Внешние ссылки
- 3GPP TS 26.090 - Обязательные функции обработки речи речевым кодеком; Речевой кодек с адаптивной многоскоростной передачей (AMR); Функции перекодирования
- 3GPP TS 26.071 - Функции обработки речи обязательного речевого кодека; Речевой кодек AMR; Общее описание
- Спецификации кодеков 3GPP; 3G и выше / GSM, 26 серия
- RFC 4867 - Формат полезной нагрузки RTP и формат хранения файлов для адаптивных многоскоростных (AMR) и адаптивных многоскоростных широкополосных (AMR-WB) аудиокодеков
- RFC 4281 - Параметр кодеков для типов носителей "Bucket"