MPEG-4 Part 3 или MPEG-4 Audio (формально ISO / IEC 14496-3) является третьей частью международного стандарта ISO / IEC MPEG-4, разработанного Moving Picture Experts Group . [1] Он определяет методы кодирования звука . Первая версия ISO / IEC 14496-3 была опубликована в 1999 г. [2]
MPEG-4 Part 3 состоит из множества технологий кодирования звука - от кодирования речи с потерями ( HVXC , CELP ), общего кодирования звука ( AAC , TwinVQ , BSAC) до сжатия звука без потерь ( MPEG-4 SLS , Audio Lossless Coding , MPEG). -4 DST ), интерфейс преобразования текста в речь (TTSI), структурированное аудио (с использованием SAOL , SASL, MIDI ) и многие дополнительные методы синтеза и кодирования звука. [3] [4] [5] [6] [7] [8] [9] [10][11]
MPEG-4 Audio не нацелен на одно приложение, такое как телефония в реальном времени или высококачественное сжатие звука. Это применимо к каждому приложению, которое требует использования усовершенствованного сжатия, синтеза, обработки или воспроизведения звука. MPEG-4 Audio - это новый тип звукового стандарта, который объединяет множество различных типов кодирования звука: естественный звук и синтетический звук, доставка с низким битрейтом и высококачественная доставка, речь и музыка, сложные и простые саундтреки, традиционный контент и интерактивный контент. . [7]
Версии
Версия | Дата выпуска | Последняя поправка | Стандарт | Описание |
---|---|---|---|---|
Первое издание | 1999 г. | 2001 г. | ИСО / МЭК 14496-3: 1999 [2] | также известный как "MPEG-4 Audio Version 1" |
2000 г. | ISO / IEC 14496-3: 1999 / Amd 1: 2000 [13] | также известный как «MPEG-4 Audio Version 2», поправка к первому изданию [7] [8] | ||
Второе издание | 2001 г. | 2005 г. | ИСО / МЭК 14496-3: 2001 [14] | |
Третье издание | 2005 г. | 2008 г. | ИСО / МЭК 14496-3: 2005 [15] | |
Четвертое издание | 2009 г. | 2015 г. и в стадии разработки [12] | ИСО / МЭК 14496-3: 2009 [1] [16] | |
Пятое издание | 2019 г. | ИСО / МЭК 14496-3: 2019 [17] | Текущая версия |
Подчасти
MPEG-4 Part 3 содержит следующие части: [16]
- Подчасть 1: Основная (список типов аудиообъектов, профилей, уровней, интерфейс с ISO / IEC 14496-1, транспортный поток аудио MPEG-4 и т. Д.)
- Подчасть 2: Кодирование речи - HVXC ( кодирование с возбуждением гармонического вектора)
- Подчасть 3: Кодирование речи - CELP (линейное предсказание с кодовым возбуждением)
- Подчасть 4: General Audio Coding (GA) (Time / Frequency Coding) - AAC , TwinVQ , BSAC
- Подчасть 5: Структурированное аудио (SA)
- Подчасть 6: Интерфейс преобразования текста в речь (TTSI)
- Подчасть 7: Параметрическое кодирование звука - HILN (гармонические и индивидуальные линии плюс шум)
- Подчасть 8: Техническое описание параметрического кодирования для высококачественного звука (SSC, Parametric Stereo )
- Подчасть 9: MPEG-1 / MPEG-2 Audio в MPEG-4
- Подчасть 10: Техническое описание кодирования без потерь сверхдискретизированного звука (MPEG-4 DST - прямая потоковая передача )
- Подчасть 11: Кодирование без потерь звука (ALS)
- Подчасть 12: Масштабируемое кодирование без потерь (SLS)
Типы аудиообъектов MPEG-4
MPEG-4 Audio включает в себя систему для единообразной обработки разнообразной группы аудиоформатов. Каждому формату назначается уникальный тип аудиообъекта для его представления. [18] [19] Тип объекта используется для различения различных методов кодирования. Он напрямую определяет подмножество инструментов MPEG-4, необходимых для декодирования конкретного объекта. Профили MPEG-4 основаны на типах объектов, и каждый профиль поддерживает свой список типов объектов. [19]
ID типа объекта | Тип аудиообъекта | Дата первого публичного выпуска | Описание |
---|---|---|---|
1 | AAC Main | 1999 г. | содержит AAC LC |
2 | AAC LC (низкая сложность) | 1999 г. | Используется в «Профиле AAC». Тип аудиообъекта MPEG-4 AAC LC основан на профиле низкой сложности (LC) MPEG-2 Part 7 в сочетании с восприятием замещения шума (PNS) (определенным в MPEG-4 Part 3 Subpart 4). [4] [22] |
3 | AAC SSR (масштабируемая частота дискретизации) | 1999 г. | Тип аудиообъекта MPEG-4 AAC SSR основан на профиле масштабируемой частоты дискретизации (SSR) MPEG-2, часть 7, в сочетании с восприятием замещения шума (PNS) (определенным в MPEG-4 Part 3 Subpart 4). [4] [22] |
4 | AAC LTP ( долгосрочное прогнозирование ) | 1999 г. | содержит AAC LC |
5 | SBR ( репликация спектральной полосы ) | 2003 [23] | используется с AAC LC в «Профиле AAC высокой эффективности» ( HE-AAC v1) |
6 | Масштабируемый AAC | 1999 г. | |
7 | TwinVQ | 1999 г. | кодирование звука с очень низким битрейтом |
8 | CELP ( линейное предсказание с кодовым возбуждением ) | 1999 г. | кодирование речи |
9 | HVXC (кодирование возбуждения гармонического вектора) | 1999 г. | кодирование речи |
10 | (Зарезервированный) | ||
11 | (Зарезервированный) | ||
12 | TTSI (преобразование текста в речь ) | 1999 г. | |
13 | Основной синтез | 1999 г. | содержит " wavetable " синтез на основе семплов [24], а также алгоритмический синтез и звуковые эффекты. |
14 | ' волновой ' синтез на основе сэмплов | 1999 г. | основанный на SoundFont и DownLoadable Sounds , [24] содержит General MIDI |
15 | General MIDI | 1999 г. | |
16 | Алгоритмический синтез и звуковые эффекты | 1999 г. | |
17 | ER AAC LC | 2000 г. | Устойчивый к ошибкам |
18 | (Зарезервированный ) | ||
19 | ER AAC LTP | 2000 г. | Устойчивый к ошибкам |
20 | ER AAC Масштабируемый | 2000 г. | Устойчивый к ошибкам |
21 год | ER TwinVQ | 2000 г. | Устойчивый к ошибкам |
22 | ER BSAC (побитовое арифметическое кодирование) | 2000 г. | Он также известен как «Fine Granule Audio» или инструмент тонкой масштабируемости. Он используется в сочетании с инструментами кодирования AAC и заменяет бесшумное кодирование и форматирование потока битов кодера MPEG-4 версии 1 GA. Устойчивый к ошибкам |
23 | ER AAC LD (низкая задержка) | 2000 г. | Устойчивость к ошибкам, используется с CELP, ER CELP, HVXC, ER HVXC и TTSI в «Профиле низкой задержки» (обычно используется для приложений разговора в реальном времени) |
24 | ER CELP | 2000 г. | Устойчивый к ошибкам |
25 | ER HVXC | 2000 г. | Устойчивый к ошибкам |
26 | ER HILN (Гармонические и отдельные линии плюс шум) | 2000 г. | Устойчивый к ошибкам |
27 | ER Параметрический | 2000 г. | Устойчивый к ошибкам |
28 год | SSC (синусоидальное кодирование) | 2004 [25] [26] | |
29 | PS ( параметрическое стерео ) | 2004 [27] и 2006 [28] [29] | используется с AAC LC и SBR в «Профиле HE-AAC v2». Инструмент кодирования PS был определен в 2004 году, а тип объекта - в 2006 году. |
30 | MPEG Surround | 2007 [30] | также известное как MPEG Spatial Audio Coding (SAC), это тип пространственного кодирования звука [31] [32] (MPEG Surround также был определен в ISO / IEC 23003-1 в 2007 году [33] ) |
31 год | (Зарезервированный) | ||
32 | MPEG-1/2 Layer-1 | 2005 [34] | |
33 | MPEG-1/2 Layer-2 | 2005 [34] | |
34 | MPEG-1/2 Уровень-3 | 2005 [34] | также известен как "MP3onMP4" |
35 год | DST ( прямая потоковая передача ) | 2005 [35] | кодирование звука без потерь, используемое на Super Audio CD |
36 | ALS ( кодирование без потерь звука ) | 2006 [29] | кодирование звука без потерь |
37 | SLS ( масштабируемое кодирование без потерь ) | 2006 [36] | двухуровневое кодирование звука со слоем без потерь и ядром / слоем General Audio с потерями (например, AAC) |
38 | SLS непрофильный | 2006 г. | кодирование звука без потерь без потерь ядра / уровня General Audio (например, AAC) |
39 | ER AAC ELD (улучшенная низкая задержка) | 2008 [37] | Устойчивый к ошибкам |
40 | SMR (символическое музыкальное представление) Простой | 2008 г. | примечание: символическое представление музыки также является стандартом MPEG-4, часть 23 (ISO / IEC 14496-23: 2008) [38] [39] |
41 год | SMR Main | 2008 г. | |
42 | USAC ( унифицированное кодирование речи и звука ) | 2012 г. | Унифицированное кодирование речи и звука определено в MPEG-D, часть 3 (ISO / IEC 23003-3: 2012) [40] |
43 год | SAOC (кодирование пространственных звуковых объектов) | 2010 [41] [42] | примечание: кодирование пространственных звуковых объектов также является стандартом MPEG-D Part 2 (ISO / IEC 23003-2: 2010) [43] |
44 год | LD MPEG Surround | 2010 [44] | Этот тип объекта передает дополнительную информацию MPEG Surround Coding с низкой задержкой (которая была определена в MPEG-D Часть 2 - ISO / IEC 23003-2 [43] ) в структуре MPEG-4 Audio. |
45 | SAOC-DE | 2013 | Улучшение диалога кодирования пространственных звуковых объектов |
46 | Аудио синхронизация | 2015 г. | Инструмент синхронизации звука обеспечивает возможность синхронизации нескольких материалов на нескольких устройствах. |
Аудио профили
Стандарт MPEG-4 Audio определяет несколько профилей. Эти профили основаны на типах объектов, и каждый профиль поддерживает разные списки типов объектов. Каждый профиль может также иметь несколько уровней, которые ограничивают некоторые параметры инструментов, присутствующих в профиле. Эти параметры обычно представляют собой частоту дискретизации и количество аудиоканалов, декодируемых одновременно.
Аудио профиль | Типы аудиообъектов | Дата первого публичного выпуска |
---|---|---|
Профиль AAC | AAC LC | 2003 г. |
Профиль AAC с высокой эффективностью | AAC LC, SBR | 2003 г. |
Профиль HE-AAC v2 | AAC LC, SBR, PS | 2006 г. |
Основной аудио профиль | AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, основной синтез | 1999 г. |
Масштабируемый аудио профиль | AAC LC, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI | 1999 г. |
Речь Аудио Профиль | CELP , HVXC , TTSI | 1999 г. |
Синтетический аудио профиль | TTSI, Основной синтез | 1999 г. |
Профиль аудио высокого качества | AAC LC, AAC LTP, AAC Scalable, CELP, ER AAC LC, ER AAC LTP, ER AAC Scalable, ER CELP | 2000 г. |
Аудио профиль с низкой задержкой | CELP, HVXC, TTSI, ER AAC LD, ER CELP, ER HVXC | 2000 г. |
Профиль Natural Audio | AAC Main, AAC LC, AAC SSR, AAC LTP, AAC Scalable, TwinVQ, CELP, HVXC, TTSI, ER AAC LC, ER AAC LTP, ER AAC Scalable, ER TwinVQ, ER BSAC, ER AAC LD, ER CELP, ER HVXC , ER HILN, ER Parametric | 2000 г. |
Профиль межсетевого взаимодействия мобильного аудио | ER AAC LC, ER AAC Scalable, ER TwinVQ, ER BSAC, ER AAC LD | 2000 г. |
Профиль HD-AAC | AAC LC, SLS [45] | 2009 [46] |
Простой профиль ALS | ALS | 2010 [42] [47] |
Хранение и транспортировка аудио
Стандарт | Описание | |
---|---|---|
Мультиплекс | ИСО / МЭК 14496-1 | Схема мультиплексирования MPEG-4 (M4Mux) [48] |
Мультиплекс | ИСО / МЭК 14496-3 | Транспортный мультиплексор с малыми накладными расходами (LATM) |
Место хранения | ISO / IEC 14496-3 (информативный) | Формат обмена аудиоданными (ADIF) - только для AAC |
Место хранения | ИСО / МЭК 14496-12 | Формат файлов MPEG-4 ( MP4 ) / базовый формат медиафайлов ISO |
Передача инфекции | ISO / IEC 14496-3 (информативный) | Audio Data Transport Stream (ADTS) - только для AAC |
Передача инфекции | ИСО / МЭК 14496-3 | Аудиопоток с низкими накладными расходами (LOAS), основанный на LATM |
Не существует стандарта для транспортировки элементарных потоков по каналу, потому что широкий спектр приложений MPEG-4 предъявляет слишком широкие требования к доставке, чтобы их можно было легко охарактеризовать с помощью одного решения.
Возможности транспортного уровня и связь между функциями транспорта, мультиплексирования и демультиплексирования описаны в структуре интеграции мультимедиа доставки (DMIF) в ИСО / МЭК 14496-6. [16] Под этим интерфейсом существует множество различных механизмов доставки, например транспортный поток MPEG , транспортный протокол реального времени (RTP) и т. Д.
Транспортный протокол в реальном времени определен в RFC 3016 (формат полезной нагрузки RTP для аудиовизуальных потоков MPEG-4), RFC 3640 (формат полезной нагрузки RTP для передачи элементарных потоков MPEG-4), RFC 4281 (параметр кодеков для " Bucket "Типы носителей) и RFC 4337 (Регистрация типа MIME для MPEG-4).
LATM и LOAS были определены для приложений естественного звука, которые не требуют сложного объектно-ориентированного кодирования или других функций, предоставляемых системами MPEG-4.
Бифуркация в техническом стандарте AAC
Advanced Audio Coding в MPEG-4 Части 3 (MPEG-4 Audio) Подчасть 4 был улучшен по сравнению с предыдущим стандартом MPEG-2 , часть 7 (Advanced Audio Coding), для того , чтобы обеспечить лучшее качество звука для данного кодирующего битрейт.
Предполагается, что любые различия в Части 3 и Части 7 будут устранены органом по стандартизации ISO в ближайшем будущем, чтобы избежать возможной несовместимости битовых потоков в будущем. В настоящее время нет известных случаев несовместимости проигрывателей или кодеков из-за новизны стандарта.
Стандарт MPEG-2 Part 7 (Advanced Audio Coding) был впервые опубликован в 1997 году и предлагает три профиля по умолчанию: [49] [50] Профиль низкой сложности (LC), Основной профиль и Профиль масштабируемой частоты дискретизации (SSR).
MPEG-4 Part 3 Subpart 4 (General Audio Coding) объединил профили из MPEG-2 Part 7 с Perceptual Noise Substitution (PNS) и определили их как типы аудиообъектов (AAC LC, AAC Main, AAC SSR). [4]
HE-AAC
High-Efficiency Advanced Audio Coding - это расширение AAC LC с использованием репликации спектральной полосы (SBR) и параметрического стерео (PS). Он разработан для повышения эффективности кодирования при низких скоростях передачи данных за счет использования частичного параметрического представления звука.
AAC-SSR
Масштабируемая частота дискретизации AAC была введена Sony в стандарты MPEG-2 Part 7 и MPEG-4 Part 3. [ необходима цитата ] Впервые он был опубликован в ISO / IEC 13818-7, Часть 7: Advanced Audio Coding (AAC) в 1997 году. [49] [50] Аудиосигнал сначала разделяется на 4 полосы с использованием 4- полосного многофазного квадратурного фильтра. банк. Затем эти 4 полосы дополнительно разделяются с использованием MDCT с размером k, равным 32 или 256 отсчетам. Это похоже на обычный AAC LC, который использует MDCT с размером k, равным 128 или 1024, непосредственно в аудиосигнале.
Преимущество этого метода состоит в том, что переключение коротких блоков может выполняться отдельно для каждой полосы PQF . Таким образом, высокие частоты можно кодировать с использованием короткого блока для повышения временного разрешения, а низкие частоты по-прежнему могут кодироваться с высоким спектральным разрешением. Однако из-за наложения спектров между 4 полосами PQF эффективность кодирования около (1,2,3) * fs / 8 хуже, чем у обычного MPEG-4 AAC LC. [ необходима цитата ]
MPEG-4 AAC-SSR очень похож на ATRAC и ATRAC-3 .
Почему был представлен AAC-SSR
Идея AAC-SSR заключалась не только в перечисленных выше преимуществах, но и в возможности снижения скорости передачи данных путем удаления 1, 2 или 3 верхних полос PQF. Очень простой разделитель битового потока может удалить эти полосы и, таким образом, снизить битрейт и частоту дискретизации.
Пример:
- 4 поддиапазона: битрейт = 128 кбит / с, частота дискретизации = 48 кГц, f_lowpass = 20 кГц
- 3 поддиапазона: битрейт ~ 120 кбит / с, частота дискретизации = 48 кГц, f_lowpass = 18 кГц
- 2 поддиапазона: битрейт ~ 100 кбит / с, частота дискретизации = 24 кГц, f_lowpass = 12 кГц
- 1 поддиапазон: битрейт ~ 65 кбит / с, частота дискретизации = 12 кГц, f_lowpass = 6 кГц
Примечание: хотя это возможно, качество результата намного хуже, чем типичное для этого битрейта. Таким образом, для обычного AAC LC 64 кбит / с полоса пропускания 14–16 кГц достигается за счет использования стерео интенсивности и сокращенных ЯМР. Это ухудшает качество звука меньше, чем передача с полосой пропускания 6 кГц с отличным качеством.
BSAC
Битовое арифметическое кодирование - это стандарт MPEG-4 (ISO / IEC 14496-3, подраздел 4) для масштабируемого кодирования звука. BSAC использует альтернативное бесшумное кодирование для AAC, а остальная часть обработки идентична AAC. Такая поддержка масштабируемости обеспечивает почти прозрачное качество звука при 64 кбит / с и постепенное ухудшение качества звука при более низких скоростях передачи данных. Кодирование BSAC лучше всего выполнять в диапазоне от 40 кбит / с до 64 кбит / с, хотя оно работает в диапазоне от 16 кбит / с до 64 кбит / с. Кодек AAC-BSAC используется в приложениях цифрового мультимедийного вещания (DMB) .
Лицензирование
В 2002 году Комитет по лицензированию аудио MPEG-4 выбрал Via Licensing Corporation в качестве администратора лицензирования для пула патентов MPEG-4 Audio . [3] [51] [52]
Смотрите также
- TwinVQ - один из типов объектов, определенных в MPEG-4 Audio версии 1
- MPEG-4, часть 2
- Формат контейнера MPEG-4, часть 14 (MP4)
- Управление цифровыми правами
- Расширенное кодирование звука (AAC)
- ISO / IEC JTC 1 / SC 29
Рекомендации
- ^ a b ISO (2009). «ISO / IEC 14496-3: 2009 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио» . ISO . Проверено 6 октября 2009 .
- ^ а б ISO (1999). «ISO / IEC 14496-3: 1999 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио» . ISO . Проверено 6 октября 2009 .
- ^ а б Деловой провод (2002-12-02). «Комитет по лицензированию аудио MPEG-4 выбирает через Licensing Corporation в качестве администратора; Комитет по лицензированию аудио MPEG-4 завершает согласование условий лицензирования профиля аудио» . Бесплатная библиотека . Проверено 6 октября 2009 .
- ^ а б в г Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). «Кодирование естественного звука MPEG-4 - Профили и уровни звука» . chiariglione.org. Архивировано из оригинала 2010-07-17 . Проверено 6 октября 2009 .
- ^ Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма. «Кодирование естественного звука MPEG-4 - масштабируемость в естественном звуке MPEG-4» . chiariglione.org. Архивировано из оригинала на 2010-02-28 . Проверено 6 октября 2009 .
- ^ Д. Том, Х. Пурнхаген и подгруппа MPEG Audio (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio - MPEG-4» . chiariglione.org . Проверено 6 октября 2009 .CS1 maint: несколько имен: список авторов ( ссылка )
- ^ а б в г ISO / IEC JTC 1 / SC 29 / WG 11 (июль 1999 г.), ISO / IEC 14496-3: /Amd.1 - Проект окончательного комитета - MPEG-4 Audio Version 2 (PDF) , заархивировано из оригинала (PDF) на 01.08.2012 , проверено 07.10.2009
- ^ а б Хайко Пурнхаген (1999-06-07), Обзор MPEG-4 Audio Version 2 (PDF) , Хайко Пурнхаген , извлечено 07.10.2009[ постоянная мертвая ссылка ]
- ^ а б Хайко Пурнхаген (01.06.2001). «Стандарт звука MPEG-4: обзор и приложения» . Хайко Пурнхаген . Проверено 7 октября 2009 .[ мертвая ссылка ]
- ^ Хайко Пурнхаген (07.11.2001). «Веб-страница MPEG Audio - MPEG-4 Audio (ISO / IEC 14496-3)» . Проверено 7 октября 2009 .[ мертвая ссылка ]
- ^ Роб Коенен, ISO / IEC JTC1 / SC29 / WG11 (март 2002 г.). «Обзор стандарта MPEG-4» . chiariglione.org . Проверено 6 октября 2009 .
- ^ а б MPEG. «Стандарты MPEG - Полный список стандартов, разработанных или разрабатываемых» . chiariglione.org. Архивировано из оригинального 20 апреля 2010 года . Проверено 31 октября 2009 .
- ^ ISO (2000). «ISO / IEC 14496-3: 1999 / Amd 1: 2000 - Расширения аудио» . ISO . Проверено 7 октября 2009 .
- ^ ISO (2001). «ISO / IEC 14496-3: 2001 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио» . ISO . Проверено 14 октября 2009 .
- ^ ISO (2005). «ISO / IEC 14496-3: 2005 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио» . ISO . Проверено 14 октября 2009 .
- ^ а б в г ISO / IEC (2009-09-01), ISO / IEC 14496-3: 2009 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио (PDF) , IEC , получено 07.10.2009
- ^ ISO / IEC (2019-12-01), ISO / IEC 14496-3: 2019 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио , IEC , получено 2020-06-02
- ^ а б MultimediaWiki (2009). «MPEG-4 Audio» . MultimediaWiki . Проверено 9 октября 2009 .
- ^ а б в Бернхард Гриль; Стефан Гейерсбергер; Йоханнес Хильперт; Бодо Тейхманн (июль 2004 г.), « Реализация аудиокомпонентов MPEG-4 на различных платформах» (PDF) , Fraunhofer Gesellschaft, заархивировано из оригинала (PDF) 10 июня 2007 г. , получено 9 октября 2009 г.
- ^ ISO / IEC JTC1 / SC29 / WG11 N2203 (март 1998 г.). «Аудио MPEG-4 (проект заключительного комитета 14496-3)» . Хайко Пурнхаген . Проверено 7 октября 2009 .[ мертвая ссылка ]
- ^ а б в ISO / IEC JTC1 / SC29 / WG11 / N7016 (2005-01-11), текст ISO / IEC 14496-3: 2001 / FPDAM 4, Audio Lossless Coding (ALS), новые профили звука и расширения BSAC , заархивированные из оригинала (DOC) на 2014-05-12 , извлекаются 2009-10-09
- ^ а б Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). «Кодирование естественного звука MPEG-4 - общее кодирование звука (на основе AAC)» . chiariglione.org. Архивировано из оригинала на 2010-02-19 . Проверено 6 октября 2009 .
- ^ ISO (2003). «Расширение полосы пропускания, ISO / IEC 14496-3: 2001 / Amd 1: 2003» . ISO . Проверено 13 октября 2009 .
- ^ а б Scheirer, Eric D .; Рэй, Ли (1998). «Алгоритмический синтез и синтез волновых таблиц в стандарте мультимедиа MPEG-4». Конвенция Общества звукорежиссеров 105, 1998 . CiteSeerX 10.1.1.35.2773 .
2.2 Синтез волновой таблицы с помощью SASBF: Формат банка волновых таблиц SASBF имел довольно сложную историю развития. Первоначальная спецификация была предоставлена E-Mu Systems и основана на их формате «SoundFont» [15]. После завершения интеграции этого компонента в эталонное программное обеспечение MPEG-4 Ассоциация производителей MIDI (MMA) обратилась к MPEG с просьбой, чтобы MPEG-4 SASBF был совместим с их форматом «Загруженные звуки» [13]. E-Mu согласился, что такая совместимость желательна, и поэтому все стороны согласовали и разработали новый формат.
- ^ ISO (2004). «Параметрическое кодирование для высококачественного звука, ISO / IEC 14496-3: 2001 / Amd 2: 2004» . ISO . Проверено 13 октября 2009 .
- ^ ISO / IEC JTC1 / SC29 / WG11 (25.07.2003). «Текст ISO / IEC 14496-3: 2001 / FPDAM2 (Parametric Audio) - N5713» . Архивировано из оригинального (DOC) 12 мая 2014 года . Проверено 13 октября 2009 .
- ^ 3GPP (30 сентября 2004 г.). «3GPP TS 26.401 V6.0.0 (2004-09), Функции обработки звука общего аудиокодека; Общее описание улучшенного аудиокодека aacPlus (версия 6)» (DOC) . 3GPP . Проверено 13 октября 2009 .
- ^ 3GPP (4 января 2005 г.). «ETSI TS 126 401 V6.1.0 (2004-12) - Универсальная система мобильной связи (UMTS) Общие функции обработки звука аудиокодеком; Общее описание общего аудиокодека Enhanced aacPlus (3GPP TS 26.401, версия 6.1.0, выпуск 6)» . 3GPP . Проверено 13 октября 2009 .
- ^ а б ISO (2006). «Кодирование без потерь звука (ALS), новые профили звука и расширения BSAC, ISO / IEC 14496-3: 2005 / Amd 2: 2006» . ISO . Проверено 13 октября 2009 .
- ^ ISO (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO / IEC 14496-3: 2005 / Amd 5: 2007» . ISO . Проверено 13 октября 2009 .
- ^ ISO / IEC JTC1 / SC29 / WG11 (июль 2005 г.). «Учебное пособие по кодированию звука в формате MPEG Surround» . Архивировано из оригинала на 2010-04-30 . Проверено 9 февраля 2010 .
- ^ ISO / IEC JTC1 / SC29 / WG11 (июль 2005 г.). «Учебное пособие по кодированию звука в формате MPEG Surround» . Архивировано из оригинала на 2008-03-24 . Проверено 9 февраля 2010 .
- ^ ИСО (29 января 2007 г.). «ISO / IEC 23003-1: 2007 - Информационные технологии - Аудиотехнологии MPEG - Часть 1: MPEG Surround» . ISO . Проверено 24 октября 2009 .
- ^ а б в ISO (2005). «Аудио MPEG-1/2 в MPEG-4, ISO / IEC 14496-3: 2001 / Amd 3: 2005» . ISO . Проверено 13 октября 2009 .
- ^ ISO (2005). «Кодирование передискретизированного звука без потерь, ISO / IEC 14496-3: 2001 / Amd 6: 2005» . ISO . Проверено 13 октября 2009 .
- ^ ISO (2006). «Масштабируемое кодирование без потерь (SLS), ISO / IEC 14496-3: 2005 / Amd 3: 2006» . ISO . Проверено 13 октября 2009 .
- ^ ISO (2008). «Улучшенный AAC с низкой задержкой, ISO / IEC 14496-3: 2005 / Amd 9: 2008» . ISO . Проверено 13 октября 2009 .
- ^ ISO (2008). «ИСО / МЭК 14496-23: 2008, Информационные технологии - Кодирование аудиовизуальных объектов - Часть 23: Символическое музыкальное представление» . ISO . Проверено 13 октября 2009 .
- ^ ISO (2008). «Соответствие символической музыки, ISO / IEC 14496-4: 2004 / Amd 29: 2008» . ISO . Проверено 13 октября 2009 .
- ^ ISO (2012). «ISO / IEC 23003-3: 2012 - Информационные технологии - Аудиотехнологии MPEG - Часть 3: Унифицированное кодирование речи и звука» . ISO . Проверено 7 ноября 2019 .
- ^ ISO (2009). «ISO / IEC 14496-3: 2009 / Amd 2: 2010, простой профиль ALS и транспортировка SAOC» . ISO . Проверено 13 октября 2009 .
- ^ а б ISO / IEC JTC1 / SC29 / WG11 (2009-07-03), ISO / IEC 14496-3: 200X / PDAM 2 - ALS Simple Profile and Transport of SAOC, N10826 , заархивировано из оригинала (DOC) 2014-07- 29 , проверено 13 октября 2009 г.
- ^ а б ISO (2010). «ISO / IEC 23003-2: 2010 - Информационные технологии - Аудиотехнологии MPEG - Часть 2: Кодирование пространственных звуковых объектов (SAOC)» . ISO . Проверено 27 декабря 2010 .
- ^ Документ AES Convention 8099 - Новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , получено 07 ноября 2019 г.
- ^ ISO / IEC JTC1 / SC29 / WG11 (2008-10-17), ISO / IEC 14496-3: 2005 / PDAM 10: 200X HD-AAC profile, MPEG2008 / N10188 , заархивировано из оригинала (DOC) 2014-05- 12 , проверено 19 октября 2009 г.
- ^ ИСО (11 сентября 2009 г.). «ISO / IEC 14496-3: 2009 / Amd 1: 2009 - Профиль HD-AAC и сигнализация MPEG Surround» . ISO . Проверено 15 октября 2009 .
- ^ ИСО (2008-10-08). «ISO / IEC 14496-3: 2009 / Amd 2: 2010 - Простой профиль ALS и транспортировка SAOC» . ISO . Проверено 15 октября 2009 .
- ^ ISO (2004-11-15), ISO / IEC 14496-1, Третье издание 2004-11-15, Часть 1: Системы (PDF) , ISO, заархивировано из оригинала (PDF) 14 июня 2011 г. , извлечено с 2009 г. 10–14
- ^ а б ISO (2004-10-15), ISO / IEC 13818-7, Третье издание, Часть 7 - Advanced Audio Coding (AAC) (PDF) , стр. 32, заархивировано из оригинального (PDF) 13 июля 2011 г. , извлечено 19 октября 2009 г.
- ^ а б ISO (1997). «ИСО / МЭК 13818-7: 1997, Информационные технологии - Общее кодирование движущихся изображений и связанной с ними звуковой информации - Часть 7: Расширенное аудиокодирование (AAC)» . Проверено 19 октября 2009 .
- ^ Business Wire (05.01.2009). «Via Licensing объявляет о лицензии на патентный пул MPEG-4 SLS» . Рейтер. Архивировано из оригинала на 2013-01-04 . Проверено 9 октября 2009 .
- ^ Через лицензионную корпорацию (12 мая 2009 г.). «Via Licensing объявляет о доступности совместной программы патентного лицензирования MPEG-4 SLS» . Деловой провод . Проверено 9 октября 2009 .
Внешние ссылки
- Apple: MPEG-4: AAC
- «AAC» (VideoLAN WIKI)
- Субъективные тесты прослушивания EBU на аудиокодеках с низким битрейтом
- Радиостанции AAC - Онлайн радиостанции в формате AAC
- Tuner2 - Каталог радиостанций в формате AAC + с разным битрейтом
- RadioFeeds UK & Ireland - Страница, содержащая множество наземных станций, ведущих интернет-вещание в формате AAC +.
- [1] Страница сравнения кодеков, включая HE-AAC @ 64 кбит / с, с помощью тестов прослушивания. (Страница не в сети)
- Официальный веб-сайт MPEG
- RFC 3016 - формат полезной нагрузки RTP для аудиовизуальных потоков MPEG-4
- RFC 3640 - Формат полезной нагрузки RTP для транспортировки элементарных потоков MPEG-4
- RFC 4281 - Параметр кодеков для типов носителей "Bucket"
- RFC 4337 - Регистрация типа MIME для MPEG-4