Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

MPEG Surround ( ИСО / МЭК 23003-1 [1] , или в формате MPEG-D Часть 1 [2] [3] ), также известный как Spatial Audio Coding (SAC) [4] [5] [6] [7] является глянцевая формат сжатия для объемного звука, который обеспечивает метод расширения услуг моно- или стереозвука до многоканального звука с обратной совместимостью. Общая скорость передачи данных, используемая для (моно или стерео) ядра и данных MPEG Surround, обычно лишь немного выше, чем скорость передачи данных.используется для кодирования (моно или стерео) ядра. MPEG Surround добавляет поток дополнительной информации в основной битовый поток (моно или стерео) , содержащий данные пространственного изображения. Устаревшие системы воспроизведения стерео проигнорируют эту дополнительную информацию, в то время как плееры, поддерживающие декодирование MPEG Surround, будут выводить восстановленный многоканальный звук.

Группа экспертов по движущимся изображениям (MPEG) объявила конкурс предложений по кодированию пространственного звука MPEG в марте 2004 года. Группа решила, что технология, которая станет отправной точкой в ​​процессе стандартизации, будет представлять собой комбинацию материалов, представленных двумя сторонниками - Fraunhofer IIS / Agere Системы и технологии кодирования / Philips. [5] Стандарт MPEG Surround был разработан Группой экспертов по движущимся изображениям ( ISO / IEC JTC1 / SC29 / WG11) и опубликован как ISO / IEC 23003 в 2007 году. [1] Это был первый стандарт группы стандартов MPEG-D, официально известна как ISO / IEC 23003 - аудиотехнологии MPEG .

MPEG Surround был также определен как один из типов аудиообъектов MPEG-4 в 2007 году. [8] Существует также объектный тип MPEG-4 без задержки MPEG Surround (LD MPEG Surround), который был опубликован в 2010 году. [9] [ 10] Кодирование пространственных звуковых объектов (SAOC) было опубликовано как MPEG-D Part 2 - ISO / IEC 23003-2 в 2010 году и расширяет стандарт MPEG Surround, повторно используя его возможности пространственного рендеринга, сохраняя при этом полную совместимость с существующими приемниками. Система MPEG SAOC позволяет пользователям на стороне декодирования интерактивно управлять воспроизведением каждого отдельного звукового объекта (например, отдельных инструментов, вокала, человеческих голосов). [2] [3] [11] [12] [13] [14] [15]Существует также унифицированное кодирование речи и звука (USAC), которое будет определено в MPEG-D Часть 3 - ISO / IEC 23003-3 и ISO / IEC 14496-3: 2009 / Amd 3. [16] [17] MPEG- Инструменты параметрического кодирования D MPEG Surround интегрированы в кодек USAC. [18]

Ядро (моно или стерео) может быть закодировано любым аудиокодеком ( с потерями или без потерь ) . Особенно низкие битрейты (64-96 кбит / с для 5.1 каналов) возможны при использовании HE-AAC v2 в качестве основного кодека.

Восприятие звуков в пространстве [ править ]

Кодирование MPEG Surround использует нашу способность воспринимать звук в 3D и фиксирует это восприятие в компактном наборе параметров. Пространственное восприятие в первую очередь приписывается трем параметрам, или сигналам, описывающим, как люди локализуют звук в горизонтальной плоскости: межуровневая разность уровней (ILD), интерауральная разница во времени (ITD) и интерактивная когерентность.(IC). Эти три концепции показаны на следующем изображении. Прямые или поступающие в первый раз волны от источника попадают в левое ухо во время, в то время как прямой звук, полученный правым ухом, дифрагируется вокруг головы с соответствующими временными задержками и ослаблением уровня. Эти два эффекта приводят к ITD и ILD, связанным с основным источником. Наконец, в реверберирующей среде отраженный звук от источника, или звук от диффузного источника, или некоррелированный звук могут попасть в оба уха, все они связаны с IC.

Описание [ править ]

MPEG Surround использует межканальные различия в уровне, фазе и когерентности, эквивалентные параметрам ILD, ITD и IC. Пространственное изображение захватывается многоканальным аудиосигналом относительно переданного сигнала понижающего микширования. Эти параметры кодируются в очень компактной форме, чтобы декодировать параметры и переданный сигнал и синтезировать высококачественное многоканальное представление.

Кодер MPEG Surround принимает многоканальный аудиосигнал от x1 до xN, где количество входных каналов равно N. Наиболее важным аспектом процесса кодирования является то, что сигнал понижающего микширования xt1 и xt2, который обычно является стереофоническим, получается из многоканального входного сигнала, и именно этот сигнал понижающего микширования сжимается для передачи по каналу, а не многоканальный сигнал. . Кодер может иметь возможность использовать процесс понижающего микширования, чтобы быть более выгодным. Он не только создает точный эквивалент многоканального сигнала в моно или стерео понижающем микшировании, но также создает наилучшее возможное многоканальное декодирование на основе понижающего микширования и кодированных пространственных сигналов. В качестве альтернативы, понижающее микширование может поставляться извне (художественное понижающее микширование перед блоком диаграммы). Процесс кодирования MPEG Surround может игнорироваться алгоритмом сжатия, используемым для передаваемых каналов (аудиокодер и аудиодекодер перед блоком диаграммы).Это может быть любой тип высокопроизводительных алгоритмов сжатия, такой как MPEG-1 Layer III, MPEG-4 AAC или MPEG-4 High Efficiency AAC, или даже PCM.

Совместимость с предыдущими версиями [ править ]

Технология MPEG Surround обеспечивает совместимость с существующими и будущими стереофоническими декодерами MPEG за счет того, что передаваемое понижающее микширование (например, стерео) представляется стереофоническим декодерам MPEG как обычная стереофоническая версия многоканального сигнала. Совместимость со стереодекодерами желательна, поскольку стереопрезентация останется широко распространенной из-за количества приложений, в которых прослушивание осуществляется в основном через наушники, например портативных музыкальных плееров.

MPEG Surround также поддерживает режим, в котором понижающее микширование совместимо с популярными матричными декодерами окружающего звука, такими как Dolby Pro-Logic .

Приложения [ править ]

Цифровое аудиовещание [ править ]

Из-за относительно небольшой полосы пропускания канала, относительно большой стоимости передающего оборудования и лицензий на передачу, а также из-за стремления максимизировать выбор пользователя за счет предоставления множества программ, большинство существующих или планируемых систем цифрового вещания не могут обеспечить пользователям многоканальный звук.

DRM + был разработан [19], чтобы полностью поддерживать передачу MPEG Surround, и такое вещание также было успешно продемонстрировано. [20]

Обратная совместимость MPEG Surround и относительно низкие накладные расходы обеспечивают один способ добавить многоканальный звук в DAB без значительного снижения качества звука или влияния на другие службы.

Цифровое телевещание [ править ]

В настоящее время в большинстве передач цифрового ТВ используется стереозвук. MPEG Surround можно использовать для расширения этих установленных услуг на объемный звук, как в случае с DAB.

Служба загрузки музыки [ править ]

В настоящее время доступен ряд коммерческих служб загрузки музыки, которые работают со значительным коммерческим успехом. Такие услуги могут быть легко расширены для обеспечения многоканальных презентаций, оставаясь при этом совместимыми со стереопроигрывателями: на компьютерах с 5.1-канальными системами воспроизведения сжатые звуковые файлы представляются в формате объемного звука, тогда как на портативных плеерах те же файлы воспроизводятся в стерео.

Служба потоковой музыки / Интернет-радио [ править ]

Многие Интернет-радиостанции работают с сильно ограниченной полосой пропускания, поэтому они могут предлагать только моно- или стереоконтент. Технология MPEG Surround Coding может распространить это на многоканальную службу, оставаясь при этом в допустимом рабочем диапазоне битрейтов. Поскольку эффективность имеет первостепенное значение в этом приложении, сжатие передаваемого аудиосигнала имеет жизненно важное значение. Используя новейшую технологию сжатия MPEG (кодирование MPEG-4 High Efficiency Profile), были продемонстрированы полные системы MPEG Surround с битрейтом до 48 кбит / с.

См. Также [ править ]

  • Объемный звук
  • Сравнение форматов кодирования аудио

Ссылки [ править ]

  1. ^ a b ISO (29 января 2007 г.). «ISO / IEC 23003-1: 2007 - Информационные технологии - Аудиотехнологии MPEG - Часть 1: MPEG Surround» . ISO. Архивировано 06.06.2011 . Проверено 24 октября 2009 .
  2. ^ a b MPEG. «Стандарты MPEG - Полный список стандартов, разработанных или разрабатываемых» . chiariglione.org. Архивировано из оригинала на 2010-04-20 . Проверено 9 февраля 2010 .
  3. ^ a b MPEG. «Техническое задание» . chiariglione.org. Архивировано из оригинала на 2010-02-21 . Проверено 9 февраля 2010 .
  4. ^ «Предварительный просмотр ISO / IEC 23003-1, Первое издание, 15 февраля 2007 г., Часть 1: MPEG Surround» (PDF) . 2007-02-15. Архивировано (PDF) из оригинала на 2011-06-14 . Проверено 24 октября 2009 .
  5. ^ a b ISO / IEC JTC1 / SC29 / WG11 (июль 2005 г.). «Учебник по кодированию звука в формате MPEG Surround» . Архивировано из оригинала на 2010-04-30 . Проверено 9 февраля 2010 .
  6. ^ «Рабочие документы, MPEG-D (MPEG Audio Technologies)» . MPEG. Архивировано из оригинала на 2010-02-21 . Проверено 9 февраля 2010 .
  7. ^ MPEG Spatial Audio Coding / MPEG Surround: Обзор и текущее состояние (PDF) , Audio Engineering Society, 2005, архивировано (PDF) из оригинала 18 июля 2011 г. , извлечено 29 октября 2009 г.
  8. ^ ISO (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO / IEC 14496-3: 2005 / Amd 5: 2007» . ISO. Архивировано 06.06.2011 . Проверено 13 октября 2009 .
  9. ^ AES Convention Paper 8099 - Новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , заархивировано из оригинала (PDF) 28 сентября 2011 г. , получено 2011-07- 18
  10. ^ ISO / IEC JTC1 / SC29 / WG11 (октябрь 2009 г.), ISO / IEC 14496-3: 2009 / FPDAM 2 - простой профиль ALS и транспорт SAOC, N11032 , заархивировано из оригинала (DOC) 29.07.2014 , получено 30 декабря 2009 г.
  11. ^ ISO (2010-10-06). «ISO / IEC 23003-2 - Информационные технологии - Аудиотехнологии MPEG - Часть 2: Кодирование пространственных звуковых объектов (SAOC)» . Архивировано 01 февраля 2012 года . Проверено 18 июля 2011 .
  12. ^ Spatial Audio Object Coding (SAOC) - Предстоящий стандарт MPEG по параметрическому объектно-ориентированному кодированию аудио (PDF) , 2008 г., архив (PDF) из оригинала 12 марта 2012 г. , извлечен 19 июля 2011 г.
  13. ^ Manfred Луцкая, Fraunhofer IIS (2007), MPEG низкой задержки аудиокодеки (PDF) , в архиве (PDF) с оригинала на 2011-09-27 , извлекаться 2011-07-19
  14. MPEG (октябрь 2009 г.). «Уведомление о 91-м заседании WG11» . chiariglione.org. Архивировано из оригинала на 2010-02-17 . Проверено 9 февраля 2010 .
  15. ISO / IEC JTC 1 / SC 29 (30 декабря 2009 г.). «Программа работы (передана в SC 29 / WG 11) - MPEG-D» . Архивировано из оригинала на 2013-12-31 . Проверено 30 декабря 2009 .
  16. ^ «ISO / IEC DIS 23003-3 - Информационные технологии - Аудиотехнологии MPEG - Часть 3: Унифицированное кодирование речи и звука» . 2011-02-15. Архивировано 28 января 2012 года . Проверено 18 июля 2011 .
  17. ^ «ISO / IEC 14496-3: 2009 / PDAM 3 - Транспорт унифицированного кодирования речи и звука (USAC)» . 2011-06-30. Архивировано 29 января 2012 года . Проверено 18 июля 2011 .
  18. ^ «Универсальное программное обеспечение кодировщика речи и аудио» . Март 2011. Архивировано 06.08.2011 . Проверено 18 июля 2011 .
  19. ^ «Улучшение системы DRM одобрено ETSI» (пресс-релиз). Консорциум DRM. 2 сентября 2009 года Архивировано из оригинала 15 октября 2009 года . Проверено 20 октября 2009 .
  20. ^ «DRM + in Band I продвигается как наиболее подходящая технология для дополнения других стандартов цифрового радио в таких странах, как Франция» (пресс-релиз). Консорциум DRM. 16 июля 2009 года Архивировано из оригинала 15 октября 2009 года . Проверено 20 октября 2009 .

Внешние ссылки [ править ]

  • MPEG Surround
  • Официальный веб-сайт MPEG
  • RFC 5691 - Формат полезной нагрузки RTP для элементарных потоков с многоканальным звуком MPEG Surround