Совместное кодирование

В аудио инженерии , совместное кодирование относится к присоединению нескольких каналов подобной информации во кодирующих для того , чтобы получить более высокое качество, меньшего размер файла, или оба.

Совместное стерео

Термин « совместное стерео» получил широкое распространение, поскольку Интернет позволил передавать звук приемлемого качества с относительно низкой скоростью передачи данных при умеренной скорости доступа в Интернет. Совместное стерео относится к любому количеству методов кодирования, используемых для этой цели. Здесь описаны две формы, каждая из которых по-разному реализована с разными кодеками , такими как MP3 , AAC и Ogg Vorbis .

Стерео кодирование по интенсивности

В этой форме совместного стерео используется метод, известный как совместное частотное кодирование , которое работает по принципу локализации звука . Человеческий слух обычно менее остро воспринимает направление определенных звуковых частот. Используя эту характеристику, интенсивное стереофоническое кодирование может снизить скорость передачи данных аудиопотока с незначительным или нулевым воспринимаемым изменением видимого качества.

В частности, преобладание меж слуховой разницы во времени (ITD) для локализации звука человеком присутствует только для более низких частот. Это оставляет меж слуховые различия амплитуды (IAD) в качестве доминирующего индикатора местоположения для более высоких частот. Идея стереофонического кодирования интенсивности состоит в том, чтобы объединить нижний спектр в один канал (таким образом уменьшая общие различия между каналами) и передать небольшую дополнительную информацию о том, как панорамировать определенные частотные области для восстановления сигналов IAD .

Этот тип кодирования не полностью восстанавливает исходный звук из-за потери информации, что приводит к упрощению стереоизображения и может создавать заметные артефакты сжатия . Однако для очень низких скоростей передачи данных этот тип кодирования обычно дает выигрыш в воспринимаемом качестве звука. Он поддерживается многими форматами сжатия звука (включая MP3 , AAC , Vorbis и Opus ), но не всегда каждым кодировщиком.

M / S стереокодирование

Стерео кодирование M / S преобразует левый и правый каналы в средний канал и побочный канал. Средний канал - это сумма левого и правого каналов, или ${\ Displaystyle M = L + R}$ . Боковой канал - это разница левого и правого каналов, или ${\ Displaystyle S = LR}$ . В отличие от интенсивного стереофонического кодирования, M / S-кодирование является особым случаем кодирования с преобразованием и отлично сохраняет звук без появления артефактов. Кодеки без потерь, такие как FLAC или Monkey's Audio, используют стереокодирование M / S из-за этой характеристики.

Чтобы восстановить исходный сигнал, каналы либо добавляются ${\ displaystyle L = {\ frac {M + S} {2}}}$ или вычтено ${\ displaystyle R = {\ frac {MS} {2}}}$

Эта форма кодирования также иногда известна как матричное стерео и используется во многих различных формах оборудования для обработки и записи звука. Это не ограничивается цифровыми системами , и даже может быть создано с помощью пассивных аудио трансформаторов или аналоговых усилителей . Одним из примеров использования M / S стерео является стереовещание FM , где ${\ Displaystyle L + R}$ модулирует несущей волны и ${\ displaystyle LR}$ модулирует поднесущую . Это обеспечивает обратную совместимость с монофоническим оборудованием, для которого потребуется только средний канал. Другой пример M / S стерео - запись стереофонических микроканавок . Боковое движение стилуса представляет собой сумму двух каналов, а вертикальное движение представляет собой разницу между каналами.

Совместное частотное кодирование

Совместное частотное кодирование - это метод кодирования , используемый при сжатии аудиоданных для снижения скорости передачи данных .

Идея состоит в том, чтобы объединить заданный частотный диапазон нескольких звуковых каналов вместе, чтобы результирующее кодирование сохраняло звуковую информацию этого диапазона не как пучок отдельных каналов, а как один однородный поток данных. Это навсегда разрушит исходное разделение каналов, поскольку информация не может быть точно восстановлена, но значительно уменьшит объем необходимого места для хранения. Только в некоторых формах объединенного стерео используется метод совместного частотного кодирования, такой как стереофоническое кодирование по интенсивности.

Реализации

При использовании в процессе сжатия MP3 объединенное стерео обычно использует несколько методов и может переключаться между ними для каждого кадра MPEG. Обычно в совмещенном стереорежиме современного кодировщика для одних кадров используется стерео M / S, а для других - L / R стерео, в зависимости от того, какой метод дает наилучший результат. Кодеры используют разные алгоритмы, чтобы определить, когда переключаться и сколько места выделить каждому каналу; качество может пострадать, если переключение происходит слишком часто или если побочный канал не получает достаточно битов. С помощью некоторого программного обеспечения для кодирования можно принудительно использовать стереозвук M / S для всех кадров, имитируя совместный стереорежим некоторых ранних кодировщиков, таких как Xing . В кодировщике LAME это называется принудительным объединенным стерео. ^[1]

Как и в случае с MP3, в стерео-файлах Ogg Vorbis может использоваться либо левое / правое стерео, либо объединенное стерео. При использовании совместного стерео могут использоваться как M / S стерео, так и методы интенсивного стерео. В отличие от MP3, где M / S-стерео (при его использовании) применяется до квантования, кодер Ogg Vorbis применяет M / S-стерео к отсчетам в частотной области после квантования, что делает применение M / S-стерео этапом без потерь. После этого шага любую частотную область можно преобразовать в стерео по интенсивности, удалив соответствующую часть побочного канала M / S-сигнала. Функция пола Ogg Vorbis позаботится о необходимом панорамировании влево-вправо.

Внешние ссылки

Юрген Херре, Фраунгофер IIS. От совместного стереозвука к кодированию пространственного звука - последние достижения и стандартизация . Октябрь 2004 г., документ 157, 7-я Международная конференция по цифровым звуковым эффектам DAFx'04.

[1] "Подробные параметры командной строки" . LAME документация . Проверено 13 декабря 2013 . JOINT STEREO [...] означает, что кодировщик может использовать (покадрово) либо L / R стерео, либо mid / side стерео. В средне / боковом стереофоническом [...] канале среднему каналу выделяется больше бит, чем побочному каналу. Когда стерео разделение не слишком велико, это эффективно увеличивает полосу пропускания, обеспечивая более высокое качество при том же количестве битов. Неправильное использование среднего / бокового стерео может привести к слышимым артефактам сжатия. Слишком частое переключение между средним / боковым и обычным стерео также может плохо звучать. Чтобы определить, когда переключиться на средне / боковое стерео, LAME использует гораздо более сложный алгоритм, чем тот, который описан в документации ISO. FORCED MID / SIDE STEREO принудительно кодирует все кадры с помощью среднего / бокового стерео. Его следует использовать только в том случае, если вы уверены, что каждый кадр входного файла имеет очень небольшое стерео разделение.

[1]