Послушайте эту статью
Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Отображение уровней звука на цифровом аудиорекордере ( Zoom H4n )

Цифровое аудио - это представление звука, записанного или преобразованного в цифровую форму . В цифровом аудио, звуковая волна от звукового сигнала , как правило , кодируются в виде числовых образцов в непрерывной последовательности. Например, в аудио компакт-диске сэмплы берутся 44 100 раз в секунду , каждая с глубиной сэмпла 16 бит . Цифровой звук - это также название всей технологии записи и воспроизведения звука с использованием аудиосигналов, закодированных в цифровой форме. После значительных достижений в области цифровых аудиотехнологий в 1970-х и 1980-х годах он постепенно вытесниланалоговые аудиотехнологии во многих областях аудиотехники и телекоммуникаций в 1990-х и 2000-х годах.

В цифровой аудиосистеме аналоговый электрический сигнал, представляющий звук, преобразуется аналого-цифровым преобразователем (АЦП) в цифровой сигнал, обычно с использованием импульсно-кодовой модуляции (ИКМ). Затем этот цифровой сигнал можно записывать, редактировать, изменять и копировать с помощью компьютеров , устройств воспроизведения звука и других цифровых инструментов. Когда звукорежиссер желает прослушать запись в наушниках или громкоговорителях (или когда потребитель желает прослушать цифровой звуковой файл), цифро-аналоговый преобразователь (ЦАП) выполняет обратный процесс, преобразовывая цифровой сигнал обратно в аналоговый сигнал, который затем отправляется через усилитель мощности звука и в конечном итоге нагромкоговоритель .

Цифровые аудиосистемы могут включать в себя компоненты сжатия , хранения , обработки и передачи . Преобразование в цифровой формат обеспечивает удобное управление, хранение, передачу и поиск аудиосигнала. В отличие от аналогового звука, при котором копирование записи приводит к потере генерации и ухудшению качества сигнала, цифровой звук позволяет делать бесконечное количество копий без какого-либо ухудшения качества сигнала.

Обзор [ править ]

Звуковая волна красного цвета, представленная в цифровом виде, синим цветом (после дискретизации и 4-битного квантования ).

Цифровые аудиотехнологии используются для записи, обработки, массового производства и распространения звука, включая записи песен , инструментальных произведений, подкастов , звуковых эффектов и других звуков. Современное онлайн-распространение музыки зависит от цифровой записи и сжатия данных . Доступность музыки в виде файлов данных, а не физических объектов, значительно снизила расходы на распространение. [1] До появления цифрового звука музыкальная индустрия распространяла и продавала музыку, продавая физические копии в виде пластинок и кассет . С системами цифрового аудио и онлайн-распространения, такими как iTunes, компании продают потребителям цифровые звуковые файлы, которые потребитель получает через Интернет.

Аналоговая аудиосистема преобразует физические формы звуковых сигналов в электрические представления этих форм сигналов с помощью преобразователя , такого как микрофон . Затем звуки сохраняются на аналоговом носителе, таком как магнитная лента , или передаются через аналоговый носитель, такой как телефонная линия или радио . Для воспроизведения процесс обратный: электрический аудиосигнал усиливается, а затем преобразуется обратно в физические формы волны через громкоговоритель . Аналоговый звук сохраняет свои фундаментальные волновые характеристики при хранении, преобразовании, дублировании и усилении.

Аналоговые аудиосигналы подвержены шумам и искажениям из-за врожденных характеристик электронных схем и связанных с ними устройств. Помехи в цифровой системе не приводят к ошибкам, если только помехи не настолько велики, что могут привести к неправильной интерпретации символа как другой символ или нарушению последовательности символов. Поэтому, как правило, можно иметь полностью безошибочную цифровую аудиосистему, в которой не возникает шума или искажений между преобразованием в цифровой формат и преобразованием обратно в аналоговый.

Цифровой аудиосигнал может быть закодирован для исправления любых ошибок, которые могут возникнуть при хранении или передаче сигнала. Этот метод, известный как канальное кодирование , необходим для широковещательных или записанных цифровых систем для поддержания битовой точности. Модуляция от восьми до четырнадцати - это код канала, используемый в аудио компакт-диске (CD).

Процесс преобразования [ править ]

Жизненный цикл звука от его источника через АЦП, цифровую обработку, ЦАП и, наконец, снова как звук.

Цифровая аудиосистема начинается с АЦП, который преобразует аналоговый сигнал в цифровой. [примечание 1] АЦП работает с указанной частотой дискретизации и выполняет преобразование с известным битовым разрешением. Например, CD-аудио имеет частоту дискретизации 44,1  кГц (44 100 отсчетов в секунду) и 16-битное разрешение для каждого стереоканала . Аналоговые сигналы, которые еще не были ограничены полосой, должны быть пропущены через фильтр сглаживания перед преобразованием, чтобы предотвратить искажение наложения спектров , вызываемое аудиосигналами с частотами выше частоты Найквиста (половина частоты дискретизации).

Цифровой аудиосигнал может быть сохранен или передан. Цифровой звук может храниться на компакт-диске, цифровом аудиоплеере , жестком диске , флэш-накопителе USB или любом другом устройстве хранения цифровых данных . Цифровой сигнал может быть изменен посредством цифровой обработки сигнала , где он может быть отфильтрован или к нему могут быть применены эффекты . Преобразование частоты дискретизации, включая повышающую и понижающую дискретизацию, может использоваться для согласования сигналов, которые были закодированы с другой частотой дискретизации, с общей частотой дискретизации до обработки. Методы сжатия аудиоданных, такие как MP3 ,Advanced Audio Coding , Ogg Vorbis или FLAC , обычно используются для уменьшения размера файла. Цифровой звук может передаваться через цифровые аудиоинтерфейсы, такие как AES3 или MADI . Цифровое аудио может передаваться по сети с использованием аудио через Ethernet , аудио через IP или другие стандарты и системы потокового мультимедиа .

Для воспроизведения цифровой звук должен быть преобразован обратно в аналоговый сигнал с помощью ЦАП. Согласно теореме выборки Найквиста – Шеннона , с некоторыми практическими и теоретическими ограничениями, версия исходного аналогового сигнала с ограниченной полосой пропускания может быть точно восстановлена ​​из цифрового сигнала.

История [ править ]

Кодирование [ править ]

Импульсно-кодовая модуляция (PCM) , была изобретена английским ученым Алек Reeves в 1937 году [2] В 1950 г. С. Чэпин Катлер из Bell Labs , поданного патент на дифференциальной импульсно-кодовой модуляции (ДИКЙ), [3] с сжатием данных алгоритма . Адаптивный DPCM (ADPCM) был представлен П. Каммиски, Никилом С. Джаянтом и Джеймсом Л. Фланаганом в Bell Labs в 1973 г. [4] [5]

Перцепционное кодирование было впервые использовано для сжатия кодирования речи с кодированием с линейным предсказанием (LPC). [6] Первоначальные концепции LPC восходят к работе Фумитада Итакура ( Университет Нагоя ) и Сюдзо Сайто ( Nippon Telegraph and Telephone ) в 1966 году. [7] В 1970-х годах Бишну С. Атал и Манфред Р. Шредер из Bell Labs разработал форму LPC, называемую адаптивным предсказательным кодированием (APC), алгоритм перцептивного кодирования, который использовал маскирующие свойства человеческого уха, за которым в начале 1980-х годов последовало линейное предсказание с кодовым возбуждением.(CELP) алгоритм. [6]

Кодирование с дискретным косинусным преобразованием (DCT), метод сжатия с потерями, впервые предложенный Насиром Ахмедом в 1972 году [8] [9], послужил основой для модифицированного дискретного косинусного преобразования (MDCT), разработанного JP Princen, AW Johnson и AB. Брэдли в 1987 году. [10] MDCT является основой для большинства стандартов кодирования звука , таких как Dolby Digital (AC-3), [11] MP3 ( MPEG Layer III), [12] [6] Advanced Audio Coding (AAC) , Windows Media Audio (WMA) и Vorbis ( Ogg). [11]

Запись [ править ]

PCM использовался в телекоммуникационных приложениях задолго до его первого использования в коммерческом вещании и записи. Коммерческая цифровая запись была впервые в Японии NHK и Nippon Columbia и их Denon бренд, в 1960 - е годы. Первые коммерческие цифровые записи были выпущены в 1971 году [13].

BBC также начал экспериментировать с цифровым звуком в 1960 - х годах. К началу 1970-х годов он разработал 2-канальный рекордер, а в 1972 году развернул систему цифровой передачи звука, которая связала их центр вещания с их удаленными передатчиками. [13]

Первая запись 16-битного PCM в Соединенных Штатах была сделана Томасом Стокхэмом в Опере Санта-Фе в 1976 году на магнитофоне Soundstream . Усовершенствованная версия системы Soundstream была использована Telarc для создания нескольких классических записей в 1978 году. Разрабатываемый в то время цифровой многодорожечный рекордер 3M был основан на технологии BBC. Первым полностью цифровым альбомом, записанным на этой машине, был Ry Cooder 's Bop till You Drop в 1979 году. Британский лейбл Deccaначал разработку собственных двухдорожечных цифровых аудиомагнитофонов в 1978 году и выпустил первую европейскую цифровую запись в 1979 году [13].

Популярные профессиональные цифровые многодорожечные рекордеры, выпущенные Sony / Studer ( DASH ) и Mitsubishi ( ProDigi ) в начале 1980-х годов, помогли добиться признания цифровой записи крупными звукозаписывающими компаниями. Появление в 1982 году компакт-дисков популяризировало цифровой звук среди потребителей. [13]

Телефония [ править ]

Быстрое развитие и широкое распространение цифровой телефонии с ИКМ стало возможным благодаря технологии схем с переключаемыми конденсаторами (SC) металл-оксид-полупроводник (MOS) , разработанной в начале 1970-х годов. [14] Это привело к разработке микросхем кодека-фильтра ИКМ в конце 1970-х годов. [14] [15] кремниевый затвор КМОП (комплементарный МОП) PCM кодек-фильтр чип, разработанный David A. Hodges и WC Black в 1980 году, [14] с тех пор был промышленным стандартом для цифровой телефонии. [14] [15] К 1990-м годам телекоммуникационные сети, такие как Коммутируемая телефонная сеть общего пользования (PSTN) была в значительной степени оцифрована с помощью VLSI (очень крупномасштабная интеграция ) CMOS PCM кодек-фильтров, широко используемых в электронных коммутационных системах для телефонных станций , модемах на стороне пользователя и в ряде приложений цифровой передачи, таких как цифровая сеть с интегрированными услугами (ISDN), беспроводные и сотовые телефоны . [15]

Технологии [ править ]

Цифровой аудиомагнитофон Sony PCM-7030

Цифровое аудио используется при трансляции аудио. Стандартные технологии включают цифровое аудиовещание (DAB), мировое цифровое радио (DRM), HD-радио и внутриполосное прямое вещание (IBOC).

Цифровой звук в записывающих приложениях хранится на специальных аудиотехнологиях, включая CD, цифровую аудиокассету (DAT), цифровую компактную кассету (DCC) и мини- диск . Цифровой звук может храниться в стандартных форматах аудиофайлов и храниться на записывающем устройстве с жестким диском , Blu-ray или DVD-Audio . Файлы можно воспроизводить на смартфонах, компьютерах или MP3-плеере .

Интерфейсы [ править ]

Интерфейсы для цифрового аудио включают:

  • A2DP через Bluetooth
  • AC'97 (Audio Codec 1997) интерфейс между интегральными схемами на материнских платах ПК
  • Интерфейс ADAT Lightpipe
  • Интерфейс AES3 с разъемами XLR , распространенный в профессиональном аудиооборудовании
  • AES47 - профессиональный цифровой звук в стиле AES3 по сетям с асинхронным режимом передачи
  • Intel High Definition Audio - современная замена AC'97
  • Интерфейс I²S (Inter-IC sound) между интегральными схемами в бытовой электронике
  • MADI (многоканальный цифровой аудиоинтерфейс)
  • MIDI - межсоединение с низкой пропускной способностью для передачи данных инструмента; не может передавать звук, но может передавать данные цифровых семплов не в реальном времени
  • S / PDIF - через коаксиальный кабель или TOSLINK , распространенный в бытовом аудиооборудовании и полученный из AES3
  • Фирменный формат TDIF , TASCAM с кабелем D-sub

Несколько интерфейсов предназначены для передачи цифрового видео и звука вместе, включая HDMI и DisplayPort .

Для персональных компьютеров , USB и IEEE 1394 есть положения, обеспечивающие в режиме реального времени цифровое аудио. В профессиональных архитектурных или инсталляционных приложениях существует множество протоколов и интерфейсов аудио через Ethernet . В вещании отдается предпочтение более общей сетевой технологии аудио по IP . В телефонии передача голоса по IP используется в качестве сетевого интерфейса для цифрового звука для голосовой связи.

См. Также [ править ]

  • Цифровой аудио редактор
  • Цифровой синтезатор
  • Синтез частотной модуляции
  • Звуковой чип

Примечания [ править ]

  1. ^ Некоторые аудиосигналы, например, созданные с помощью цифрового синтеза, происходят полностью в цифровой области, и в этом случае аналого-цифровое преобразование не происходит.

Ссылки [ править ]

  1. ^ Janssens, Jelle; Стейн Вандаэле; Том Вандер Бекен (2009). «Музыкальная индустрия на линии? Пережить музыкальное пиратство в эпоху цифровых технологий». Европейский журнал преступности, уголовного права и уголовного правосудия . 77 (96): 77–96. DOI : 10.1163 / 157181709X429105 . hdl : 1854 / LU-608677 .
  2. ^ Genius Unrecognized , BBC, 27 марта 2011 г. , получено 30 марта 2011 г.
  3. ^ Патент США 2605361 , C. Чэпин Катлер, «Дифференциальная Квантование сигналов связи», выданный 1952-07-29 
  4. ^ П. Каммиски, Никил С. Джаянт и Дж. Л. Фланаган, "Адаптивное квантование в дифференциальном кодировании речи с ИКМ", Bell Syst. Tech. J. , т. 52, стр. 1105–1118, сентябрь 1973 г.
  5. ^ Cummiskey, P .; Джаянт, Никил С .; Фланаган, JL (1973). «Адаптивное квантование при дифференциальном кодировании речи с ИКМ». Технический журнал Bell System . 52 (7): 1105–1118. DOI : 10.1002 / j.1538-7305.1973.tb02007.x . ISSN 0005-8580 . 
  6. ^ a b c Шредер, Манфред Р. (2014). "Bell Laboratories" . Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Springer. п. 388. ISBN 9783319056609.
  7. ^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: часть II линейного прогнозирующего кодирования и Интернет-протокола» (PDF) . Найденный. Тенденции сигнального процесса . 3 (4): 203–303. DOI : 10.1561 / 2000000036 . ISSN 1932-8346 .  
  8. Ахмед, Насир (январь 1991 г.). «Как я пришел к дискретному косинусному преобразованию» . Цифровая обработка сигналов . 1 (1): 4–5. DOI : 10.1016 / 1051-2004 (91) 90086-Z .
  9. ^ Насир Ахмед; Т. Натараджан; Камисетти Рамамохан Рао (январь 1974 г.). «Дискретное косинусное преобразование» (PDF) . Транзакции IEEE на компьютерах . С-23 (1): 90–93. DOI : 10.1109 / TC.1974.223784 .
  10. ^ JP Princen, AW Johnson и AB Bradley: Кодирование поддиапазонов / преобразований с использованием схем банка фильтров, основанных на отмене наложения спектров во временной области , IEEE Proc. Intl. Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987.
  11. ^ а б Ло, Фа-Лонг (2008). Стандарты мобильного мультимедийного вещания: технологии и практика . Springer Science & Business Media . п. 590. ISBN 9780387782638.
  12. ^ Гукерт, Джон (весна 2012 г.). «Использование БПФ и МДКП в сжатии аудио MP3» (PDF) . Университет Юты . Дата обращения 14 июля 2019 .
  13. ^ a b c d Прекрасно, Томас (2008). Барри Р. Эшпол (ред.). «Рассвет коммерческой цифровой записи» (PDF) . Журнал ARSC . Проверено 2 мая 2010 .
  14. ^ а б в г Оллстот, Дэвид Дж. (2016). «Коммутируемые конденсаторные фильтры» (PDF) . В Малоберти, Франко; Дэвис, Энтони С. (ред.). Краткая история схем и систем: от экологичных, мобильных, повсеместных сетей до больших вычислений . IEEE Circuits and Systems Society . С. 105–110. ISBN  9788793609860.
  15. ^ a b c Флойд, Майкл Д .; Хиллман, Гарт Д. (8 октября 2018 г.) [1-й паб. 2000]. «Кодек-фильтры с импульсной модуляцией» . Справочник по коммуникациям (2-е изд.). CRC Press . С. 26–1, 26–2, 26–3.

Дальнейшее чтение [ править ]

  • Борвик, Джон, изд., 1994: Практика звукозаписи (Оксфорд: Oxford University Press)
  • Бози, Марина, и Голдберг, Ричард Э., 2003: Введение в цифровое кодирование звука и стандарты (Springer)
  • Ифичор, Эммануэль К., и Джервис, Барри В., 2002: Цифровая обработка сигналов: практический подход (Харлоу, Англия: Pearson Education Limited)
  • Рабинер, Лоуренс Р. и Голд, Бернард, 1975: Теория и применение цифровой обработки сигналов (Энглвуд Клиффс, Нью-Джерси: Prentice-Hall, Inc.)
  • Уоткинсон, Джон, 1994: Искусство цифрового аудио (Оксфорд: Focal Press)

Внешние ссылки [ править ]

  • Монти Монтгомери (24.10.2012). «Мнение гостей: почему 24/192 загрузки музыки бессмысленны» . evolver.fm . Проверено 7 декабря 2012 .
  • Дж. Роберт Стюарт. «Кодирование цифрового аудио высокого качества» (PDF) . Архивировано из оригинального (PDF) 27 июня 2007 года . Проверено 7 декабря 2012 .
  • Дэн Лэври. "Теория семплирования для цифрового звука" (PDF) . Проверено 7 декабря 2012 .
Послушайте эту статью ( 9 минут )
Разговорный значок Википедии
Этот аудиофайл был создан на основе редакции этой статьи от 12 марта 2016 г. и не отражает последующих правок. ( 2016-03-12 )