Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

MP3 (формально MPEG-1 Audio Layer III или MPEG-2 Audio Layer III ) [4] представляет собой Формат кодирования для цифрового аудио разработаны в основном в Fraunhofer Society в Германии, при поддержке других цифровых ученых в США и других странах. Первоначально определенный как третий аудиоформат стандарта MPEG-1 , он был сохранен и дополнительно расширен - определяя дополнительные скорости передачи данных и поддержку большего количества аудиоканалов - как третий аудиоформат последующего MPEG-2.стандарт. Третья версия, известная как MPEG 2.5, расширенная для лучшей поддержки более низких битрейтов, обычно реализуется, но не является признанным стандартом.

MP3 (или mp3 ) в качестве формата файлов обычно обозначает файлы, содержащие элементарный поток данных в кодировке MPEG-1 Audio или MPEG-2 Audio, без других сложностей стандарта MP3.

Что касается сжатия звука (аспект стандарта, наиболее очевидный для конечных пользователей и для которого он наиболее известен), MP3 использует сжатие данных с потерями для кодирования данных с использованием неточных приближений и частичного отбрасывания данных. Это позволяет значительно уменьшить размер файлов по сравнению с несжатым аудио. Комбинация небольшого размера и приемлемой точности воспроизведения привела к буму распространения музыки через Интернет в середине-конце 1990-х годов, когда MP3 выступал в качестве поддерживающей технологии в то время, когда пропускная способность и объем хранилища все еще были в дефиците. Формат MP3 вскоре стал ассоциироваться со спорами вокруг нарушения авторских прав , музыкального пиратства и копирования / обмена файлами.сервисы MP3.com и Napster , среди прочего. С появлением портативных медиаплееров , эта категория продуктов также включает смартфоны , поддержка MP3 остается почти универсальной.

Сжатие MP3 работает за счет снижения (или приближения) точности определенных компонентов звука, которые, как считается (с помощью психоакустического анализа) выходят за пределы возможностей слуха большинства людей. Этот метод обычно называют перцептивным кодированием или психоакустическим моделированием. [9] Оставшаяся аудиоинформация затем записывается с эффективным использованием пространства с использованием алгоритмов MDCT и FFT . По сравнению с цифровым звуком CD-качества , сжатие MP3 обычно позволяет уменьшить размер на 75-95%. Например, MP3, закодированный с постоянным битрейтом 128 кбит / с, приведет к получению файла размером примерно 9% от размера исходного аудио компакт-диска. [10] В начале 2000-х годов проигрыватели компакт-дисков все чаще стали поддерживать воспроизведение файлов MP3 на компакт-дисках с данными.

Группа экспертов по движущимся изображениям (MPEG) разработала MP3 как часть своих стандартов MPEG-1 , а затем и MPEG-2 . MPEG-1 Audio (MPEG-1 Part 3), который включал MPEG-1 Audio Layer I, II и III, был одобрен как проект комитета по стандарту ISO / IEC в 1991 году [11] [12], завершенный в 1992 году, [13] и опубликован в 1993 г. как ISO / IEC 11172-3: 1993. [6] Расширение MPEG-2 Audio (MPEG-2 Part 3) с более низкой частотой дискретизации и битовой скоростью было опубликовано в 1995 году как ISO / IEC 13818-3: 1995. [7] [14] Это требует лишь минимальных модификаций существующих декодеров MPEG-1 (распознавание бита MPEG-2 в заголовке и добавление новых более низких значений скорости дискретизации и битовой скорости).

История [ править ]

Фон [ править ]

Алгоритм сжатия аудиоданных MP3 с потерями использует ограничение восприятия человеческого слуха, называемое слуховой маскировкой . В 1894 году американский физик Альфред М. Майер сообщил, что один тон можно сделать неслышимым с помощью другого тона более низкой частоты. [15] В 1959 году Ричард Эмер описал полный набор слуховых кривых, касающихся этого явления. [16] В период с 1967 по 1974 год Эберхард Цвикер работал в области настройки и маскирования критических частотных диапазонов, [17] [18], которые, в свою очередь, основывались на фундаментальных исследованиях Харви Флетчера и его сотрудников в Bell. Лаборатории. [19]

Перцептивное кодирование было впервые использовано для сжатия речевого кодирования с кодированием с линейным предсказанием (LPC) [20], которое берет свое начало в работах Фумитада Итакура ( Университет Нагоя ) и Сюдзо Сайто ( Nippon Telegraph and Telephone ) в 1966 году. [21] В 1978 году. , Бишну С. Атал и Манфред Р. Шредер из Bell Labs предложили речевой кодек LPC , называемый адаптивным предсказательным кодированием , в котором используется алгоритм психоакустического кодирования, использующий маскирующие свойства человеческого уха. [20] [22]Дальнейшая оптимизация Шредером и Аталом с Дж. Л. Холлом была позже описана в статье 1979 года. [23] В том же году М.А. Краснер [24] предложил психоакустический маскирующий кодек, который опубликовал и произвел аппаратное обеспечение для речи (не используемое для сжатия музыкальных файлов), но публикация его результатов в относительно малоизвестной лаборатории Линкольна. Технический отчет [25] не сразу повлиял на мейнстрим разработки психоакустических кодеков.

Дискретного косинусного преобразования (ДКП), тип кодирования с преобразованием для сжатия с потерями , предложенный Насиром Ахмеда в 1972 году, был разработан Ahmed с Т. Natarajan и КР Рао в 1973 году; они опубликовали свои результаты в 1974 году. [26] [27] [28] Это привело к развитию модифицированного дискретного косинусного преобразования (MDCT), предложенного JP Princen, AW Johnson и AB Bradley в 1987 году [29] после более ранней работы Принсном и Брэдли в 1986 году. [30] MDCT позже стал основной частью алгоритма MP3. [31]

Эрнст Терхардт и др. построил алгоритм, описывающий слуховую маскировку с высокой точностью в 1982 году. [32] Эта работа была добавлена ​​к множеству отчетов авторов, восходящих к Флетчеру, а также к работе, которая первоначально определяла критические отношения и критическую полосу пропускания.

В 1985 году Атал и Шредер представили линейное предсказание с кодовым возбуждением (CELP), основанный на LPC алгоритм перцептивного речевого кодирования со слуховой маскировкой, который позволил достичь значительной степени сжатия данных для своего времени. [20] Рецензируемый журнал IEEE по избранным областям коммуникаций сообщил о большом количестве (в основном перцепционных) алгоритмов сжатия звука в 1988 году. [33] В выпуске «Голосовое кодирование для коммуникаций», опубликованном в феврале 1988 года, сообщалось о широком спектре алгоритмов сжатия звука. устоявшиеся, работающие технологии сжатия битов звука [33], некоторые из них используют слуховое маскирование как часть своей фундаментальной конструкции, а некоторые демонстрируют аппаратные реализации в реальном времени.

Развитие [ править ]

Генезис технологии MP3 полностью описан в статье профессора Ханса Мусманна [34], который несколько лет возглавлял группу ISO MPEG Audio. В декабре 1988 года MPEG потребовал ввести стандарт кодирования звука. В июне 1989 года было представлено 14 алгоритмов кодирования звука. Из-за определенного сходства между этими предложениями по кодированию они были сгруппированы в четыре группы разработчиков. Первой группой была ASPEC, принадлежащая Fraunhofer Gesellschaft , AT&T , France Telecom , Deutsche и Thomson-Brandt . Вторая группа - это MUSICAM от Matsushita , CCETT , ITT и Philips . Третья группа - ATAC от Fujitsu., JVC , NEC и Sony . И четвертой группой была SB-ADPCM от NTT и BTRL. [34]

Непосредственными предшественниками MP3 были «Оптимальное кодирование в частотной области» (OCF), [35] и Perceptual Transform Coding (PXFM). [36] Эти два кодека вместе с вкладом Thomson-Brandt в переключение блоков были объединены в кодек под названием ASPEC, который был представлен в MPEG и выиграл конкурс качества, но был ошибочно отклонен как слишком сложный для реализации. Первой практической реализацией кодера восприятия звука (OCF) на аппаратном уровне (оборудование Краснера было слишком громоздким и медленным для практического использования) была реализация кодера психоакустического преобразования на базе микросхем Motorola 56000 DSP .

Другой предшественник формата и технологии MP3 - это перцепционный кодек MUSICAM, основанный на наборе фильтров целочисленной арифметики из 32 поддиапазонов, управляемый психоакустической моделью. Он был в первую очередь разработан для цифрового аудиовещания (цифрового радио) и цифрового телевидения, и его основные принципы были раскрыты научному сообществу CCETT (Франция) и IRT (Германия) в Атланте во время конференции IEEE-ICASSP в 1991 г. [37] после работы над MUSICAM с Matsushita и Philips с 1989 года. [34]

Этот кодек, встроенный в систему вещания с использованием модуляции COFDM, был продемонстрирован в эфире и в полевых условиях [38] с Radio Canada и CRC Canada во время шоу NAB (Лас-Вегас) в 1991 году. Реализация звуковой части этой системы вещания была основана на на кодере с двумя микросхемами (один для преобразования поддиапазонов, один для психоакустической модели, разработанной группой Г. Штолля (IRT, Германия), позже известный как психоакустическая модель I) и декодере реального времени, использующем один работающий чип Motorola 56001 DSP программное обеспечение для целочисленной арифметики, разработанное командой YF Dehery ( CCETT, Франция). Простота соответствующего декодера вместе с высоким качеством звука этого кодека, впервые использующего частоту дискретизации 48 кГц, входной формат 20 бит / отсчет (наивысший доступный стандарт дискретизации в 1991 г., совместимый с профессиональным цифровым стандартом AES / EBU). входной студийный стандарт) были основными причинами, по которым позже были приняты характеристики MUSICAM в качестве основных функций для усовершенствованного кодека сжатия цифровой музыки.

При разработке программного обеспечения для кодирования MUSICAM команда Столла и Дехери тщательно использовала набор высококачественных материалов для оценки звука [39], отобранных группой профессионалов в области звука из Европейского вещательного союза и позже использованных в качестве справочного материала для оценки. кодеков сжатия музыки. Метод кодирования поддиапазонов оказался эффективным не только для перцептивного кодирования высококачественных звуковых материалов, но особенно для кодирования критически важных ударных звуковых материалов (барабаны, треугольник и т. Д.) Из-за особого эффекта временной маскировки. набора фильтров поддиапазона MUSICAM (это преимущество является специфической особенностью методов кодирования с коротким преобразованием).

Будучи докторантом немецкого университета Эрланген-Нюрнберг , Карлхайнц Бранденбург начал работать над сжатием цифровой музыки в начале 1980-х годов, уделяя особое внимание тому, как люди воспринимают музыку. Он завершил свою докторскую работу в 1989 году. [40] MP3 является прямым потомком OCF и PXFM и представляет собой результат сотрудничества Бранденбурга - работы постдокторантом в лабораториях AT & T-Bell Labs с Джеймсом Д. Джонстоном («JJ») из AT & T-Bell Labs - с Институтом интегральных схем Фраунгофера , Эрланген (где он работал с Бернхардом Грилем и четырьмя другими исследователями - «Оригинальная шестерка» [41])), с относительно небольшими вкладами из ветви MP2 психоакустических кодеров поддиапазона. В 1990 году Бранденбург стал доцентом в Эрлангене-Нюрнберге. В то время как он продолжал работать на сжатие музыки с учеными в Fraunhofer Society «s Генрих Герц института (в 1993 году он вошел в состав Fraunhofer HHI). [40] Песня " Tom's Diner " Сюзанны Вега была первой песней, которую Карлхайнц Бранденбург использовал для разработки MP3. Бранденбург использовал песню для тестирования, слушая ее снова и снова, каждый раз уточняя схему, чтобы убедиться, что она не повлияет отрицательно на тонкость голоса Веги. [42]

Стандартизация [ править ]

В 1991 годе были доступны два предложения , которые были оценены для аудио стандарта MPEG: MUSICAM ( М просят шаблон адаптировать U niversal S ubband Я ntegrated С Одингом й М ultiplexing) и АСПЭК ( daptive S pectral Р erceptual Х ntropy С Одингом). Технология MUSICAM, предложенная Philips (Нидерланды), CCETT (Франция), Институтом технологий вещания (Германия) и Matsushita (Япония), [43]был выбран из-за его простоты и устойчивости к ошибкам, а также из-за высокого уровня вычислительной эффективности. [44] Формат MUSICAM, основанный на кодировании поддиапазонов , стал основой для формата сжатия MPEG Audio, включая, например, его структуру кадра, формат заголовка, частоту дискретизации и т. Д.

Хотя большая часть технологии и идей MUSICAM была включена в определение MPEG Audio Layer I и Layer II, только банк фильтров и структура данных, основанная на кадрировании 1152 сэмплов (формат файла и байтовый поток) MUSICAM, остались на уровне III ( MP3) как часть вычислительно неэффективного гибридного банка фильтров . Под председательством профессора Мусманна из Университета Лейбница в Ганновере редактирование стандарта было поручено Леону ван де Керкхофу (Нидерланды), Герхарду Штоллю (Германия) и Ив-Франсуа Дехери (Франция), которые работали над Layer I и Layer. II. ASPEC был совместным предложением AT&T Bell Laboratories, Thomson Consumer Electronics, Общества Фраунгофера и CNET . [45] Это обеспечило высочайшую эффективность кодирования.

Рабочая группа , состоящая из фургона де Kerkhof, Stoll, Леонардо Чиариглен ( CSELT В.П. медиа), Ив-Франсуа Dehery, Карлхайнц Бранденбург (Германия) и Джеймс Д. Джонстон (Соединенные Штаты Америки) приняли идеи из АСПЭК, интегрированный фильтр банка от уровня II, добавил некоторые из своих собственных идей, такие как совместное стереокодирование MUSICAM, и создал формат MP3, который был разработан для достижения того же качества при 128  кбит / с, что и MP2 при 192 кбит / с.

Алгоритмы для MPEG-1 Audio Layer I, II и III были утверждены в 1991 году [11] [12] и завершены в 1992 году [13] как часть MPEG-1 , первого стандартного пакета MPEG , результатом которого стал международный стандарт ISO / IEC 11172-3 (также известный как MPEG-1 Audio или MPEG-1 Part 3 ), опубликованный в 1993 году. [6] Файлы или потоки данных, соответствующие этому стандарту, должны обрабатывать частоты дискретизации 48k, 44100 и 32k и по-прежнему поддерживаться текущими MP3-плеерами и декодерами. Таким образом, первое поколение MP3 определило 14 × 3 = 42 интерпретации структур данных кадров MP3 и макетов размеров.

Дальнейшая работа над звуком MPEG [46] была завершена в 1994 году как часть второго набора стандартов MPEG, MPEG-2 , более официально известного как международный стандарт ISO / IEC 13818-3 (также известный как MPEG-2 Part 3 или обратно совместимый MPEG- 2 Audio или MPEG-2 Audio BC [14] ), первоначально опубликованный в 1995 г. [7] [47]MPEG-2 Part 3 (ISO / IEC 13818-3) определил 42 дополнительных битрейта и частоты дискретизации для MPEG-1 Audio Layer I, II и III. Новые частоты дискретизации ровно вдвое меньше тех, что были изначально определены в MPEG-1 Audio. Это снижение частоты дискретизации позволяет вдвое сократить доступную точность воспроизведения частоты, а также снизить битрейт на 50%. MPEG-2 Part 3 также улучшил звук MPEG-1, позволив кодировать аудиопрограммы с более чем двумя каналами, вплоть до многоканальности 5.1. [46] MP3, закодированный с помощью MPEG-2, дает половину полосы пропускания воспроизведения MPEG-1, подходящего для фортепиано и пения.

Третье поколение потоков данных (файлов) в стиле «MP3» расширило идеи и реализацию MPEG-2, но было названо MPEG-2.5.audio, поскольку MPEG-3 уже имел другое значение. Это расширение было разработано Fraunhofer IIS, зарегистрированных владельцев патентов на MP3, путем уменьшения поля кадровой синхронизации в заголовке MP3 с 12 до 11 бит. Как и при переходе от MPEG-1 к MPEG-2, MPEG-2.5 добавляет дополнительные частоты дискретизации ровно половину от тех, которые доступны при использовании MPEG-2. Таким образом, он расширяет сферу применения MP3, включая человеческую речь и другие приложения, но требует только 25% полосы пропускания (частотного воспроизведения), возможной с использованием частот дискретизации MPEG-1. Хотя MPEG-2.5 не является признанным стандартом ISO, он широко поддерживается как недорогими китайскими, так и фирменными цифровыми аудиоплеерами, а также кодировщиками MP3 ( LAME ), декодерами (FFmpeg) и проигрывателями (MPC) на основе компьютерного программного обеспечения, добавляя 3 × 8 = 24дополнительные типы кадров MP3. Таким образом, каждое поколение MP3 поддерживает 3 частоты дискретизации, ровно вдвое меньшие, чем у предыдущего поколения, всего 9 разновидностей файлов формата MP3. Таблица сравнения частот дискретизации между MPEG-1, 2 и 2.5 приведена далее в статье. [48] [49] MPEG-2.5 поддерживается LAME (с 2000 г.), Media Player Classic (MPC), iTunes и FFmpeg.

MPEG-2.5 не был разработан MPEG (см. Выше) и никогда не был утвержден в качестве международного стандарта. Таким образом, MPEG-2.5 является неофициальным или проприетарным расширением формата MP3. Тем не менее, он широко распространен и особенно полезен для приложений, использующих человеческую речь с низкой скоростью передачи данных.

  • Стандарт ISO / IEC 11172-3 (он же MPEG-1 Audio) определяет три формата: MPEG-1 Audio Layer I, Layer II и Layer III. Стандарт ISO / IEC 13818-3 (также известный как MPEG-2 Audio) определил расширенную версию MPEG-1 Audio: MPEG-2 Audio Layer I, Layer II и Layer III. MPEG-2 Audio (MPEG-2 Part 3) не следует путать с MPEG-2 AAC (MPEG-2 Part 7 - ISO / IEC 13818-7). [14]

Эффективность сжатия кодеров обычно определяется битовой скоростью, поскольку степень сжатия зависит от битовой глубины и частоты дискретизации входного сигнала. Тем не менее, степени сжатия часто публикуются. Они могут использовать параметры компакт-диска (CD) в качестве эталонов (44,1 кГц , 2 канала по 16 бит на канал или 2 × 16 бит) или иногда параметры SP цифровой аудиоленты (DAT) (48 кГц, 2 × 16 бит). . Коэффициенты сжатия для этого последнего эталона выше, что демонстрирует проблему с использованием термина степень сжатия для кодеров с потерями.

Карлхайнц Бранденбург использовал компакт-диск с записью песни Сюзанны Вега " Tom's Diner " для оценки и уточнения алгоритма сжатия MP3 . Эта песня была выбрана из-за ее почти монофонической природы и широкого спектрального содержания, что позволяет легче услышать недостатки в формате сжатия во время воспроизведения. Некоторые называют Сюзанну Вегу «матерью MP3». [51]Эта конкретная дорожка имеет интересное свойство в том, что два канала почти, но не полностью, одинаковы, что приводит к случаю, когда понижение уровня бинауральной маскировки вызывает пространственное демаскирование шумовых артефактов, если кодер должным образом не распознает ситуацию и не применит коррекции, аналогичные тем, которые подробно описана в психоакустической модели MPEG-2 AAC. Еще несколько важных аудиозаписей ( глокеншпиль , треугольник , аккордеон и т. Д.) Были взяты из EBU.Эталонный компакт-диск V3 / SQAM, который использовался профессиональными звукорежиссерами для оценки субъективного качества аудиоформатов MPEG. LAME - самый продвинутый кодировщик MP3. LAME включает в себя кодирование с переменной скоростью передачи VBR, которое использует параметр качества, а не целевое значение скорости передачи. Более поздние версии 2008+) поддерживают цель качества n.nnn, которая автоматически выбирает частоту дискретизации MPEG-2 или MPEG-2.5, подходящую для записей человеческой речи, для которых требуется только разрешение полосы пропускания 5512 Гц.

Публикация [ править ]

Реализация эталонного программного обеспечения для моделирования, написанная на языке C и позже известная как ISO 11172-5 , была разработана (в 1991–1996 гг.) Членами комитета ISO MPEG Audio с целью создания битовых совместимых файлов MPEG Audio (Layer 1, Слой 2, Слой 3). Он был одобрен в качестве проекта технического отчета комитета ISO / IEC в марте 1994 г. и напечатан как документ CD 11172-5 в апреле 1994 г. [52] Он был утвержден в качестве проекта технического отчета (DTR / DIS) в ноябре 1994 г. [53] ] завершена в 1996 году и опубликован в качестве международного стандарта ISO / IEC TR 11172-5: 1998 в 1998 году [54] ссылки программного обеспечения на C языке была позже опубликована в свободном доступе стандарта ISO. [55]Работая не в реальном времени в ряде операционных систем, он смог продемонстрировать первое аппаратное декодирование в реальном времени (на основе DSP ) сжатого звука. Некоторые другие реализации кодеров и декодеров MPEG Audio в реальном времени [56] были доступны для цифрового вещания (радио DAB , телевидение DVB ) на потребительские приемники и телевизионные приставки.

7 июля 1994 года Общество Фраунгофера выпустило первый программный кодировщик MP3 под названием l3enc . [57] Расширение имени файла .mp3 было выбрано группой Фраунгофера 14 июля 1995 г. (ранее файлы назывались .bit ). [1] С первым программным обеспечением MP3-плеера реального времени WinPlay3 (выпущенным 9 сентября 1995 г.) многие люди смогли кодировать и воспроизводить файлы MP3 на своих ПК. Из-за относительно небольших жестких дисков того времени (≈500–1000 МБ ) сжатие с потерями было необходимо для хранения музыки из нескольких альбомов на домашнем компьютере в виде полных записей (в отличие от MIDI- файлов ).нотные записи или файлы трекера, которые объединяли нотацию с короткими записями инструментов, играющих отдельные ноты). Как отмечает исследователь звука Джонатан Стерн: «Австралийский хакер приобрел l3enc, используя украденную кредитную карту. Затем хакер перепроектировал программное обеспечение, написал новый пользовательский интерфейс и бесплатно распространил его, назвав его« спасибо Fraunhofer »». [58]

Пример реализации Фраунгофера [ править ]

Хакер по имени SoloH обнаружил исходный код эталонной реализации MPEG dist10 вскоре после ее выпуска на серверах Университета Эрлангена . Он разработал более качественную версию и распространил ее в Интернете. Этот код положил начало массовому копированию компакт-дисков и распространению цифровой музыки в формате MP3 через Интернет. [59] [60] [61] [62]

Интернет-распространение [ править ]

Во второй половине 1990-х файлы MP3 начали распространяться в Интернете , часто через подпольные сети пиратских песен. Первый известный эксперимент по распространению через Интернет был организован в начале 1990-х годов подпольным музыкальным архивом Интернета, более известным под аббревиатурой IUMA. После некоторых экспериментов [63] с использованием несжатых аудиофайлов этот архив начал доставлять в собственный всемирный низкоскоростной Интернет некоторые сжатые аудиофайлы MPEG, использующие формат MP2 (Layer II), а затем использованные файлы MP3, когда стандарт был полностью завершен. Популярность MP3 начала быстро расти с появлением аудиоплеера Nullsoft Winamp , выпущенного в 1997 году. В 1998 году был выпущен первый портативный твердотельный цифровой аудиоплеер MPMan., разработанная SaeHan Information Systems со штаб-квартирой в Сеуле , Южная Корея , была выпущена, а затем в 1998 году был продан Rio PMP300 , несмотря на попытки судебного пресечения со стороны RIAA . [64]

В ноябре 1997 года сайт mp3.com предлагал бесплатно тысячи MP3, созданных независимыми артистами. [64] Небольшой размер файлов MP3 позволил широко распространить одноранговый обмен файлами музыки, скопированной с компакт-дисков, что ранее было почти невозможно. Первая крупная одноранговая сеть обмена файлами, Napster , была запущена в 1999 году. Простота создания и обмена файлами MP3 привела к повсеместному нарушению авторских прав . Крупные звукозаписывающие компании утверждали, что такое бесплатное распространение музыки снижает продажи, и называли это « музыкальным пиратством ». В ответ они возбудили иски против Napster.(который в конечном итоге был закрыт, а затем продан) и против отдельных пользователей, которые участвовали в обмене файлами. [65]

Несанкционированный обмен файлами MP3 продолжается в одноранговых сетях нового поколения . Некоторые авторизованные сервисы, такие как Beatport , Bleep , Juno Records , eMusic , Zune Marketplace , Walmart.com , Rhapsody , реинкарнация Napster , одобренная звукозаписывающей индустрией , и Amazon.com продают музыку в формате MP3 без ограничений.

Дизайн [ править ]

Файловая структура [ править ]

Схема структуры файла MP3 (MPEG версии 2.5 не поддерживается, поэтому для MP3 Sync Word 12 бит вместо 11).

Файл MP3 состоит из кадров MP3, которые состоят из заголовка и блока данных. Эта последовательность кадров называется элементарным потоком . Из-за «битового резервуара» кадры не являются независимыми элементами и обычно не могут быть извлечены на произвольных границах кадра. Блоки данных MP3 содержат (сжатую) звуковую информацию с точки зрения частот и амплитуд. На схеме показано, что заголовок MP3 состоит из слова синхронизации , которое используется для идентификации начала допустимого кадра. За ним следует бит, указывающий, что это стандарт MPEG, и два бита, указывающие, что используется уровень 3; отсюда MPEG-1 Audio Layer 3 или MP3. После этого значения будут отличаться в зависимости от файла MP3. ИСО / МЭК 11172-3определяет диапазон значений для каждого раздела заголовка вместе со спецификацией заголовка. Большинство файлов MP3 сегодня содержат метаданные ID3 , которые предшествуют или следуют за кадрами MP3, как показано на диаграмме. Поток данных может содержать необязательную контрольную сумму.

Совместное стерео выполняется только покадрово. [66]

Кодирование и декодирование [ править ]

Алгоритм кодирования MP3 обычно делится на четыре части. Часть 1 делит аудиосигнал на более мелкие части, называемые кадрами, и затем на выходе выполняется фильтр модифицированного дискретного косинусного преобразования (MDCT). Часть 2 передает образец в 1024-точечное быстрое преобразование Фурье (БПФ), затем применяется психоакустическая модель и на выходе выполняется другой фильтр MDCT. Часть 3 количественно определяет и кодирует каждую выборку, известную как выделение шума, которое подстраивается под себя, чтобы соответствовать требованиям к скорости передачи данных и маскированию звука . Часть 4 форматирует поток битов , называемый аудиокадром, который состоит из 4 частей: заголовок , проверка ошибок., аудиоданные и вспомогательные данные . [31]

Стандарт MPEG-1 не включает точных спецификаций для кодировщика MP3, но предоставляет примеры психоакустических моделей, петли скорости и т.п. в ненормативной части исходного стандарта. [67]MPEG-2 удваивает количество поддерживаемых частот дискретизации, а MPEG-2.5 добавляет еще 3. Когда это было написано, предлагаемые реализации были довольно устаревшими. Разработчики стандарта должны были разработать свои собственные алгоритмы, подходящие для удаления части информации из аудиовхода. В результате стало доступно множество различных кодировщиков MP3, каждый из которых производит файлы разного качества. Сравнения были широко доступны, поэтому потенциальному пользователю кодировщика было легко найти лучший выбор. Некоторые кодеры, которые умеют кодировать с более высокой скоростью передачи данных (например, LAME) не обязательно были такими хорошими при более низких скоростях передачи данных. Со временем LAME развился на сайте SourceForge, пока не стал де-факто кодировщиком CBR MP3. Позже был добавлен режим ABR. Продолжалась работа над истинной переменной скоростью передачи данных с использованием цели качества от 0 до 10. В конечном итоге числа (такие как -V 9.600) могли генерировать превосходное качество кодирования голоса с низкой скоростью передачи данных всего лишь 41 кбит / с с использованием расширений MPEG-2.5.

Во время кодирования берутся 576 отсчетов во временной области, которые преобразуются в 576 отсчетов частотной области . [ требуется пояснение ] Если есть переходный процесс , вместо 576 берутся 192 отсчета. Это делается для ограничения временного распространения шума квантования, сопровождающего переходный процесс (см. психоакустику ). Разрешение по частоте ограничено небольшим размером окна длинного блока, что снижает эффективность кодирования. [66] Временное разрешение может быть слишком низким для переходных сигналов и может вызвать размытие перкуссионных звуков. [66]

Из-за древовидной структуры банка фильтров проблемы с опережающим эхом усугубляются, поскольку комбинированная импульсная характеристика двух банков фильтров не обеспечивает и не может обеспечить оптимальное решение с точки зрения разрешения по времени / частоте. [66] Кроме того, объединение выходных сигналов двух банков фильтров создает проблемы наложения спектров, которые необходимо частично решать с помощью этапа «компенсации наложения спектров»; однако это создает избыточную энергию для кодирования в частотной области, тем самым снижая эффективность кодирования. [ необходима цитата ]

С другой стороны, декодирование тщательно определено в стандарте. Большинство декодеров « совместимы с потоком битов », что означает, что распакованный вывод, который они производят из данного файла MP3, будет таким же, с заданной степенью допуска округления , как вывод, указанный математически в документе высокого стандарта ISO / IEC (ISO / МЭК 11172-3). Следовательно, сравнение декодеров обычно основывается на их вычислительной эффективности (т. Е. Сколько памяти или времени процессора они используют в процессе декодирования). Со временем эта проблема перестала быть проблемой, поскольку частота процессора изменилась с МГц на ГГц. Общая задержка кодировщика / декодера не определена, что означает, что нет официального положения длявоспроизведение без пауз . Однако некоторые кодеры, такие как LAME, могут присоединять дополнительные метаданные, которые позволят игрокам, которые могут их обработать, обеспечить плавное воспроизведение.

Качество [ править ]

При выполнении кодирования звука с потерями, такого как создание потока данных MP3, существует компромисс между объемом сгенерированных данных и качеством звука результатов. Человек, создающий MP3, выбирает битрейт , который указывает, сколько килобит в секунду звука требуется. Чем выше битрейт, тем больше будет поток данных MP3 и, как правило, тем ближе он будет звучать к исходной записи. При слишком низкой скорости передачи данных при воспроизведении могут быть слышны артефакты сжатия (т. Е. Звуки, которых не было в исходной записи). Некоторый звук сложно сжать из-за его случайности и резких атак. Когда этот тип звука сжимается, артефакты, такие как звон или пре-эхообычно слышны. Образец аплодисментов или инструмент в виде треугольника с относительно низкой скоростью передачи данных являются хорошими примерами артефактов сжатия. Большинство субъективных тестов перцепционных кодеков, как правило, избегают использования этих типов звуковых материалов, однако артефакты, генерируемые ударными звуками, едва заметны из-за специфической функции временного маскирования 32 поддиапазонного набора фильтров уровня II, на котором основан формат. .

Помимо скорости передачи кодированного фрагмента звука, качество звука в формате MP3 также зависит от качества алгоритма кодировщика, а также от сложности кодируемого сигнала. Поскольку стандарт MP3 допускает некоторую свободу действий с алгоритмами кодирования, разные кодировщики имеют совершенно разное качество даже при одинаковой скорости передачи данных. Например, в тесте публичного прослушивания с двумя ранними кодировщиками MP3, установленными на скорости около 128 кбит / с [68], один получил 3,66 балла по шкале от 1 до 5, а другой - только 2,22. Качество зависит от выбора кодировщика и параметров кодирования. [69]

Это наблюдение произвело революцию в кодировании звука. Раньше битрейт был главным и единственным соображением. В то время файлы MP3 были самого простого типа: они использовали одинаковую скорость передачи данных для всего файла: этот процесс известен как кодирование с постоянной скоростью передачи данных (CBR). Использование постоянной скорости передачи данных упрощает кодирование и снижает нагрузку на процессор. Однако также можно создавать файлы, в которых скорость передачи данных изменяется по всему файлу. Они известны как переменная скорость передачи данных.. Резервуар битов и кодирование VBR фактически были частью исходного стандарта MPEG-1. Их концепция заключается в том, что в любом звуковом фрагменте некоторые части легче сжимать, например тишину или музыку, содержащую только несколько тонов, в то время как другие сжимать труднее. Таким образом, общее качество файла может быть увеличено за счет использования более низкой скорости передачи битов для менее сложных отрывков и более высокой для более сложных частей. С некоторыми усовершенствованными кодировщиками MP3 можно указать заданное качество, и кодировщик соответствующим образом отрегулирует скорость передачи данных. Пользователи, желающие установить прозрачную "настройку качества"до ушей могут использовать это значение при кодировании всей своей музыки, и, вообще говоря, не нужно беспокоиться о выполнении личных тестов прослушивания для каждого музыкального произведения, чтобы определить правильную скорость передачи данных.

На воспринимаемое качество может влиять среда прослушивания (окружающий шум), внимание слушателя и подготовка слушателя, а также, в большинстве случаев, звуковое оборудование слушателя (например, звуковые карты, динамики и наушники). Кроме того, достаточное качество может быть достигнуто за счет более низкой настройки качества для лекций и приложений с человеческой речью, а также за счет уменьшения времени и сложности кодирования. Тест, проведенный для новых студентов профессором музыки Стэнфордского университета Джонатаном Бергером, показал, что предпочтение студентов музыке с качеством MP3 растет с каждым годом. Бергер сказал, что студенты, кажется, предпочитают «шипящие» звуки, которые MP3 привносят в музыку. [70]

Углубленное исследование качества звука MP3, проект звукооператора и композитора Райана Магуайра «Призрак в MP3» позволяет выделить звуки, потерянные во время сжатия MP3. В 2015 году он выпустил трек «moDernisT» (анаграмма «Tom's Diner»), составленный исключительно из звуков, удаленных во время сжатия MP3 песни «Tom's Diner», [71] [72] [73] трек, который использовался изначально в формулировке стандарта MP3. Подробный отчет о методах, используемых для выделения звуков, удаленных во время сжатия MP3, а также концептуальная мотивация проекта были опубликованы в Трудах Международной конференции компьютерной музыки 2014 года. [74]

Битрейт [ править ]

Битрейт - это произведение частоты дискретизации и количества бит на образец, используемых для кодирования музыки. CD-аудио - 44100 отсчетов в секунду. Количество бит на выборку также зависит от количества аудиоканалов. CD стерео и 16 бит на канал. Итак, умножение 44100 на 32 дает 1411200 - битрейт несжатого цифрового аудио CD. MP3 был разработан для кодирования этих данных со скоростью 1411 кбит / с со скоростью 320 кбит / с или меньше. Поскольку алгоритмы MP3 обнаруживают менее сложные отрывки, можно использовать более низкие битрейты. При использовании MPEG-2 вместо MPEG-1 MP3 поддерживает только более низкие частоты дискретизации (16000, 22050 или 24000 отсчетов в секунду) и предлагает выбор скорости передачи данных от 8 кбит / с, но не выше 160 кбит / с. Уменьшая частоту дискретизации, уровень III MPEG-2 удаляет все частоты, превышающие половину новой частоты дискретизации, которая могла присутствовать в исходном звуке.

Как показано в этих двух таблицах, в стандарте MPEG-1 Audio Layer III допускается 14 выбранных битрейтов : 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 и 320 кбит. / с, а также 3 самых высоких доступных частоты дискретизации : 32, 44,1 и 48  кГц . [49] MPEG-2 Audio Layer III также допускает 14 несколько различных (и в основном более низких) битрейтов : 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 кбит. / с с частотами дискретизации 16, 22,05 и 24  кГц, что ровно вдвое меньше, чем у MPEG-1 [49]. Кадры MPEG-2.5 Audio Layer III ограничены только скоростью 8 бит.8, 16, 24, 32, 40, 48, 56 и 64 кбит / с с 3 еще более низкими частотами дискретизации 8, 11,025 и 12 кГц. [ необходима цитата ] В более ранних системах, которые поддерживали только стандарт MPEG-1 Audio Layer III, файлы MP3 с битовой скоростью ниже 32 кбит / с могли воспроизводиться с ускорением и повышением частоты.

В более ранних системах также отсутствуют элементы управления быстрой перемоткой вперед и назад при воспроизведении MP3. [76] [77]

Кадры MPEG-1 содержат наибольшую детализацию в режиме 320 кбит / с, максимально допустимой скорости передачи данных [78] с тишиной и простыми тонами, по-прежнему требующими 32 кбит / с. Кадры MPEG-2 могут захватывать воспроизведение звука с частотой до 12 кГц, необходимое для воспроизведения звука до 160 кбит / с. Файлы MP3, созданные с помощью MPEG-2, не имеют полосы пропускания 20 кГц из-за теоремы выборки Найквиста – Шеннона . Воспроизведение частоты всегда строго меньше половины частоты дискретизации, а несовершенные фильтры требуют большей погрешности (уровень шума в зависимости от резкости фильтра), поэтому частота дискретизации 8 кГц ограничивает максимальную частоту до 4 кГц, а частота дискретизации 48 кГц. скорость ограничивает воспроизведение звука MP3 до 24 кГц. MPEG-2 использует половину, а MPEG-2.5 только четверть частот дискретизации MPEG-1.

Для общей области воспроизведения человеческой речи ширина полосы 5512 Гц достаточна для получения отличных результатов (для голоса) с использованием частоты дискретизации 11025 и кодирования VBR из 44100 (стандартного) файла WAV. У носителей английского языка в среднем 41–42 кбит / с с настройкой -V 9.6, но это может варьироваться в зависимости от количества записываемой тишины или скорости доставки (слов в минуту). Передискретизация до 12000 (полоса пропускания 6K) выбирается параметром LAME -V 9.4. Аналогично -V 9.2 выбирает частоту дискретизации 16000 и результирующую фильтрацию нижних частот 8K. Для получения дополнительной информации см. Найквист - Шеннон. Более старые версии LAME и FFmpeg поддерживают только целочисленные аргументы для параметра выбора качества с переменной скоростью передачи данных. Параметр качества n.nnn (-V) задокументирован на lame.sourceforge.net, но поддерживается только в LAME с селектором качества с переменной скоростью передачи данных нового стиля VBR, а не средней скоростью передачи (ABR).

Частота дискретизации 44,1 кГц обычно используется для воспроизведения музыки, потому что она также используется для аудио компакт-дисков , основного источника, используемого для создания файлов MP3. В Интернете используется большое количество битрейтов. Обычно используется скорость передачи 128 кбит / с [79] при степени сжатия 11: 1, что обеспечивает адекватное качество звука в относительно небольшом пространстве. Поскольку доступность полосы пропускания Интернета и размеры жестких дисков увеличились, широкое распространение получили более высокие скорости передачи данных до 320 кбит / с. Несжатый звук, хранящийся на аудио-компакт-диске, имеет скорость передачи данных 1411,2 кбит / с (16 бит / выборка × 44100 выборок / секунду × 2 канала / 1000 бит / килобит), поэтому битрейты 128, 160 и 192 кбит / с. представляют собой степени сжатия приблизительно 11: 1, 9: 1 и 7: 1 соответственно.

Нестандартная скорость передачи данных до 640 кбит / с может быть достигнута с помощью кодировщика LAME и опции свободного формата, хотя некоторые MP3-плееры могут воспроизводить эти файлы. Согласно стандарту ISO от декодеров требуется только возможность декодировать потоки до 320 кбит / с. [80] [81] [82] Ранние кодеры MPEG Layer III использовали то, что теперь называется постоянной скоростью передачи данных (CBR). Программа могла использовать только единый битрейт для всех кадров в файле MP3. Позднее более сложные кодеры MP3 смогли использовать битовый резервуар для определения средней скорости передачи битов, выбирая скорость кодирования для каждого кадра на основе сложности звука в этой части записи.

Более сложный кодировщик MP3 может воспроизводить аудио с переменной скоростью передачи данных . Аудио MPEG может использовать переключение битрейта для каждого кадра, но только декодеры уровня III должны его поддерживать. [49] [83] [84] [85] VBR используется, когда целью является достижение фиксированного уровня качества. Конечный размер файла в кодировке VBR менее предсказуем, чем с постоянным битрейтом . Средний битрейт- это тип VBR, реализованный как компромисс между ними: битрейт может изменяться для более стабильного качества, но контролируется таким образом, чтобы он оставался близким к среднему значению, выбранному пользователем для предсказуемых размеров файла. Хотя декодер MP3 должен поддерживать VBR, чтобы соответствовать стандартам, исторически некоторые декодеры имели ошибки с декодированием VBR, особенно до того, как кодеры VBR получили широкое распространение. Наиболее развитый кодировщик LAME MP3 поддерживает генерацию VBR, ABR и даже более старые форматы CBR MP3.

Аудио уровня III может также использовать «битовый резервуар», способность частично полного кадра удерживать часть аудиоданных следующего кадра, что позволяет временно изменять эффективный битрейт даже в потоке с постоянным битрейтом. [49] [83] Внутренняя обработка резервуара битов увеличивает задержку кодирования. [ необходима цитата ] Не существует диапазона 21 масштабного коэффициента (sfb21) для частот выше примерно 16  кГц , что вынуждает кодировщик выбирать между менее точным представлением в диапазоне 21 или менее эффективным хранением во всех диапазонах ниже диапазона 21, последнее приводит к потере битрейта в кодировке VBR. [86]

Вспомогательные данные [ править ]

Поле вспомогательных данных может использоваться для хранения данных, определенных пользователем. Вспомогательные данные не являются обязательными, и количество доступных битов явно не указывается. Вспомогательные данные располагаются после битов кода Хаффмана и находятся в диапазоне от того, на что указывает main_data_begin следующего кадра. Кодировщик mp3PRO использовал вспомогательные данные для кодирования дополнительной информации, которая могла улучшить качество звука при декодировании с помощью его собственного алгоритма.

Метаданные [ править ]

«Тег» в аудиофайле - это раздел файла, который содержит метаданные, такие как название, исполнитель, альбом, номер дорожки или другую информацию о содержимом файла. Стандарты MP3 не определяют форматы тегов для файлов MP3, а также не существует стандартного формата контейнера , который поддерживал бы метаданные и устранял необходимость в тегах. Однако существует несколько де-факто стандартов для форматов тегов. По состоянию на 2010 год наиболее распространенными являются ID3v1 и ID3v2 , а также недавно представленный APEv2 . Эти теги обычно встраиваются в начало или конец файлов MP3, отдельно от фактических данных кадра MP3. Декодеры MP3 либо извлекают информацию из тегов, либо просто обрабатывают их как игнорируемые нежелательные данные, отличные от MP3.

Программное обеспечение для воспроизведения и редактирования часто содержит функции редактирования тегов, но существуют также приложения для редактирования тегов, специально предназначенные для этой цели. Помимо метаданных, относящихся к аудиоконтенту, для DRM также могут использоваться теги . [87] ReplayGain - это стандарт для измерения и сохранения громкости файла MP3 ( нормализация звука ) в его теге метаданных, позволяющий проигрывателю, совместимому с ReplayGain, автоматически регулировать общую громкость воспроизведения для каждого файла. MP3Gain можно использовать для обратимого изменения файлов на основе измерений ReplayGain, чтобы можно было добиться скорректированного воспроизведения на плеерах без возможности ReplayGain.

Лицензирование, право собственности и законодательство [ править ]

Базовая технология декодирования и кодирования MP3 не имеет патентов в Европейском Союзе, причем срок действия всех патентов истекает не позднее 2012 года. В США технология стала практически свободной от патентов 16 апреля 2017 г. (см. Ниже). Патенты на MP3 истекли в США в период с 2007 по 2017 годы. В прошлом многие организации заявляли о правах собственности на патенты, связанные с декодированием или кодированием MP3. Эти претензии привели к ряду юридических угроз и действий из разных источников. В результате неопределенность в отношении того, какие патенты должны быть лицензированы для создания продуктов MP3 без нарушения патентных прав в странах, где разрешены патенты на программное обеспечение, была общей чертой на ранних этапах внедрения технологии.

Первоначальный почти полный стандарт MPEG-1 (части 1, 2 и 3) был публично доступен 6 декабря 1991 года как ISO CD 11172. [88] [89] В большинстве стран патенты не могут быть поданы после того, как предшествующий уровень техники был обнародован. , а срок действия патентов истекает через 20 лет после даты первоначальной подачи, которая может быть до 12 месяцев позже для заявок в других странах. В результате в большинстве стран срок действия патентов, необходимых для реализации MP3, истек к декабрю 2012 года, через 21 год после публикации ISO CD 11172.

Исключением являются Соединенные Штаты, где действующие патенты, поданные до 8 июня 1995 г., истекают по истечении 17 лет с даты выдачи или 20 лет с даты приоритета. Длительный процесс рассмотрения патентов может привести к выдаче патента намного позже, чем обычно ожидается (см. Патенты на подводные лодки ). Срок действия различных патентов, связанных с MP3, истек в период с 2007 по 2017 год в США. [90] Патенты на все, что раскрыто в ISO CD 11172, поданное через год или более после его публикации, вызывают сомнения. Если рассматривать только известные патенты MP3, поданные к декабрю 1992 г., то декодирование MP3 не является патентованным в США с 22 сентября 2015 г., когда истек срок действия патента США № 5 812 672 , на который была подана РСТ в октябре 1992 г. [91] [92][93] Если принять в качестве меры самый длительный патент, упомянутый в вышеупомянутых ссылках, то технология MP3 стала свободной от патентов в Соединенных Штатах 16 апреля 2017 г., когда патент США 6 009399 , принадлежащий [94] и управляемый Technicolor , [95] истек. В результате многиепроекты бесплатного программного обеспечения и программного обеспечения с открытым исходным кодом , такие как операционная система Fedora , решили начать доставку поддержки MP3 по умолчанию, и пользователям больше не придется прибегать к установке неофициальных пакетов, поддерживаемых сторонними репозиториями программного обеспечения для MP3. воспроизведение или кодирование. [96]

Technicolor (ранее называвшаяся Thomson Consumer Electronics) утверждал, что контролирует лицензирование MP3 патентов третьего уровня во многих странах, включая США, Японию, Канаду и страны ЕС. [97] Technicolor активно добивалась соблюдения этих патентов. [98] Доходы от лицензий на MP3 от администрации Technicolor принесли Обществу Фраунгофера в 2005 году около 100 миллионов евро. [99]В сентябре 1998 года Институт Фраунгофера разослал письмо нескольким разработчикам программного обеспечения MP3, в котором говорилось, что лицензия необходима для «распространения и / или продажи декодеров и / или кодировщиков». В письме утверждалось, что нелицензионные продукты «нарушают патентные права Fraunhofer и Thomson. Чтобы производить, продавать или распространять продукты с использованием стандарта [MPEG Layer-3] и, следовательно, наших патентов, вам необходимо получить у нас лицензию на эти патенты». [100] Это привело к ситуации, когда проект кодировщика LAME MP3 не мог предложить своим пользователям официальные двоичные файлы, которые можно было бы запустить на их компьютере. Позиция проекта заключалась в том, что исходный код LAME был просто описанием того, как кодировщик MP3 можетбыть реализованным. Неофициально скомпилированные двоичные файлы были доступны из других источников.

Sisvel SpA [101] и ее дочерняя компания в США Audio MPEG, Inc. ранее предъявляли иск Thomson за нарушение патентных прав на технологию MP3 [102], но эти споры были разрешены в ноябре 2005 г., когда Sisvel предоставила Thomson лицензию на их патенты. Вскоре вслед за этим последовала компания Motorola, которая подписала с Sisvel лицензию на патенты, связанные с MP3 в декабре 2005 года. [103] За исключением трех патентов, все патенты США, находящиеся в ведении Sisvel [104], истекли в 2015 году. Три исключения: Патент США 5 878 080 срок действия истек в феврале 2017 г .; Патент США 5850456 , срок действия истек в феврале 2017 г .; и патента США 5,960,037 , срок действия истек 9 апреля 2017 г.

В сентябре 2006 года немецкие официальные лица изъяли MP3-плееры из киоска SanDisk на выставке IFA в Берлине после того, как итальянская патентная фирма выиграла судебный запрет от имени Sisvel против SanDisk в споре о лицензионных правах. Постановление было позже отменено берлинским судьей [105], но эта отмена, в свою очередь, была заблокирована в тот же день другим судьей из того же суда, «доставив патентный Дикий Запад в Германию», по словам одного комментатора. [106] В феврале 2007 года Texas MP3 Technologies подала в суд на Apple, Samsung Electronics и Sandisk в федеральный суд восточного Техаса., заявляя о нарушении патента портативного MP3-плеера, который, по словам Texas MP3, был передан ему. Apple, Samsung и Sandisk урегулировали иски против них в январе 2009 года. [107] [108]

Alcatel-Lucent подала иск на несколько патентов на кодирование и сжатие MP3, якобы унаследованных от AT & T-Bell Labs. В ноябре 2006 г., перед слиянием компаний, Alcatel подала в суд на Microsoft за нарушение семи патентов. 23 февраля 2007 года жюри Сан-Диего присудило Alcatel-Lucent $ 1,52 млрд в качестве компенсации за нарушение двух из них. [109] Однако суд впоследствии отменил решение, установив, что один патент не был нарушен, а другой не принадлежал Alcatel-Lucent ; Судья постановил , что он принадлежал AT&T и Fraunhofer, которые передали лицензию на него Microsoft . [110]Это решение защиты было оставлено без изменения при рассмотрении апелляции в 2008 году. [111] См. Дополнительную информацию в Alcatel-Lucent v. Microsoft .

Альтернативные технологии [ править ]

Существуют и другие форматы с потерями. Среди них наиболее широко используется Advanced Audio Coding (AAC), которое было разработано как преемник MP3. Также существуют другие форматы с потерями, такие как mp3PRO и MP2 . Они являются членами того же технологического семейства, что и MP3, и основаны на примерно схожих психоакустических моделях и алгоритмах MDCT . В то время как MP3 использует гибридный подход к кодированию, который является частью MDCT и частью FFT , AAC - это чисто MDCT, что значительно повышает эффективность сжатия. [112] Многие из основных патентов, лежащих в основе этих форматов, принадлежат Fraunhofer Society , Alcatel-Lucent,Thomson Consumer Electronics , [112] Bell , Dolby , LG Electronics , NEC , NTT Docomo , Panasonic , Sony Corporation , [113] ETRI , JVC Kenwood , Philips , Microsoft и NTT . [114]

Когда рынок цифровых аудиоплееров находился на подъеме, MP3 был широко принят в качестве стандарта, отсюда и популярное название «MP3-плеер». Компания Sony была исключением и использовала собственный кодек ATRAC, взятый из формата MiniDisc , который, по утверждению Sony, был лучше. [115] После критики и более низких, чем ожидалось, продаж Walkman в 2004 году Sony впервые представила встроенную поддержку MP3 для своих плееров Walkman. [116]

Существуют также открытые форматы сжатия, такие как Opus и Vorbis , которые доступны бесплатно и без каких-либо известных патентных ограничений. Некоторые из новых форматов сжатия звука, такие как AAC, WMA Pro и Vorbis, свободны от некоторых ограничений, присущих формату MP3, которые не могут быть преодолены никаким кодировщиком MP3. [90]

Помимо методов сжатия с потерями, форматы без потерь являются важной альтернативой MP3, поскольку они обеспечивают неизмененный аудиоконтент, хотя и с увеличенным размером файла по сравнению со сжатием с потерями. Форматы без потерь включают FLAC (Free Lossless Audio Codec), Apple Lossless и многие другие.

См. Также [ править ]

  • Сравнение форматов кодирования аудио
  • MP3 блог
  • Мп3-плеер
  • MP3 Surround
  • MP3HD
  • MPEG-4, часть 14
  • Подкаст
  • Портативный медиаплеер
  • Харальд Попп
  • Общество Фраунгофера
  • M4a

Ссылки [ править ]

  1. ^ a b "С Днем Рождения, MP3!" . Фраунгофера IIS. 12 июля 2005 . Проверено 18 июля 2010 года .
  2. ^ "Тип носителя audio / mpeg - RFC 3003" . IETF. Ноября 2000 . Проверено 7 декабря 2009 года .
  3. ^ «Регистрация типа MIME для форматов полезной нагрузки RTP - RFC 3555» . IETF. Июль 2003 . Проверено 7 декабря 2009 года .
  4. ^ a b «Более устойчивый к потерям формат полезной нагрузки RTP для аудио в формате MP3 - RFC 5219» . IETF. Февраль 2008 . Проверено 4 декабря 2014 .
  5. ^ "Команда mp3" . Фраунгофера IIS . Проверено 12 июня 2020 .
  6. ^ a b c d e «ISO / IEC 11172-3: 1993 - Информационные технологии - Кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с - Часть 3: Аудио» . ISO. 1993 . Проверено 14 июля 2010 года .
  7. ^ a b c d "ISO / IEC 13818-3: 1995 - Информационные технологии. Общее кодирование движущихся изображений и связанной с ними звуковой информации - Часть 3: Аудио" . ISO. 1995 . Проверено 14 июля 2010 года .
  8. ^ "Технология MP3 в Fraunhofer IIS" . Фраунгофера IIS . Проверено 12 июня 2020 .
  9. ^ Джаянт, Никил ; Джонстон, Джеймс; Сафранек, Роберт (октябрь 1993 г.). «Сжатие сигналов на основе моделей человеческого восприятия». Труды IEEE . 81 (10): 1385–1422. DOI : 10.1109 / 5.241504 .
  10. ^ «MP3 (кодирование звука MPEG Layer III)» . Библиотека Конгресса. 27 июля 2017 . Проверено 9 ноября 2017 года .
  11. ^ a b ISO (ноябрь 1991 г.). "Пресс-релиз MPEG, Курихама, ноябрь 1991" . ISO. Архивировано из оригинала 3 мая 2011 года . Проверено 17 июля 2010 года .
  12. ^ a b c d e ISO (ноябрь 1991 г.). "CD 11172-3 - КОДИРОВАНИЕ ДВИЖУЩИХСЯ ИЗОБРАЖЕНИЙ И СВЯЗАННОГО АУДИО ДЛЯ ЦИФРОВЫХ НОСИТЕЛЕЙ С АУДИОСИСТЕМОЙ ДО 1,5 Мбит / с Часть 3" (PDF) . Архивировано из оригинального (PDF) 30 декабря 2013 года . Проверено 17 июля 2010 года .
  13. ^ a b ISO (6 ноября 1992 г.). "Пресс-релиз MPEG, Лондон, 6 ноября 1992 г." . Кьяриглионе. Архивировано из оригинального 12 августа 2010 года . Проверено 17 июля 2010 года .
  14. ^ a b c ISO (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio, версия 9 - MPEG-1 и MPEG-2 BC» . ISO . Проверено 28 октября 2009 года .
  15. ^ Майер, Альфред Маршалл (1894). «Исследования в области акустики» . Лондонский, Эдинбургский и Дублинский философский журнал . 37 (226): 259–288. DOI : 10.1080 / 14786449408620544 .
  16. ^ Эмер, Ричард Х. (1959). «Маскировка тонами против шумовых полос». Журнал акустического общества Америки . 31 (9): 1253. Bibcode : 1959ASAJ ... 31.1253E . DOI : 10.1121 / 1.1907853 .
  17. ^ Цвикер, Эберхард (1974). «О психоакустическом эквиваленте кривых настройки». Факты и модели в слухе . Факты и модели в слухе (материалы симпозиума по психофизическим моделям и физиологическим фактам слуха; проходивший в Тузинге, Обербайерн, 22–26 апреля 1974 г.) . Связь и кибернетика. 8 . стр.  132 -141. DOI : 10.1007 / 978-3-642-65902-7_19 . ISBN 978-3-642-65904-1.
  18. ^ Цвикер, Эберхард; Фельдткеллер, Ричард (1999) [1967]. Das Ohr als Nachrichtenempfänger [ Ухо как приемник связи ]. Пер. Ханнеса Мюша, Сёрена Бууса и Марии Флорентийской. Архивировано из оригинального 14 сентября 2000 года . Проверено 29 Июнь 2 008 .
  19. ^ Флетчер, Харви (1995). Речь и слух в общении . Акустическое общество Америки. ISBN 978-1-56396-393-3.
  20. ^ a b c Шредер, Манфред Р. (2014). "Bell Laboratories" . Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Springer. п. 388. ISBN 9783319056609.
  21. ^ Грей, Роберт М. (2010). "История цифровой речи в реальном времени в пакетных сетях: Часть II линейного прогнозирующего кодирования и Интернет-протокола" (PDF) . Найденный. Тенденции сигнального процесса . 3 (4): 203–303. DOI : 10.1561 / 2000000036 . ISSN 1932-8346 .  
  22. ^ Атал, B .; Шредер, М. (1978). «Прогнозирующее кодирование речевых сигналов и критерии субъективной ошибки». ICASSP '78. Международная конференция IEEE по акустике, речи и обработке сигналов . 3 : 573–576. DOI : 10.1109 / ICASSP.1978.1170564 .
  23. ^ Шредер, MR ; Атал, BS ; Холл, JL (декабрь 1979). «Оптимизация цифровых речевых кодеров за счет использования маскирующих свойств человеческого уха». Журнал акустического общества Америки . 66 (6): 1647. Bibcode : 1979ASAJ ... 66.1647S . DOI : 10.1121 / 1.383662 .
  24. Перейти ↑ Krasner, MA (18 июня 1979 г.). Цифровое кодирование речи и звуковых сигналов на основе требований восприятия слуховой системы (Диссертация). Массачусетский Институт Технологий. ЛВП : 1721,1 / 16011 .
  25. Перейти ↑ Krasner, MA (18 июня 1979 г.). «Цифровое кодирование речи на основе требований восприятия слуховой системы (Технический отчет 535)» (PDF) . Архивировано 3 сентября 2017 года из оригинального (PDF) .
  26. Ахмед, Насир (январь 1991 г.). «Как я пришел к дискретному косинусному преобразованию» . Цифровая обработка сигналов . 1 (1): 4–5. DOI : 10.1016 / 1051-2004 (91) 90086-Z .
  27. ^ Ахмед, Насир ; Натараджан, Т .; Рао, КР (январь 1974), "дискретного косинусного преобразования", IEEE Transactions на компьютерах , C-23 (1): 90-93, DOI : 10,1109 / TC.1974.223784
  28. ^ Рао, КР ; Ип П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения , Бостон: Academic Press, ISBN 978-0-12-580203-1
  29. ^ JP Princen, AW Johnson и AB Bradley: Кодирование поддиапазонов / преобразований с использованием схем набора фильтров, основанных на отмене наложения спектров во временной области , IEEE Proc. Intl. Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987 г.
  30. ^ Джон П. Принсен, Алан Б. Брэдли: Дизайн банка фильтров анализа / синтеза, основанный на отмене наложения спектров во временной области , IEEE Trans. Акуст. Обработка речевых сигналов, ASSP-34 (5), 1153–1161, 1986
  31. ^ a b Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Дата обращения 14 июля 2019 .
  32. ^ Terhardt, E .; Stoll, G .; Сиванн, М. (март 1982 г.). «Алгоритм извлечения высоты звука и яркости звука из сложных тональных сигналов». Журнал акустического общества Америки . 71 (3): 679. Bibcode : 1982ASAJ ... 71..679T . DOI : 10.1121 / 1.387544 .
  33. ^ a b «Голосовое кодирование для связи». Журнал IEEE по избранным областям коммуникаций . 6 (2). Февраль 1988 г.
  34. ^ a b c Происхождение стандарта кодирования звука MP3 в транзакциях IEEE в бытовой электронике, IEEE, Vol. 52, № 3, стр. 1043–1049, август 2006 г.
  35. ^ Бранденбург, Карлхайнц; Зейтцер, Дитер (3–6 ноября 1988 г.). OCF: кодирование высококачественного звука со скоростью передачи данных 64 кбит / с . 85-й съезд общества аудиоинженеров.
  36. ^ Джонстон, Джеймс Д. (февраль 1988 г.). «Преобразование кодирования аудиосигналов с использованием критериев восприятия шума». Журнал IEEE по избранным областям коммуникаций . 6 (2): 314–323. DOI : 10.1109 / 49.608 .
  37. ^ YF Dehery, et al. (1991) Исходный кодек MUSICAM для цифрового аудиовещания и хранения Proceedings IEEE-ICASSP 91 страницы 3605–3608 Май 1991
  38. ^ «Комментарий DAB от Алана Бокса, связи EZ и председателя целевой группы NAB DAB» (PDF) .
  39. ^ EBU SQAM CD Оценка качества звука Записи материалов для субъективных тестов . 7 октября 2008 г.
  40. ^ a b Юинг, Джек (5 марта 2007 г.). «Как родился MP3» . Bloomberg BusinessWeek . Проверено 24 июля 2007 года .
  41. ^ Витт, Стивен (2016). Как музыка стала бесплатной: конец индустрии, рубеж веков и терпение пиратства . Соединенные Штаты Америки: Penguin Books. п. 13. ISBN 978-0143109341. К Бранденбургу и Грилю присоединились еще четыре исследователя фраунгофера. Хайнц Герхаузер руководил исследовательской группой института аудио; Харальд Попп был специалистом по аппаратному обеспечению; Эрнст Эберлейн был экспертом по обработке сигналов; Юрген Херре был еще одним аспирантом, математические способности которого не уступали Бранденбургу. В последующие годы эта группа будет называть себя «первоначальной шестеркой».
  42. Джонатан Стерн (17 июля 2012 г.). MP3: значение формата . Издательство Университета Дьюка. п. 178. ISBN 978-0-8223-5287-7.
  43. ^ Технология цифрового видео и аудиовещания: Практическое руководство по проектированию (сигналы и коммуникационные технологии) ISBN 3-540-76357-0 стр. 144: «В 1988 году метод MASCAM был разработан в Institut für Rundfunktechnik (IRT) в Мюнхене в рамках подготовки к системе цифрового аудиовещания (DAB). От MASCAM - MUSICAM (универсальное кодирование и мультиплексирование поддиапазонов с маскирующими шаблонами) Метод был разработан в 1989 году в сотрудничестве с CCETT, Philips и Matsushita ». 
  44. ^ «Отчет о состоянии ISO MPEG» (пресс-релиз). Международная организация по стандартизации . Сентябрь 1990 года Архивированы из оригинала 14 февраля 2010 года.
  45. ^ «Аспек-адаптивное спектральное энтропийное кодирование высококачественных музыкальных сигналов» . Электронная библиотека AES . 1991 . Проверено 24 августа 2010 года .
  46. ^ a b «Принято на 22-м заседании WG11» (пресс-релиз). Международная организация по стандартизации . 2 апреля 1993 года Архивировано из оригинала 6 августа 2010 года . Проверено 18 июля 2010 года .
  47. ^ Бранденбург, Карлхайнц; Бози, Марина (февраль 1997 г.). «Обзор MPEG Audio: текущие и будущие стандарты кодирования аудио с низкой скоростью передачи данных» . Журнал Общества звукорежиссеров . 45 (1/2): 4–21 . Проверено 30 июня 2008 года .
  48. ^ a b c d "Технические детали MP3 (MPEG-2 и MPEG-2.5)" . Фраунгофера IIS . Сентября 2007 Архивировано из оригинального 24 января 2008 года «MPEG-2.5» это название патентованного расширения , разработанного Fraunhofer IIS. Это позволяет MP3 удовлетворительно работать с очень низкими битрейтами и вводит дополнительные частоты дискретизации 8 кГц, 11,025 кГц и 12 кГц.
  49. ^ a b c d e f g h Supurovic, Predrag (22 декабря 1999 г.). «Заголовок аудиокадра MPEG» . Архивировано из оригинала 8 февраля 2015 года . Проверено 29 мая 2009 года .
  50. ^ a b c «ISO / IEC 13818-3: 1994 (E) - Информационные технологии. Общее кодирование движущихся изображений и связанного звука: аудио» (ZIP) . 11 ноября 1994 . Проверено 4 августа 2010 года .
  51. ^ "Интересные факты: Музыка" . Официальное сообщество Сюзанны Вега .
  52. MPEG (25 марта 1994 г.). «Утверждено на 26-м заседании (Париж)» . Архивировано из оригинального 26 июля 2010 года . Проверено 5 августа 2010 года .
  53. MPEG (11 ноября 1994 г.). «Утверждено на 29-м заседании» . Архивировано из оригинала на 8 августа 2010 года . Проверено 5 августа 2010 года .
  54. ^ ISO. «ISO / IEC TR 11172-5: 1998 - Информационные технологии - Кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с - Часть 5: Моделирование программного обеспечения» . Проверено 5 августа 2010 года .
  55. ^ «ISO / IEC TR 11172-5: 1998 - Информационные технологии - Кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с - Часть 5: Моделирование программного обеспечения (Эталонное программное обеспечение)» (ZIP) . Проверено 5 августа 2010 года .
  56. ^ Dehery, Ив-Франсуа (1994). Стандарт высококачественного кодирования звука для радиовещательных, телекоммуникационных и мультимедийных систем . Нидерланды: Elsevier Science BV. С. 53–64. ISBN 978-0-444-81580-4. Эта статья относится к рабочей станции со сжатым цифровым звуком Musicam (MPEG Audio Layer II), реализованной на микрокомпьютере, которая используется не только как профессиональная монтажная станция, но и как сервер в сети Ethernet для библиотеки сжатого цифрового звука, поэтому в будущем ожидается появление MP3 в Интернете
  57. ^ «Технология MP3 сегодня» . Много информативной информации о музыке . 2005. Архивировано из оригинала 4 июля 2008 года . Проверено 15 сентября 2016 года .
  58. Джонатан Стерн (17 июля 2012 г.). MP3: значение формата . Издательство Университета Дьюка. п. 202. ISBN. 978-0-8223-5287-7.
  59. Небесный музыкальный автомат на The Atlantic «Чтобы показать промышленности, как использовать кодек, MPEG собрал бесплатный образец программы, конвертирующий музыку в файлы MP3. Демонстрационное программное обеспечение создавало некачественный звук, и Фраунгофер не собирался его использовать. «Исходный код» программного обеспечения - его основные инструкции - хранился на легкодоступном компьютере в Университете Эрлангена, с которого он был загружен неким SoloH, хакером из Нидерландов (и, как предполагается, фанатом «Звездных войн»). SoloH обновила исходный код для создания программного обеспечения, которое преобразовывало треки компакт-дисков в музыкальные файлы приемлемого качества ». (2000)
  60. ^ Поп-идолы и пираты: механизмы потребления и глобального распространения ... доктора Чарльза Фэирчайлда
  61. ^ Технологии пиратства? - Исследование взаимодействия между коммерциализмом и идеализмом в развитии MP3 и DivX ХЕНДРИК ШТОРСТЕЙН СПИЛКЕР, СВЕЙН ХЁЙЕР, стр. 2072
  62. ^ www.euronet.nl/~soloh/mpegEnc/ ( Archive.org )
  63. ^ "Об Интернет-подпольном музыкальном архиве" .
  64. ^ a b Шуберт, Рут (10 февраля 1999 г.). «Техническая подкованность в получении музыки для песни; индустрия разочарована тем, что Интернет делает бесплатную музыку простой» . Сиэтл Пост-Интеллидженсер . Проверено 22 ноября 2008 года .
  65. ^ Гислер, Markus (2008). «Конфликт и компромисс: драма эволюции рынка». Журнал потребительских исследований . 34 (6): 739–753. CiteSeerX 10.1.1.564.7146 . DOI : 10.1086 / 522098 . S2CID 145796529 .  
  66. ^ а б в г Бувинь, Габриэль (2003). «Технология MP3 - Ограничения» . Архивировано из оригинального 7 -го января 2011 года.
  67. ^ "ISO / IEC 11172-3: 1993 / Cor 1: 1996" . Международная организация по стандартизации . 2006 . Проверено 27 августа 2009 года .
  68. Аморим, Роберто (3 августа 2003 г.). «Результаты теста публичного прослушивания с расширением 128 кбит / с» . Проверено 17 марта 2007 года .
  69. Перейти ↑ Mares, Sebastian (декабрь 2005 г.). «Результаты публичного многоформатного прослушивания при 128 кбит / с» . Проверено 17 марта 2007 года .
  70. ^ Догерти, Dale (1 марта 2009). «Обжигающий звук музыки» . О'Рейли Радар .
  71. ^ «Познакомьтесь с музыкальным ясновидящим, который находит призраков в ваших MP3» . ШУМ . 18 марта 2015 г.
  72. ^ "Призраки в mp3" . 15 марта 2015 г.
  73. ^ "Потерянные и найденные: аспирант Университета Вирджинии обнаруживает призраков в MP3" . UVA сегодня . 23 февраля 2015.
  74. Призрак в MP3
  75. ^ «Руководство по параметрам командной строки (в CVS)» . Проверено 4 августа 2010 года .
  76. ^ «Руководство по эксплуатации JVC RC-EX30» (PDF) (на нескольких языках). 2004. с. 14. Поиск - поиск нужного места на диске (только аудио CD) ( Бумбокс 2004 года )
  77. ^ "DV-RW250H Руководство по эксплуатации GB" (PDF) . 2004. с. 33. • Ускоренное воспроизведение вперед и обзорное воспроизведение не работают с дисками MP3 / WMA / JPEG-CD.
  78. ^ «Сравнение качества звука Hi-Res Audio, CD и MP3» . www.sony.com . Sony . Дата обращения 11 августа 2020 .
  79. ^ Вун-Seng Gan; Сен-Мо Куо (2007). Встроенная обработка сигналов с помощью Micro Signal Architecture . Wiley-IEEE Press . п. 382. ISBN. 978-0-471-73841-1.
  80. ^ Bouvigne, Габриэль (28 ноября 2006). "свободный формат на 640 кбит / с и foobar2000, возможности?" . Проверено 15 сентября 2016 года .
  81. ^ "lame (1): создание аудиофайлов в формате mp3 - справочная страница Linux" . linux.die.net . Проверено 22 августа 2020 .
  82. ^ "Linux Manpages Online - справочные страницы man.cx" . man.cx . Проверено 22 августа 2020 .
  83. ^ a b «GPSYCHO - переменная скорость передачи данных» . LAME MP3 Encoder . Проверено 11 июля 2009 года .
  84. ^ "TwoLAME: MPEG Audio Layer II VBR" . Проверено 11 июля 2009 года .
  85. ^ Подгруппа ISO MPEG Audio. «Часто задаваемые вопросы по MPEG Audio, версия 9: MPEG-1 и MPEG-2 BC» . Проверено 11 июля 2009 года .
  86. ^ "ХРАМНЫЙ переключатель Y" . База знаний Hydrogenaudio . Проверено 23 марта 2015 года .
  87. ^ Рэй, Кейси. «Метаданные и вы» . Будущее музыкальной коалиции . Проверено 12 декабря 2014 .
  88. ^ Патель, Кетан; Смит, Брайан Ч .; Роу, Лоуренс А. Производительность программного декодера видео MPEG (PDF) . Конференция ACM Multimedia 1993.
  89. ^ "MPEG-FAQ, версия 3.1" . 14 мая 1994 года Архивировано из оригинала 23 июля 2009 года.
  90. ^ a b «Большой список патентов MP3 (и предполагаемые даты истечения срока действия)» . tunequest . 26 февраля 2007 г.
  91. ^ Cogliati, Джош (20 июля 2008). «Патентный статус MPEG-1, H.261 и MPEG-2» . Kuro5hin . В этой работе не учитывались патентные разделения и продолжения.
  92. ^ Патент США № 5812672
  93. ^ «Истечение срока действия патента США на MP3, MPEG-2, H.264» . OSNews.com.
  94. ^ "Патент US6009399 - Метод и устройство для кодирования цифровых сигналов ... - Патенты Google" .
  95. ^ "mp3licensing.com - Патенты" . mp3licensing.com .
  96. ^ "Полная поддержка MP3 скоро появится в Fedora" . 5 мая 2017.
  97. ^ «Сжатие акустических данных - базовый патент MP3» . Основа бесплатной информационной инфраструктуры . 15 января 2005 Архивировано из оригинала 15 июля 2007 года . Проверено 24 июля 2007 года .
  98. ^ «Интеллектуальная собственность и лицензирование» . Цветной . Архивировано из оригинала 4 мая 2011 года.
  99. ^ Kistenfeger, Muzinée (июль 2007). "Общество Фраунгофера (Fraunhofer-Gesellschaft, FhG)" . Генеральное консульство Великобритании в Мюнхене. Архивировано из оригинального 18 августа 2002 года . Проверено 24 июля 2007 года .
  100. ^ «Раннее исполнение патента MP3» . Информационный центр Chilling Effects . 1 сентября 1998 . Проверено 24 июля 2007 года .
  101. ^ "Программа лицензирования MPEG Audio от SISVEL" .
  102. ^ «Audio MPEG и Sisvel: Thomson подал в суд за нарушение патентных прав в Европе и США - MP3-плееры остановлены таможней» . ZDNet Индия . 6 октября 2005 года Архивировано из оригинала 11 октября 2007 года . Проверено 24 июля 2007 года .
  103. ^ "предоставляет Motorola патентную лицензию на звук в форматах MP3 и MPEG 2" . SISVEL. 21 декабря 2005 года Архивировано из оригинала 21 января 2014 года . Проверено 18 января 2014 года .
  104. ^ "Патенты США на MPEG Audio" (PDF) . Sisvel.
  105. Огг, Эрика (7 сентября 2006 г.). «Порядок изъятия SanDisk MP3 отменен» . CNET News . Архивировано из оригинала 4 ноября 2012 года . Проверено 24 июля 2007 года .
  106. ^ "Sisvel приносит патентный Дикий Запад в Германию" . Блог IPEG . 7 сентября 2006 . Проверено 24 июля 2007 года .
  107. Apple, SanDisk Settle Texas MP3 Patent Spat » . Закон об интеллектуальной собственности 360 . 26 января 2009 . Проверено 16 августа 2010 года .
  108. ^ "Специалисты Baker Botts LLP: Лиза Кэтрин Келли - Представительские обязательства" . ТОО «Бейкер Боттс» . Архивировано из оригинала на 10 декабря 2014 года . Проверено 15 сентября 2016 года .
  109. ^ «Microsoft грозит выплата в размере 1,5 млрд долларов в формате MP3» . BBC News . 22 февраля 2007 . Проверено 30 июня 2008 года .
  110. ^ «Microsoft выигрывает отмену решения о патенте MP3» . CNET . 6 августа 2007 . Проверено 17 августа 2010 года .
  111. ^ «Апелляционный суд по решению федерального округа» (PDF) . 25 сентября 2008 г. Архивировано из оригинального (PDF) 29 октября 2008 г.
  112. ^ a b Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» . Архивировано из оригинального (PDF) 19 октября 2014 года.
  113. ^ «Via Licensing объявляет об обновленной совместной патентной лицензии AAC» . Деловой провод . 5 января 2009 . Проверено 18 июня 2019 .
  114. ^ «Лицензиары AAC» . Via Corp . Дата обращения 6 июля 2019 .
  115. ^ https://www.nytimes.com/1999/09/30/technology/news-watch-new-player-from-sony-will-give-a-nod-to-mp3.html
  116. ^ https://www.cnet.com/reviews/sony-nw-e100-review/

Дальнейшее чтение [ править ]

  • Герт Ловинк (9 ноября 2014 г.). «Размышления о формате MP3: интервью с Джонатаном Стерном» . Вычислительная культура (4). ISSN  2047-2390 .

Внешние ссылки [ править ]

  • MP3 в Curlie
  • MP3-history.com , История MP3: как был изобретен MP3, Фраунгофер IIS
  • Архив новостей MP3 , более 1000 статей с 1999 по 2011 год, посвященных MP3 и цифровому аудио
  • MPEG.chiariglione.org , официальный веб-сайт MPEG