MP3

MP3 (формально MPEG-1 Audio Layer III или MPEG-2 Audio Layer III ) ^[4] представляет собой Формат кодирования для цифрового аудио разработаны в основном в Fraunhofer Society в Германии, при поддержке других цифровых ученых в США и других странах. Первоначально определенный как третий аудиоформат стандарта MPEG-1 , он был сохранен и расширен, определяя дополнительные скорости передачи данных и поддержку большего количества аудиоканалов, в качестве третьего аудиоформата последующего MPEG-2.стандарт. Третья версия, известная как MPEG 2.5, расширенная для лучшей поддержки более низких битрейтов, обычно реализуется, но не является признанным стандартом.

MP3

Расширение имени файла	`.mp3` `.bit`(до 1995 г.) ^[1]
Тип интернет-СМИ	`audio/mpeg`^[2] `audio/MPA`^[3] `audio/mpa-robust`^[4]
Разработано	Карлхайнц Бранденбург , Эрнст Эберлейн, Хайнц Герхойзер, Бернхард Гриль , Юрген Херре и Харальд Попп (все члены Общества Фраунгофера ) ^[5] и другие
Первый выпуск	1993 ; 28 лет назад ^[6] ( 1993 )
Тип формата	Цифровое аудио
Содержится	MPEG-ES
Стандарты	ИСО / МЭК 11172-3 ^[6] ИСО / МЭК 13818-3 ^[7]
Открытый формат ?	Да ^[8]

MP3 (или mp3 ) как формат файла обычно обозначает файлы, содержащие элементарный поток данных в кодировке MPEG-1 Audio или MPEG-2 Audio, без других сложностей стандарта MP3.

Что касается сжатия звука (аспект стандарта, наиболее очевидный для конечных пользователей и наиболее известный), MP3 использует сжатие данных с потерями для кодирования данных с использованием неточных приближений и частичного отбрасывания данных. Это позволяет значительно уменьшить размер файлов по сравнению с несжатым звуком. Комбинация небольшого размера и приемлемой точности воспроизведения привела к буму распространения музыки через Интернет в середине-конце 1990-х годов, когда MP3 выступал в качестве вспомогательной технологии в то время, когда пропускная способность и объем хранилища все еще были в дефиците. Формат MP3 вскоре стал ассоциироваться со спорами, связанными с нарушением авторских прав , музыкальным пиратством , а также службами копирования / обмена файлами MP3.com и Napster , среди прочих. С появлением портативных медиаплееров , в эту категорию продуктов также входят смартфоны , поддержка MP3 остается почти универсальной.

Сжатие MP3 работает за счет снижения (или приближения) точности определенных компонентов звука, которые, как считается (с помощью психоакустического анализа) выходят за пределы возможностей слуха большинства людей. Этот метод обычно называют перцептивным кодированием или психоакустическим моделированием. ^[9] Оставшаяся аудиоинформация затем записывается с эффективным использованием пространства с использованием алгоритмов MDCT и FFT . По сравнению с цифровым звуком CD-качества , сжатие MP3 обычно позволяет уменьшить размер на 75–95%. Например, MP3, закодированный с постоянным битрейтом 128 кбит / с, приведет к получению файла размером примерно 9% от размера исходного аудио компакт-диска. ^[10] В начале 2000-х годов проигрыватели компакт-дисков все чаще стали поддерживать воспроизведение файлов MP3 на компакт-дисках с данными.

Группа экспертов по движущемуся изображению (MPEG) разработала MP3 как часть своих стандартов MPEG-1 , а затем и MPEG-2 . MPEG-1 Audio (MPEG-1 Part 3), который включал MPEG-1 Audio Layer I, II и III, был одобрен как проект комитета по стандарту ISO / IEC в 1991 году ^[11]^[12], завершенный в 1992 году, ^[13] и опубликован в 1993 г. как ISO / IEC 11172-3: 1993. ^[6] Расширение MPEG-2 Audio (MPEG-2 Part 3) с более низкой частотой дискретизации и битовой скоростью было опубликовано в 1995 году как ISO / IEC 13818-3: 1995. ^[7]^[14] Это требует лишь минимальных изменений существующих декодеров MPEG-1 (распознавание бита MPEG-2 в заголовке и добавление новых более низких значений скорости дискретизации и битовой скорости).

История

Задний план

Алгоритм сжатия аудиоданных MP3 с потерями использует ограничение восприятия человеческого слуха, называемое слуховой маскировкой . В 1894 году американский физик Альфред М. Майер сообщил, что один тон можно сделать неслышимым с помощью другого тона более низкой частоты. ^[15] В 1959 году Ричард Эмер описал полный набор слуховых кривых, касающихся этого явления. ^[16] Между 1967 и 1974 годами Эберхард Цвикер работал в области настройки и маскировки критических полос частот, ^[17]^[18], которые, в свою очередь, основывались на фундаментальных исследованиях Харви Флетчера и его сотрудников в Bell. Labs . ^[19]

Перцепционное кодирование было впервые использовано для сжатия речевого кодирования с кодированием с линейным предсказанием (LPC) ^[20], которое берет свое начало в работах Фумитада Итакура ( Университет Нагоя ) и Сюдзо Сайто ( Nippon Telegraph and Telephone ) в 1966 году. ^[21] В 1978 году. , Бишну С. Атал и Манфред Р. Шредер из Bell Labs предложили речевой кодек LPC , называемый адаптивным прогнозирующим кодированием , который использует алгоритм психоакустического кодирования, использующий маскирующие свойства человеческого уха. ^[20]^[22] Дальнейшая оптимизация Шредером и Аталом с Дж. Л. Холлом была позже описана в статье 1979 года. ^{[23] В} том же году М.А. Краснер предложил психоакустический маскирующий кодек ^[24], который опубликовал и произвел аппаратное обеспечение для речи (не используемое для сжатия музыкальных файлов), но публикация его результатов в относительно малоизвестной лаборатории Линкольна. Технический отчет ^[25] не сразу повлиял на мейнстрим разработки психоакустических кодеков.

Дискретного косинусного преобразования (ДКП), тип кодирования с преобразованием для сжатия с потерями , предложенный Насиром Ахмеда в 1972 году, был разработан Ahmed с Т. Natarajan и КР Рао в 1973 году; они опубликовали свои результаты в 1974 году. ^[26]^[27]^[28] Это привело к развитию модифицированного дискретного косинусного преобразования (MDCT), предложенного JP Princen, AW Johnson и AB Bradley в 1987 году ^[29] после более ранней работы. Принсном и Брэдли в 1986 году. ^[30] MDCT позже стал основной частью алгоритма MP3. ^[31]

Эрнст Терхардт и др. построил алгоритм, описывающий слуховую маскировку с высокой точностью в 1982 году. ^[32] Эта работа была добавлена к множеству отчетов авторов, восходящих к Флетчеру, и к работе, которая первоначально определяла критические отношения и критическую полосу пропускания.

В 1985 году Атал и Шредер представили линейное предсказание с кодовым возбуждением (CELP), основанный на LPC алгоритм перцептивного речевого кодирования со слуховой маскировкой, который достиг значительной степени сжатия данных для своего времени. ^[20] Рецензируемый журнал IEEE по избранным областям коммуникаций сообщил о большом количестве (в основном перцепционных) алгоритмов сжатия звука в 1988 году. ^[33] В выпуске «Голосовое кодирование для коммуникаций», опубликованном в феврале 1988 года, сообщалось о широком спектре алгоритмов сжатия звука. устоявшиеся, работающие технологии сжатия аудио битов ^[33], некоторые из них используют слуховое маскирование как часть своей фундаментальной конструкции, а некоторые демонстрируют аппаратные реализации в реальном времени.

Разработка

Возникновение технологии MP3 полностью описано в статье профессора Ханса Мусманна ^[34], который в течение нескольких лет возглавлял группу ISO MPEG Audio. В декабре 1988 года MPEG потребовал ввести стандарт кодирования звука. В июне 1989 года было представлено 14 алгоритмов кодирования звука. Из-за определенного сходства между этими предложениями по кодированию они были сгруппированы в четыре группы разработчиков. Первой группой была ASPEC, принадлежащая Fraunhofer Gesellschaft , AT&T , France Telecom , Deutsche и Thomson-Brandt . Вторую группу составили MUSICAM от Matsushita , CCETT , ITT и Philips . Третьей группой была ATAC, принадлежащая Fujitsu , JVC , NEC и Sony . И четвертая группа - SB-ADPCM от NTT и BTRL. ^[34]

Непосредственными предшественниками MP3 были «Оптимальное кодирование в частотной области» (OCF), ^[35] и Perceptual Transform Coding (PXFM). ^[36] Эти два кодека, вместе с вкладом Thomson-Brandt в переключение блоков, были объединены в кодек под названием ASPEC, который был представлен в MPEG и выиграл соревнование по качеству, но был ошибочно отвергнут как слишком сложный для реализации. Первой практической реализацией кодера восприятия звука (OCF) на аппаратном уровне (оборудование Краснера было слишком громоздким и медленным для практического использования) была реализация кодера психоакустического преобразования на базе микросхем Motorola 56000 DSP .

Другой предшественник формата и технологии MP3 можно найти в перцепционном кодеке MUSICAM, основанном на наборе фильтров целочисленной арифметики из 32 поддиапазонов, управляемом психоакустической моделью. Он был в первую очередь разработан для цифрового аудиовещания (цифрового радио) и цифрового телевидения, и его основные принципы были раскрыты научному сообществу CCETT (Франция) и IRT (Германия) в Атланте во время конференции IEEE-ICASSP в 1991 г. ^[37] после работы над MUSICAM с Matsushita и Philips с 1989 года. ^[34]

Этот кодек, включенный в систему вещания с использованием модуляции COFDM, был продемонстрирован в эфире и в полевых условиях ^[38] с Radio Canada и CRC Canada во время шоу NAB (Лас-Вегас) в 1991 году. Реализация звуковой части этой системы вещания была основана на на кодере с двумя микросхемами (один для преобразования поддиапазонов, один для психоакустической модели, разработанной группой Г. Штолля (IRT, Германия), позже известной как психоакустическая модель I) и декодере реального времени, использующем один работающий чип Motorola 56001 DSP программа для целочисленной арифметики, разработанная командой YF Dehery ( CCETT , Франция). Простота соответствующего декодера вместе с высоким качеством звука этого кодека, впервые использующего частоту дискретизации 48 кГц, входной формат 20 бит / отсчет (наивысший доступный стандарт дискретизации в 1991 г., совместимый с профессиональным цифровым стандартом AES / EBU). входной студийный стандарт) были основными причинами, по которым позже были приняты характеристики MUSICAM в качестве основных функций для усовершенствованного кодека сжатия цифровой музыки.

Во время разработки программного обеспечения для кодирования MUSICAM команда Столла и Дехери тщательно использовала набор высококачественных материалов для оценки звука ^[39], отобранных группой профессионалов в области звука из Европейского вещательного союза и позже использованных в качестве справочного материала для оценки. кодеков сжатия музыки. Метод кодирования поддиапазонов оказался эффективным не только для перцептивного кодирования высококачественных звуковых материалов, но особенно для кодирования критически важных ударных звуковых материалов (барабаны, треугольник и т. Д.) Из-за особого эффекта временной маскировки. набора фильтров поддиапазона MUSICAM (это преимущество является специфической особенностью методов кодирования с коротким преобразованием).

Будучи докторантом немецкого университета Эрланген-Нюрнберг , Карлхайнц Бранденбург начал работать над сжатием цифровой музыки в начале 1980-х годов, уделяя особое внимание тому, как люди воспринимают музыку. Он завершил свою докторскую работу в 1989 году. ^[40] MP3 является прямым потомком OCF и PXFM, представляя результат сотрудничества Бранденбурга - работы постдокторантом в лабораториях AT & T-Bell Labs с Джеймсом Д. Джонстоном («JJ») из AT & T-Bell Labs - с Институтом Фраунгофера интегральных схем , Эрланген (где он работал с Бернхардом Грилем и четырьмя другими исследователями - «Оригинальная шестерка» ^[41] ), с относительно незначительным вкладом из ветви MP2 психоакустических кодеров поддиапазонов. . В 1990 году Бранденбург стал доцентом в Эрлангене-Нюрнберге. В то время как он продолжал работать на сжатие музыки с учеными в Fraunhofer Society «s Генрих Герц института (в 1993 году он вошел в состав Fraunhofer HHI). ^[40] Песня " Tom's Diner " Сюзанны Вега была первой песней, которую Карлхайнц Бранденбург использовал для разработки MP3. Бранденбург использовал песню для тестирования, слушая ее снова и снова, каждый раз уточняя схему, чтобы убедиться, что она не повлияет отрицательно на тонкость голоса Веги. ^[42]

Стандартизация

В 1991 годе были доступны два предложения , которые были оценены для аудио стандарта MPEG: MUSICAM ( М просят шаблон адаптировать U niversal S ubband Я ntegrated С Одингом й М ultiplexing) и АСПЭК ( daptive S pectral Р erceptual Х ntropy С Одингом). Метод MUSICAM, предложенный Philips (Нидерланды), CCETT (Франция), Институтом технологий вещания (Германия) и Matsushita (Япония), ^[43] был выбран из-за его простоты и устойчивости к ошибкам, а также из-за его высокой уровень вычислительной эффективности. ^[44] Формат MUSICAM, основанный на кодировании поддиапазонов , стал основой для формата сжатия звука MPEG, включая, например, его структуру кадра, формат заголовка, частоту дискретизации и т. Д.

Хотя большая часть технологии и идей MUSICAM была включена в определение MPEG Audio Layer I и Layer II, только банк фильтров и структура данных, основанная на кадрировании 1152 отсчетов (формат файла и байтовый поток) MUSICAM, остались на уровне III ( MP3) как часть вычислительно неэффективного гибридного банка фильтров . Под председательством профессора Мусманна из Университета Лейбница в Ганновере редактирование стандарта было поручено Леону ван де Керкхофу (Нидерланды), Герхарду Штоллю (Германия) и Ив-Франсуа Дехери (Франция), которые работали над Layer I и Layer. II. ASPEC был совместным предложением AT&T Bell Laboratories, Thomson Consumer Electronics, Общества Фраунгофера и CNET . ^[45] Это обеспечило высочайшую эффективность кодирования.

Рабочая группа , состоящая из фургона де Kerkhof, Stoll, Леонардо Чиариглен ( CSELT В.П. медиа), Ив-Франсуа Dehery, Карлхайнц Бранденбург (Германия) и Джеймс Д. Джонстон (Соединенные Штаты Америки) приняли идеи из АСПЭК, интегрированный фильтр банка от уровня II, добавил некоторые из своих собственных идей, такие как совместное стереокодирование MUSICAM, и создал формат MP3, который был разработан для достижения того же качества при 128 кбит / с, что и MP2 на 192 кбит / с.

Алгоритмы для MPEG-1 Audio Layer I, II и III были одобрены в 1991 году ^[11]^[12] и завершены в 1992 году ^[13] как часть MPEG-1 , первого стандартного пакета MPEG , результатом которого стал международный стандарт ISO / IEC 11172-3 (также известный как MPEG-1 Audio или MPEG-1 Part 3 ), опубликованный в 1993 году. ^[6] Файлы или потоки данных, соответствующие этому стандарту, должны обрабатывать частоты дискретизации 48k, 44100 и 32k и по-прежнему поддерживаться текущими MP3-плеерами и декодерами. Таким образом, первое поколение MP3 определило $14 \times 3 = 42$ интерпретации структур данных кадра MP3 и макетов размеров.

Дальнейшая работа над аудио MPEG ^[46] была завершена в 1994 году как часть второго набора стандартов MPEG, MPEG-2 , более официально известного как международный стандарт ISO / IEC 13818-3 (также известный как MPEG-2 Part 3 или обратно совместимый MPEG- 2 Audio или MPEG-2 Audio BC ^[14] ), первоначально опубликованный в 1995 году. ^[7]^[47] MPEG-2 Part 3 (ISO / IEC 13818-3) определил 42 дополнительных битрейта и частоты дискретизации для MPEG-1 Audio. Слой I, II и III. Новые частоты дискретизации ровно вдвое ниже тех, что были изначально определены в MPEG-1 Audio. Это снижение частоты дискретизации позволяет вдвое сократить доступную точность воспроизведения частоты, а также снизить битрейт на 50%. MPEG-2 Part 3 также улучшил качество звука MPEG-1, позволив кодировать аудиопрограммы с более чем двумя каналами, вплоть до многоканальности 5.1. ^[46] MP3, закодированный в MPEG-2, дает половину полосы пропускания воспроизведения MPEG-1, подходящего для фортепиано и пения.

Третье поколение потоков данных (файлов) в стиле «MP3» расширило идеи и реализацию MPEG-2, но было названо аудио MPEG-2.5 , поскольку MPEG-3 уже имел другое значение. Это расширение было разработано Fraunhofer IIS, зарегистрированными патентообладателями MP3, путем уменьшения поля кадровой синхронизации в заголовке MP3 с 12 до 11 бит. Как и при переходе от MPEG-1 к MPEG-2, MPEG-2.5 добавляет дополнительные частоты дискретизации ровно вдвое меньше тех, которые доступны при использовании MPEG-2. Таким образом, он расширяет сферу применения MP3, включая человеческую речь и другие приложения, но при этом требует только 25% полосы пропускания (частотного воспроизведения), возможной при использовании частот дискретизации MPEG-1. Хотя MPEG-2.5 не является признанным стандартом ISO, он широко поддерживается как недорогими китайскими, так и фирменными цифровыми аудиоплеерами, а также кодировщиками MP3 ( LAME ), декодерами (FFmpeg) и плеерами (MPC) на основе компьютерного программного обеспечения, с добавлением $3 \times 8 = 24$ дополнительных типа кадров MP3. Таким образом, каждое поколение MP3 поддерживает 3 частоты дискретизации, ровно вдвое меньшие, чем у предыдущего поколения, всего 9 разновидностей файлов формата MP3. Таблица сравнения частот дискретизации между MPEG-1, 2 и 2.5 приведена ниже в статье. ^[48]^[49] MPEG-2.5 поддерживается LAME (с 2000 г.), Media Player Classic (MPC), iTunes и FFmpeg.

MPEG-2.5 не был разработан MPEG (см. Выше) и никогда не был утвержден в качестве международного стандарта. Таким образом, MPEG-2.5 является неофициальным или проприетарным расширением формата MP3. Тем не менее, он широко распространен и особенно полезен для приложений, использующих человеческую речь с низкой скоростью передачи данных.

Версии MPEG Audio Layer III ^[6]^[7]^[12]^[48]^[49]^[50]
Версия	Международный стандарт ^[*]	Дата публичного выпуска первого издания	Дата публичного выпуска последней редакции
MPEG-1 Audio Layer III	ISO / IEC 11172-3 (MPEG-1, часть 3)	1993 г.
MPEG-2 Audio Layer III	ISO / IEC 13818-3 (MPEG-2, часть 3)	1995 г.	1998 г.
MPEG-2.5 Audio Layer III	нестандартный, проприетарный	2000 г.	2008 г.

Стандарт ISO / IEC 11172-3 (также известный как MPEG-1 Audio) определяет три формата: MPEG-1 Audio Layer I, Layer II и Layer III. Стандарт ISO / IEC 13818-3 (также известный как MPEG-2 Audio) определил расширенную версию MPEG-1 Audio: MPEG-2 Audio Layer I, Layer II и Layer III. Аудио MPEG-2 (MPEG-2, часть 3) не следует путать с MPEG-2 AAC (MPEG-2, часть 7 - ISO / IEC 13818-7). ^[14]

Эффективность сжатия кодеров обычно определяется битовой скоростью, поскольку степень сжатия зависит от битовой глубины и частоты дискретизации входного сигнала. Тем не менее, степени сжатия часто публикуются. Они могут использовать параметры компакт-диска (CD) в качестве эталонов (44,1 кГц , 2 канала по 16 бит на канал или 2 × 16 бит) или иногда параметры SP цифровой аудиоленты (DAT) (48 кГц, 2 × 16 бит). . Коэффициенты сжатия для этого последнего эталона выше, что демонстрирует проблему с использованием термина степень сжатия для кодеров с потерями.

Карлхайнц Бранденбург использовал CD-запись песни Сюзанны Вега " Tom's Diner " для оценки и уточнения алгоритма сжатия MP3 . Эта песня была выбрана из-за ее почти монофонической природы и широкого спектрального содержания, что позволяет легче услышать недостатки в формате сжатия во время воспроизведения. Некоторые называют Сюзанну Вега «матерью MP3». ^[51] Эта конкретная дорожка имеет интересное свойство в том, что два канала почти, но не полностью, одинаковы, что приводит к случаю, когда бинауральное снижение уровня маскирования вызывает пространственное демаскирование шумовых артефактов, если кодер должным образом не распознает ситуацию и не применяет исправления. аналогичны описанным в психоакустической модели MPEG-2 AAC. Некоторые более важные звуковые отрывки ( глокеншпиль , треугольник , аккордеон и т. Д.) Были взяты с эталонного компакт-диска EBU V3 / SQAM и использовались профессиональными звукорежиссерами для оценки субъективного качества аудиоформатов MPEG. LAME - самый продвинутый кодировщик MP3. LAME включает в себя кодирование с переменной скоростью передачи данных VBR, которое использует параметр качества, а не целевую скорость передачи данных. Более поздние версии 2008+) поддерживают цель качества n.nnn, которая автоматически выбирает частоту дискретизации MPEG-2 или MPEG-2.5, подходящую для записей человеческой речи, для которых требуется только разрешение полосы пропускания 5512 Гц.

Выход на публику

Реализация эталонного программного обеспечения для моделирования, написанная на языке C и позже известная как ISO 11172-5 , была разработана (в 1991–1996 гг.) Членами комитета ISO MPEG Audio для создания битовых совместимых файлов MPEG Audio (Layer 1, Слой 2, Слой 3). Он был одобрен как проект технического отчета ИСО / МЭК в марте 1994 г. и напечатан как документ CD 11172-5 в апреле 1994 г. ^[52] Он был одобрен как проект технического отчета (DTR / DIS) в ноябре 1994 г. ^{[53] ]} завершена в 1996 году и опубликован в качестве международного стандарта ISO / IEC TR 11172-5: 1998 в 1998 году ^[54] ссылки программного обеспечения на C языке была позже опубликована в свободном доступе стандарта ISO. ^[55] Работая не в реальном времени в ряде операционных систем, он смог продемонстрировать первое аппаратное декодирование в реальном времени (на основе DSP ) сжатого звука. Некоторые другие реализации кодеров и декодеров MPEG Audio в реальном времени ^[56] были доступны для целей цифрового вещания (радио DAB , телевидение DVB ) на потребительские приемники и телевизионные приставки.

7 июля 1994 года Общество Фраунгофера выпустило первый программный кодировщик MP3 под названием l3enc . ^[57] Расширение имени файла .mp3 было выбрано группой Фраунгофера 14 июля 1995 г. (ранее файлы назывались .bit ). ^[1] С первым программным обеспечением MP3-плеера реального времени WinPlay3 (выпущенным 9 сентября 1995 г.) многие люди смогли кодировать и воспроизводить файлы MP3 на своих ПК. Из-за относительно небольших жестких дисков той эпохи (≈500–1000 МБ ) сжатие с потерями было необходимо для хранения музыки из нескольких альбомов на домашнем компьютере в виде полных записей (в отличие от MIDI- нотации или файлов трекера, которые объединяли нотацию с короткие записи инструментов, играющих отдельные ноты). Как отмечает исследователь звука Джонатан Стерн: «Австралийский хакер приобрел l3enc, используя украденную кредитную карту. Затем хакер перепроектировал программное обеспечение, написал новый пользовательский интерфейс и бесплатно распространял его, назвав его« спасибо Фраунгофер »». ^[58]

Пример реализации фраунгофера

Хакер по имени SoloH обнаружил исходный код эталонной реализации MPEG dist10 вскоре после ее выпуска на серверах Университета Эрлангена . Он разработал более качественную версию и распространил ее в Интернете. Этот код положил начало широко распространенному копированию компакт-дисков и распространению цифровой музыки в формате MP3 через Интернет. ^[59]^[60]^[61]^[62]

Интернет-распространение

Во второй половине 1990-х файлы MP3 начали распространяться в Интернете , часто через подпольные сети пиратских песен. Первый известный эксперимент по распространению через Интернет был организован в начале 1990-х годов подпольным музыкальным архивом Интернета, более известным под аббревиатурой IUMA. После некоторых экспериментов ^[63] с использованием несжатых аудиофайлов этот архив начал доставлять в собственный всемирный низкоскоростной Интернет некоторые сжатые аудиофайлы MPEG, использующие формат MP2 (Layer II), а затем использованные файлы MP3, когда стандарт был полностью завершен. Популярность MP3 - файлов начал быстро расти с появлением Nullsoft аудио плеера с Winamp , выпущенный в 1997 году В 1998 году первый портативный твердотельный цифровой аудиоплеер MPMan , разработанный информационных систем SAEHAN , которая является штаб - квартирой в Сеуле , Южная Корея , был выпущен, и Rio PMP300 был продан впоследствии в 1998 году, несмотря на попытки судебного пресечения со стороны RIAA . ^[64]

В ноябре 1997 года сайт mp3.com бесплатно предлагал тысячи MP3-файлов, созданных независимыми артистами. ^[64] Небольшой размер файлов MP3 позволил широко распространить одноранговый обмен файлами музыки, скопированной с компакт-дисков, что ранее было почти невозможно. Первая большая одноранговая сеть обмена файлами, Napster , была запущена в 1999 году. Простота создания и обмена файлами MP3 привела к повсеместным нарушениям авторских прав . Крупные звукозаписывающие компании утверждали, что такое бесплатное распространение музыки снижает продажи, и называли это « музыкальным пиратством ». Они отреагировали возбуждением судебных исков против Napster (который в конечном итоге был закрыт, а затем продан) и против отдельных пользователей, которые участвовали в обмене файлами. ^[65]

Несанкционированный обмен файлами MP3 продолжается в одноранговых сетях нового поколения . Некоторые авторизованные сервисы, такие как Beatport , Bleep , Juno Records , eMusic , Zune Marketplace , Walmart.com , Rhapsody , реинкарнация Napster , одобренная звукозаписывающей индустрией , и Amazon.com продают музыку в формате MP3 без ограничений.

Дизайн

Файловая структура

Схема структуры файла MP3 (MPEG версии 2.5 не поддерживается, поэтому для MP3 Sync Word 12 бит вместо 11).

Файл MP3 состоит из кадров MP3, которые состоят из заголовка и блока данных. Эта последовательность кадров называется элементарным потоком . Из-за «битового резервуара» кадры не являются независимыми элементами и обычно не могут быть извлечены на произвольных границах кадра. Блоки данных MP3 содержат (сжатую) звуковую информацию в терминах частот и амплитуд. На схеме показано, что заголовок MP3 состоит из слова синхронизации , которое используется для определения начала допустимого кадра. За ним следует бит, указывающий, что это стандарт MPEG, и два бита, указывающие, что используется уровень 3; отсюда MPEG-1 Audio Layer 3 или MP3. После этого значения будут отличаться в зависимости от файла MP3. ISO / IEC 11172-3 определяет диапазон значений для каждого раздела заголовка вместе со спецификацией заголовка. Большинство файлов MP3 сегодня содержат метаданные ID3 , которые предшествуют кадрам MP3 или следуют за ними, как показано на схеме. Поток данных может содержать необязательную контрольную сумму.

Совместное стерео выполняется только покадрово. ^[66]

Кодирование и декодирование

Алгоритм кодирования MP3 обычно делится на четыре части. Часть 1 делит аудиосигнал на более мелкие части, называемые кадрами, и затем на выходе выполняется фильтр модифицированного дискретного косинусного преобразования (MDCT). Часть 2 передает образец в 1024-точечное быстрое преобразование Фурье (БПФ), затем применяется психоакустическая модель и на выходе выполняется другой фильтр MDCT. Часть 3 количественно определяет и кодирует каждую выборку, известную как выделение шума, которое подстраивается под себя, чтобы соответствовать требованиям к скорости передачи данных и маскированию звука . Часть 4 форматирует поток битов , называемый аудиокадром, который состоит из 4 частей: заголовка , проверки ошибок , аудиоданных и вспомогательных данных . ^[31]

Стандарт MPEG-1 не включает точную спецификацию для кодировщика MP3, но предоставляет примеры психоакустических моделей, петли скорости и т.п. в ненормативной части исходного стандарта. ^[67] MPEG-2 удваивает количество поддерживаемых частот дискретизации, а MPEG-2.5 добавляет еще 3. Когда это было написано, предлагаемые реализации были довольно устаревшими. Разработчики стандарта должны были разработать свои собственные алгоритмы, подходящие для удаления части информации из аудиовхода. В результате стало доступно множество различных кодировщиков MP3, каждый из которых производит файлы разного качества. Сравнения были широко доступны, поэтому потенциальному пользователю кодировщика было легко найти лучший выбор. Некоторые кодеры, которые умели кодировать с более высокими скоростями передачи (например, LAME ), не обязательно были так же хороши при более низких скоростях передачи данных. Со временем LAME развился на веб-сайте SourceForge, пока не стал де-факто кодировщиком CBR MP3. Позже был добавлен режим ABR. Продолжалась работа над истинной переменной скоростью передачи данных с использованием цели качества от 0 до 10. В конечном итоге числа (такие как -V 9.600) могли генерировать превосходное качество кодирования голоса с низкой скоростью передачи данных всего лишь со скоростью 41 кбит / с с использованием расширений MPEG-2.5.

Во время кодирования берутся 576 отсчетов во временной области, которые преобразуются в 576 отсчетов частотной области . ^{[ требуется пояснение ]} Если есть переходный процесс , вместо 576 берутся 192 отсчета. Это делается для ограничения временного распространения шума квантования, сопровождающего переходный процесс (см. психоакустику ). Разрешение по частоте ограничено небольшим размером окна длинного блока, что снижает эффективность кодирования. ^[66] Временное разрешение может быть слишком низким для переходных сигналов и может вызвать размытие перкуссионных звуков. ^[66]

Из-за древовидной структуры банка фильтров проблемы с опережающим эхом усугубляются, поскольку комбинированная импульсная характеристика двух банков фильтров не может и не может обеспечить оптимальное решение с точки зрения разрешения по времени / частоте. ^[66] Кроме того, объединение выходных сигналов двух банков фильтров создает проблемы наложения спектров, которые должны частично решаться на этапе «компенсации наложения спектров»; однако это создает избыточную энергию для кодирования в частотной области, тем самым снижая эффективность кодирования. ^{[ необходима цитата ]}

С другой стороны, декодирование тщательно определено в стандарте. Большинство декодеров " совместимы с потоком битов ", что означает, что распакованный вывод, который они производят из данного файла MP3, будет таким же, с заданной степенью допуска округления , как вывод, указанный математически в документе высокого стандарта ISO / IEC (ISO / МЭК 11172-3). Следовательно, сравнение декодеров обычно основывается на их вычислительной эффективности (т. Е. На том, сколько памяти или процессорного времени они используют в процессе декодирования). Со временем эта проблема стала менее серьезной, поскольку частота процессора изменилась с МГц на ГГц. Общая задержка кодировщика / декодера не определена, что означает отсутствие официального положения о воспроизведении без пауз . Однако некоторые кодировщики, такие как LAME, могут прикреплять дополнительные метаданные, которые позволят игрокам, которые могут их обработать, обеспечить плавное воспроизведение.

Качество

При выполнении кодирования звука с потерями, такого как создание потока данных MP3, существует компромисс между объемом сгенерированных данных и качеством звука результатов. Человек, создающий MP3, выбирает битрейт , который определяет, сколько килобит в секунду звука требуется. Чем выше скорость передачи данных, тем больше будет поток данных MP3 и, как правило, тем ближе он будет звучать к исходной записи. При слишком низкой скорости передачи данных при воспроизведении могут быть слышны артефакты сжатия (т. Е. Звуки, отсутствующие в исходной записи). Некоторый звук сложно сжать из-за его случайности и резких атак. Когда этот тип звука сжимается, обычно слышны такие артефакты, как звон или пре-эхо . Образец аплодисментов или инструмент в виде треугольника с относительно низкой скоростью передачи данных являются хорошими примерами артефактов сжатия. Большинство субъективных тестов перцепционных кодеков, как правило, избегают использования этих типов звуковых материалов, однако артефакты, генерируемые ударными звуками, едва заметны из-за специфической функции временного маскирования 32-х поддиапазонного набора фильтров уровня II, на котором основан формат. .

Помимо скорости передачи данных в кодированном фрагменте звука, качество звука в формате MP3 также зависит от качества алгоритма кодировщика, а также от сложности кодируемого сигнала. Поскольку стандарт MP3 допускает некоторую свободу действий с алгоритмами кодирования, разные кодировщики имеют совершенно разное качество даже при одинаковых скоростях передачи данных. Например, в тесте публичного прослушивания с двумя ранними кодировщиками MP3, установленными на скорости около 128 кбит / с ^[68], один набрал 3,66 по шкале от 1 до 5, а другой - только 2,22. Качество зависит от выбора кодировщика и параметров кодирования. ^[69]

Это наблюдение произвело революцию в кодировании звука. Раньше битрейт был главным и единственным соображением. В то время файлы MP3 были самого простого типа: они использовали одинаковую скорость передачи данных для всего файла: этот процесс известен как кодирование с постоянной скоростью передачи данных (CBR). Использование постоянной скорости передачи данных упрощает кодирование и снижает нагрузку на процессор. Однако также можно создавать файлы, в которых скорость передачи данных изменяется по всему файлу. Они известны как переменная скорость передачи данных . Резервуар битов и кодирование VBR фактически были частью исходного стандарта MPEG-1. Их концепция заключается в том, что в любом звуковом фрагменте некоторые разделы легче сжимать, например тишину или музыку, содержащую только несколько тонов, в то время как другие сжимать труднее. Таким образом, общее качество файла можно повысить, используя более низкую скорость передачи данных для менее сложных фрагментов и более высокую скорость для более сложных частей. С некоторыми усовершенствованными кодировщиками MP3 можно указать заданное качество, и кодировщик соответствующим образом отрегулирует скорость передачи данных. Пользователи, которым нужна определенная «настройка качества», которая прозрачна для их ушей, могут использовать это значение при кодировании всей своей музыки, и, вообще говоря, им не нужно беспокоиться о выполнении личных тестов прослушивания для каждого музыкального произведения, чтобы определить правильную скорость передачи данных.

На воспринимаемое качество может влиять среда прослушивания (окружающий шум), внимание слушателя и его подготовка, а также, в большинстве случаев, звуковое оборудование слушателя (например, звуковые карты, динамики и наушники). Кроме того, достаточное качество может быть достигнуто за счет более низкой настройки качества для лекций и приложений с человеческой речью, а также за счет уменьшения времени и сложности кодирования. Тест, проведенный для новых студентов профессором музыки Стэнфордского университета Джонатаном Бергером, показал, что предпочтение студентов музыке в формате MP3 растет с каждым годом. Бергер сказал, что студенты, похоже, предпочитают «шипящие» звуки, которые MP3 привносят в музыку. ^[70]

Углубленное исследование качества звука MP3, проект звукооператора и композитора Райана Магуайра «Призрак в MP3» позволяет выделить звуки, потерянные во время сжатия MP3. В 2015 году он выпустил трек «moDernisT» (анаграмма «Tom's Diner»), составленный исключительно из звуков, удаленных во время сжатия MP3 песни «Tom's Diner», ^[71]^[72]^[73] трек, который использовался изначально. в формулировке стандарта MP3. Подробный отчет о методах, используемых для выделения звуков, удаленных во время сжатия MP3, а также концептуальная мотивация проекта были опубликованы в Трудах Международной компьютерной музыкальной конференции 2014 года. ^[74]

Битрейт

Доступные скорости передачи данных MPEG Audio Layer III (кбит / с) ^[12]^[48]^[49]^[50]^[75]
MPEG-1 Audio Layer III	MPEG-2 Audio Layer III	MPEG-2.5 Audio Layer III
-	8	8
-	16	16
-	24	24
32	32	32
40	40	40
48	48	48
56	56	56
64	64	64
80	80	-
96	96	-
112	112	-
128	128	-
н / д	144	-
160	160	-
192	-	-
224	-	-
256	-	-
320	-	-

Поддерживаемые частоты дискретизации
MPEG Audio Format ^[12]^[48]^[49]^[50]
MPEG-1 Audio Layer III	MPEG-2 Audio Layer III	MPEG-2.5 Audio Layer III
-	-	8000 Гц
-	-	11025 Гц
-	-	12000 Гц
-	16000 Гц	-
-	22050 Гц	-
-	24000 Гц	-
32000 Гц	-	-
44100 Гц	-	-
48000 Гц	-	-

Битрейт - это произведение частоты дискретизации и количества бит на образец, используемых для кодирования музыки. CD-звук - 44100 отсчетов в секунду. Количество битов на выборку также зависит от количества аудиоканалов. CD - стерео и 16 бит на канал. Итак, умножение 44100 на 32 дает 1411200 - битрейт несжатого цифрового аудио CD. MP3 был разработан для кодирования этих данных со скоростью 1411 кбит / с со скоростью 320 кбит / с или меньше. Поскольку алгоритмы MP3 обнаруживают менее сложные отрывки, можно использовать более низкие битрейты. При использовании MPEG-2 вместо MPEG-1 MP3 поддерживает только более низкие частоты дискретизации (16000, 22050 или 24000 отсчетов в секунду) и предлагает выбор скорости передачи данных от 8 кбит / с, но не выше 160 кбит / с. Уменьшая частоту дискретизации, уровень III MPEG-2 удаляет все частоты, превышающие половину новой частоты дискретизации, которая могла присутствовать в исходном звуке.

Как показано в этих двух таблицах, в стандарте MPEG-1 Audio Layer III разрешены 14 выбранных битрейтов : 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 и 320 кбит. / с, а также 3 самых высоких доступных частоты дискретизации : 32, 44,1 и 48 кГц . ^[49] MPEG-2 Audio Layer III также допускает 14 несколько различных (и в основном более низких) битрейтов : 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 кбит. / с с частотами дискретизации 16, 22,05 и 24 кГц, что ровно вдвое меньше, чем у MPEG-1 ^[49]. Кадры MPEG-2.5 Audio Layer III ограничены только 8 битовыми скоростями 8, 16, 24, 32, 40, 48. , 56 и 64 кбит / с с 3 еще более низкими частотами дискретизации : 8, 11,025 и 12 кГц. ^{[ необходима цитата ]} В более ранних системах, которые поддерживали только стандарт MPEG-1 Audio Layer III, файлы MP3 с битовой скоростью ниже 32 кбит / с могли воспроизводиться с ускорением и повышением частоты.

В более ранних системах также отсутствуют элементы управления быстрой перемоткой вперед и назад при воспроизведении MP3. ^[76]^[77]

Кадры MPEG-1 содержат наибольшую детализацию в режиме 320 кбит / с, максимально допустимой скорости передачи данных ^[78] с тишиной и простыми тональными сигналами, по-прежнему требующими 32 кбит / с. Кадры MPEG-2 могут захватывать воспроизведение звука с частотой до 12 кГц, необходимое до 160 кбит / с. Файлы MP3, созданные с помощью MPEG-2, не имеют полосы пропускания 20 кГц из-за теоремы выборки Найквиста – Шеннона . Воспроизведение частоты всегда строго меньше половины частоты дискретизации, а несовершенные фильтры требуют большей погрешности (уровень шума в зависимости от резкости фильтра), поэтому частота дискретизации 8 кГц ограничивает максимальную частоту до 4 кГц, а частота дискретизации 48 кГц. скорость ограничивает воспроизведение звука MP3 до 24 кГц. MPEG-2 использует половину, а MPEG-2.5 только четверть частот дискретизации MPEG-1.

Для общей области воспроизведения человеческой речи полосы частот 5512 Гц достаточно для получения отличных результатов (для голоса) с использованием частоты дискретизации 11025 и кодирования VBR из 44100 (стандартного) файла WAV. У носителей английского языка в среднем 41–42 кбит / с при настройке -V 9.6, но это может варьироваться в зависимости от количества записываемой тишины или скорости доставки (слов в минуту). Передискретизация до 12000 (полоса пропускания 6K) выбирается параметром LAME -V 9.4. Аналогично -V 9.2 выбирает частоту дискретизации 16000 и результирующую фильтрацию нижних частот 8K. Для получения дополнительной информации см. Найквист - Шеннон. Более старые версии LAME и FFmpeg поддерживают только целочисленные аргументы для параметра выбора качества с переменной скоростью передачи данных. Параметр качества n.nnn (-V) задокументирован на lame.sourceforge.net, но поддерживается только в LAME с новым типом селектора качества с переменной скоростью передачи данных VBR, а не средней скоростью передачи данных (ABR).

Частота дискретизации 44,1 кГц обычно используется для воспроизведения музыки, потому что она также используется для аудио компакт-дисков , основного источника, используемого для создания файлов MP3. В Интернете используются самые разные скорости передачи данных. Обычно используется скорость 128 кбит / с ^[79] при степени сжатия 11: 1, что обеспечивает адекватное качество звука в относительно небольшом пространстве. Поскольку доступность полосы пропускания Интернета и размеры жестких дисков увеличились, широкое распространение получили более высокие скорости передачи данных до 320 кбит / с. Несжатый звук, хранящийся на аудио-компакт-диске, имеет скорость передачи данных 1411,2 кбит / с (16 бит / выборка × 44100 выборок / секунду × 2 канала / 1000 бит / килобит), поэтому скорость передачи данных составляет 128, 160 и 192 кбит / с. представляют собой степени сжатия приблизительно 11: 1, 9: 1 и 7: 1 соответственно.

Нестандартная скорость передачи данных до 640 кбит / с может быть достигнута с помощью кодировщика LAME и опции свободного формата, хотя некоторые MP3-плееры могут воспроизводить эти файлы. Согласно стандарту ISO от декодеров требуется только возможность декодировать потоки до 320 кбит / с. ^[80]^[81]^[82] Ранние кодеры MPEG Layer III использовали то, что теперь называется постоянной скоростью передачи данных (CBR). Программа могла использовать только единый битрейт для всех кадров в файле MP3. Позже более сложные кодеры MP3 смогли использовать битовый резервуар для определения средней скорости передачи битов, выбирая скорость кодирования для каждого кадра на основе сложности звука в этой части записи.

Более сложный кодировщик MP3 может воспроизводить аудио с переменной скоростью передачи данных . Аудио MPEG может использовать переключение битрейта на покадровой основе, но только декодеры уровня III должны его поддерживать. ^[49]^[83]^[84]^[85] VBR используется, когда целью является достижение фиксированного уровня качества. Конечный размер файла в кодировке VBR менее предсказуем, чем с постоянным битрейтом . Средний битрейт - это тип VBR, реализованный как компромисс между ними: битрейт может изменяться для более стабильного качества, но контролируется таким образом, чтобы он оставался близким к среднему значению, выбранному пользователем, для предсказуемых размеров файла. Хотя декодер MP3 должен поддерживать VBR, чтобы соответствовать стандартам, исторически некоторые декодеры имели ошибки с декодированием VBR, особенно до того, как кодеры VBR получили широкое распространение. Наиболее развитый кодировщик LAME MP3 поддерживает генерацию VBR, ABR и даже более старые форматы CBR MP3.

Аудио уровня III может также использовать «битовый резервуар», способность частично полного кадра удерживать часть аудиоданных следующего кадра, что позволяет временно изменять эффективный битрейт даже в потоке с постоянным битрейтом. ^[49]^[83] Внутренняя обработка резервуара битов увеличивает задержку кодирования. ^{[ необходима цитата ]} Не существует диапазона 21 масштабного коэффициента (sfb21) для частот выше примерно 16 кГц , что вынуждает кодировщик выбирать между менее точным представлением в диапазоне 21 или менее эффективным хранением во всех диапазонах ниже диапазона 21, последнее приводит к потере битрейта в кодировке VBR. ^[86]

Вспомогательные данные

Поле вспомогательных данных может использоваться для хранения данных, определенных пользователем. Вспомогательные данные являются необязательными, и количество доступных битов явно не указывается. Вспомогательные данные располагаются после битов кода Хаффмана и находятся в диапазоне от точки main_data_begin следующего кадра. Кодировщик mp3PRO использовал вспомогательные данные для кодирования дополнительной информации, которая могла улучшить качество звука при декодировании с помощью его собственного алгоритма.

Метаданные

«Тег» в аудиофайле - это раздел файла, который содержит метаданные, такие как название, исполнитель, альбом, номер дорожки или другую информацию о содержимом файла. Стандарты MP3 не определяют форматы тегов для файлов MP3, также нет стандартного формата контейнера , который поддерживал бы метаданные и устранял необходимость в тегах. Однако существует несколько де-факто стандартов для форматов тегов. По состоянию на 2010 год наиболее распространенными являются ID3v1 и ID3v2 , а также недавно представленный APEv2 . Эти теги обычно встраиваются в начало или конец файлов MP3, отдельно от фактических данных кадра MP3. Декодеры MP3 либо извлекают информацию из тегов, либо просто обрабатывают их как игнорируемые ненужные данные, отличные от MP3.

Программное обеспечение для воспроизведения и редактирования часто содержит функции редактирования тегов, но существуют также приложения для редактирования тегов, специально предназначенные для этой цели. Помимо метаданных, относящихся к аудиоконтенту, для DRM также могут использоваться теги . ^[87] ReplayGain - это стандарт для измерения и сохранения громкости файла MP3 ( нормализация звука ) в его теге метаданных, позволяющий проигрывателю, совместимому с ReplayGain, автоматически регулировать общую громкость воспроизведения для каждого файла. MP3Gain можно использовать для обратимого изменения файлов на основе измерений ReplayGain, чтобы можно было добиться скорректированного воспроизведения на плеерах без возможности ReplayGain.

Лицензирование, право собственности и законодательство

Базовая технология декодирования и кодирования MP3 не имеет патентов в Европейском Союзе, причем срок действия всех патентов истекает не позднее 2012 года. В США технология стала практически свободной от патентов 16 апреля 2017 г. (см. Ниже). Патенты на MP3 истекли в США в период с 2007 по 2017 год. В прошлом многие организации заявляли о правах собственности на патенты, связанные с декодированием или кодированием MP3. Эти претензии привели к ряду юридических угроз и действий из различных источников. В результате неуверенность в том, какие патенты должны быть лицензированы для создания продуктов MP3 без нарушения патентных прав в странах, где разрешены патенты на программное обеспечение, была общей чертой на ранних этапах внедрения технологии.

Первоначальный почти полный стандарт MPEG-1 (части 1, 2 и 3) был публично доступен 6 декабря 1991 года как ISO CD 11172. ^[88]^[89] В большинстве стран патенты не могут быть поданы после того, как предшествующий уровень техники был обнародован. , а срок действия патентов истекает через 20 лет после даты первоначальной подачи, которая может быть до 12 месяцев позже для заявок в других странах. В результате в большинстве стран срок действия патентов, необходимых для реализации MP3, истек к декабрю 2012 года, через 21 год после публикации ISO CD 11172.

Исключением являются Соединенные Штаты, где действующие патенты, поданные до 8 июня 1995 г., истекают по истечении 17 лет с даты выдачи или 20 лет с даты приоритета. Длительный процесс рассмотрения патентов может привести к выдаче патента намного позже, чем обычно ожидается (см. Патенты на подводные лодки ). Срок действия различных патентов, связанных с MP3, истек с 2007 по 2017 год в США. ^[90] Патенты на все, что раскрыто в ISO CD 11172, поданное через год или более после его публикации, вызывают сомнения. Если рассматривать только известные патенты MP3, поданные к декабрю 1992 г., то декодирование MP3 не является патентованным в США с 22 сентября 2015 г., когда истек срок действия патента США № 5 812 672 , на который была подана РСТ в октябре 1992 г. ^[91]^[92]^[93] Если принять в качестве меры самый длительный патент, упомянутый в вышеупомянутых ссылках, то технология MP3 стала свободной от патента в Соединенных Штатах 16 апреля 2017 года, когда патент США 6 009399 удерживал ^{[ 94]} и администрируется Technicolor , ^[95] истек. В результате многие проекты бесплатного программного обеспечения и программного обеспечения с открытым исходным кодом , такие как операционная система Fedora , решили начать доставку поддержки MP3 по умолчанию, и пользователям больше не придется прибегать к установке неофициальных пакетов, поддерживаемых сторонними репозиториями программного обеспечения для MP3. воспроизведение или кодирование. ^[96]

Technicolor (ранее называвшаяся Thomson Consumer Electronics) утверждал, что контролирует лицензирование MP3 патентов третьего уровня во многих странах, включая США, Японию, Канаду и страны ЕС. ^[97] Technicolor активно добивалась соблюдения этих патентов. ^[98] Доходы от лицензий на MP3 от администрации Technicolor принесли Обществу Фраунгофера около 100 миллионов евро в 2005 году. ^[99] В сентябре 1998 года Институт Фраунгофера направил письмо нескольким разработчикам программного обеспечения MP3, в котором говорилось, что лицензия необходима для «распространения и распространения». / или продавать декодеры и / или кодеры ». В письме утверждалось, что нелицензионные продукты «нарушают патентные права Fraunhofer и Thomson. Чтобы производить, продавать или распространять продукты с использованием стандарта [MPEG Layer-3] и, следовательно, наших патентов, вам необходимо получить у нас лицензию на эти патенты». ^[100] Это привело к ситуации, когда проект кодировщика LAME MP3 не мог предложить своим пользователям официальные двоичные файлы, которые можно было бы запускать на их компьютере. Положение проекта было то, что в качестве исходного кода, LAME был просто описание того , как MP3 - кодер может быть реализован. Неофициально скомпилированные двоичные файлы были доступны из других источников.

Sisvel SpA ^[101] и ее дочерняя компания в США Audio MPEG, Inc. ранее предъявили иск Thomson за нарушение патентных прав на технологию MP3 ^[102], но эти споры были разрешены в ноябре 2005 года, когда Sisvel предоставила Thomson лицензию на их патенты. Вскоре вслед за этим последовала компания Motorola, подписавшая с Sisvel лицензию на патенты, связанные с MP3, в декабре 2005 года. ^[103] За исключением трех патентов, все патенты США, находящиеся в ведении Sisvel ^[104], истекли в 2015 году. Три исключения: Патент США 5 878 080 срок действия истек в феврале 2017 г .; Патент США 5,850,456 , срок действия истек в феврале 2017 г .; и патента США 5,960,037 , срок действия истек 9 апреля 2017 г.

В сентябре 2006 года немецкие официальные лица изъяли MP3-плееры из киоска SanDisk на выставке IFA в Берлине после того, как итальянская патентная фирма выиграла судебный запрет от имени Sisvel против SanDisk в споре о лицензионных правах. Постановление было позже отменено берлинским судьей ^[105], но эта отмена, в свою очередь, была заблокирована в тот же день другим судьей из того же суда, «доставив патентный Дикий Запад в Германию», по словам одного комментатора. ^[106] В феврале 2007 года Texas MP3 Technologies подала в суд на Apple, Samsung Electronics и Sandisk в федеральный суд восточного Техаса , заявив о нарушении патента на портативный MP3-плеер, который, по утверждению Texas MP3, был передан. Apple, Samsung и Sandisk урегулировали иски против них в январе 2009 года. ^[107]^[108]

Alcatel-Lucent подала заявку на несколько патентов на кодирование и сжатие MP3, якобы унаследованных от AT & T-Bell Labs, в собственном судебном разбирательстве. В ноябре 2006 года, перед слиянием компаний, Alcatel подала в суд на Microsoft за нарушение семи патентов. 23 февраля 2007 г. жюри Сан-Диего присудило Alcatel-Lucent $ 1,52 млрд в качестве компенсации за нарушение двух из них. ^[109] Однако суд впоследствии отменил решение, установив, что один патент не был нарушен, а другой не принадлежал Alcatel-Lucent ; Судья постановил , что он принадлежит компаниям AT&T и Fraunhofer, которые передали его по лицензии Microsoft . ^[110] Это решение защиты было оставлено без изменения при рассмотрении апелляции в 2008 году. ^[111] См. Дополнительную информацию в Alcatel-Lucent против Microsoft .

Альтернативные технологии

Существуют и другие форматы с потерями. Среди них наиболее широко используется Advanced Audio Coding (AAC), который был разработан как преемник MP3. Существуют также другие форматы с потерями, такие как mp3PRO и MP2 . Они принадлежат к тому же технологическому семейству, что и MP3, и зависят от примерно аналогичных психоакустических моделей и алгоритмов MDCT . В то время как MP3 использует гибридный подход к кодированию, который является частью MDCT и частью FFT , AAC - это чисто MDCT, что значительно повышает эффективность сжатия. ^[112] Многие из основных патентов, лежащих в основе этих форматов, принадлежат Fraunhofer Society , Alcatel-Lucent, Thomson Consumer Electronics , ^[112] Bell , Dolby , LG Electronics , NEC , NTT Docomo , Panasonic , Sony Corporation , ^[113] ETRI , JVC Kenwood , Philips , Microsoft и NTT . ^[114]

Когда рынок цифровых аудиоплееров находился на подъеме, MP3 был широко принят в качестве стандарта, отсюда и популярное название «MP3-плеер». Sony была исключением и использовала собственный кодек ATRAC, взятый из формата MiniDisc , который, по утверждению Sony, был лучше. ^[115] После критики и более низких, чем ожидалось, продаж Walkman в 2004 году Sony впервые представила встроенную поддержку MP3 для своих плееров Walkman. ^[116]

Существуют также открытые форматы сжатия, такие как Opus и Vorbis , которые доступны бесплатно и без каких-либо известных патентных ограничений. Некоторые из новых форматов сжатия звука, такие как AAC, WMA Pro и Vorbis, свободны от некоторых ограничений, присущих формату MP3, которые не могут быть преодолены никаким кодировщиком MP3. ^[90]

Помимо методов сжатия с потерями, форматы без потерь являются важной альтернативой MP3, поскольку они предоставляют неизмененный аудиоконтент, хотя и с увеличенным размером файла по сравнению со сжатием с потерями. Форматы без потерь включают FLAC (Free Lossless Audio Codec), Apple Lossless и многие другие.

Смотрите также

Расширенное кодирование звука (AAC)
AIMP
Формат кодирования звука
Сжатие аудиоданных
Сравнение форматов кодирования аудио
FLAC
Фраунгофера FDK AAC
Общество Фраунгофера
Харальд Попп
Высокоэффективное кодирование звука Advanced Audio (HE-AAC)
ID3
iPod
Сжатие без потерь
Сжатие с потерями
Программное обеспечение медиаплеера
Аудио обезьяны (APE)
MP3 блог
Мп3-плеер
MP3 Surround
MP3HD
MPEG-1 Audio Layer II (MP2)
MPEG-4, часть 14
Musepack (MPC)
Opus
Подкаст
Портативный медиаплеер
Кодирование речи
TwinVQ
Унифицированное кодирование речи и звука (xHE-AAC)
Vorbis (OGG)
WavPack (WV)
Winamp
Windows Media Audio (WMA)

дальнейшее чтение

Герт Ловинк (9 ноября 2014 г.). «Размышления о формате MP3: интервью с Джонатаном Стерном» . Вычислительная культура (4). ISSN 2047-2390 .

Внешние ссылки

MP3 в Curlie
MP3-history.com , История MP3: как был изобретен MP3, Фраунгофер IIS
Архив новостей MP3 , более 1000 статей с 1999 по 2011 год, посвященных MP3 и цифровому аудио.
MPEG.chiariglione.org , официальный веб-сайт MPEG

[mp3-name-1] "С Днем Рождения, MP3!" . Фраунгофера IIS. 12 июля 2005 . Проверено 18 июля 2010 года .

[audio/mpeg-2] «Тип носителя audio / mpeg - RFC 3003» . IETF. Ноября 2000 . Проверено 7 декабря 2009 года .

[RTP-3] «Регистрация типа MIME для форматов полезной нагрузки RTP - RFC 3555» . IETF. Июль 2003 . Проверено 7 декабря 2009 года .

[rfc5219-4] а б «Более устойчивый к потерям формат полезной нагрузки RTP для аудио в формате MP3 - RFC 5219» . IETF. Февраль 2008 . Проверено 4 декабря 2014 .

[5] «Команда mp3» . Фраунгофера IIS . Проверено 12 июня 2020 .

[11172-3-6] а б в г д «ISO / IEC 11172-3: 1993 - Информационные технологии. Кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с - Часть 3: Аудио» . ISO. 1993 . Проверено 14 июля 2010 года .

[13818-3-7] а б в г «ISO / IEC 13818-3: 1995 - Информационные технологии. Общее кодирование движущихся изображений и связанной с ними звуковой информации - Часть 3: Аудио» . ISO. 1995 . Проверено 14 июля 2010 года .

[8] «Технология MP3 в Fraunhofer IIS» . Фраунгофера IIS . Проверено 12 июня 2020 .

[Jayant1993-9] Джаянт, Никил ; Джонстон, Джеймс; Сафранек, Роберт (октябрь 1993 г.). «Сжатие сигналов на основе моделей человеческого восприятия». Труды IEEE . 81 (10): 1385–1422. DOI : 10.1109 / 5.241504 .

[10] «MP3 (кодирование звука MPEG Layer III)» . Библиотека Конгресса. 27 июля 2017 . Проверено 9 ноября 2017 года .

[cd-1991-11] а б ISO (ноябрь 1991 г.). «Пресс-релиз MPEG, Курихама, ноябрь 1991 г.» . ISO. Архивировано из оригинала 3 мая 2011 года . Проверено 17 июля 2010 года .

[neuron2-cd-1991-12] а б в г д ISO (ноябрь 1991 г.). "CD 11172-3 - КОДИРОВАНИЕ ДВИЖУЩИХСЯ ИЗОБРАЖЕНИЙ И СВЯЗАННОГО АУДИО ДЛЯ ЦИФРОВЫХ НОСИТЕЛЕЙ СО СКОРОСТЬЮ ДО 1,5 Мбит / с Часть 3 АУДИО" (PDF) . Архивировано из оригинального (PDF) 30 декабря 2013 года . Проверено 17 июля 2010 года .

[dis-1992-13] а б ISO (6 ноября 1992 г.). "Пресс-релиз MPEG, Лондон, 6 ноября 1992 г." . Кьяриглионе. Архивировано из оригинального 12 августа 2010 года . Проверено 17 июля 2010 года .

[mpeg-audio-faq-bc-14] а б в ISO (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio, версия 9 - MPEG-1 и MPEG-2 BC» . ISO . Проверено 28 октября 2009 года .

[Mayer1894-15] Майер, Альфред Маршалл (1894). «Исследования в области акустики» . Лондонский, Эдинбургский и Дублинский философский журнал . 37 (226): 259–288. DOI : 10.1080 / 14786449408620544 .

[Ehmer1959-16] Эмер, Ричард Х. (1959). «Маскировка тонами против шумовых полос». Журнал акустического общества Америки . 31 (9): 1253. Bibcode : 1959ASAJ ... 31.1253E . DOI : 10.1121 / 1.1907853 .

[Zwicker-17] Цвикер, Эберхард (1974). «О психоакустическом эквиваленте кривых настройки». Факты и модели в слухе . Факты и модели слуха (Материалы симпозиума по психофизическим моделям и физиологическим фактам слуха; проходивший в Тузинге, Обербайерн, 22–26 апреля 1974 г.) . Связь и кибернетика. 8 . стр. 132 -141. DOI : 10.1007 / 978-3-642-65902-7_19 . ISBN 978-3-642-65904-1.

[Eberhard-18] Цвикер, Эберхард; Фельдткеллер, Ричард (1999) [1967]. Das Ohr als Nachrichtenempfänger [ Ухо как приемник связи ]. Пер. Ханнеса Мюша, Сёрена Бууса и Марии Флорентийской. Архивировано из оригинального 14 сентября 2000 года . Проверено 29 Июня 2 008 .

[Fletcher-19] Флетчер, Харви (1995). Речь и слух в общении . Акустическое общество Америки. ISBN 978-1-56396-393-3.

[Schroeder2014-20] а б в Шредер, Манфред Р. (2014). "Bell Laboratories" . Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Springer. п. 388. ISBN. 9783319056609.

[21] Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: часть II линейного прогнозирующего кодирования и Интернет-протокола» (PDF) . Нашел. Тенденции сигнального процесса . 3 (4): 203–303. DOI : 10.1561 / 2000000036 . ISSN 1932-8346 .

[22] Атал, Б .; Шредер, М. (1978). «Предиктивное кодирование речевых сигналов и критерии субъективной ошибки». ICASSP '78. Международная конференция IEEE по акустике, речи и обработке сигналов . 3 : 573–576. DOI : 10.1109 / ICASSP.1978.1170564 .

[Schroeder1979-23] Шредер, MR ; Атал, BS ; Холл, JL (декабрь 1979 г.). «Оптимизация цифровых речевых кодеров путем использования маскирующих свойств человеческого уха». Журнал акустического общества Америки . 66 (6): 1647. Bibcode : 1979ASAJ ... 66.1647S . DOI : 10.1121 / 1.383662 .

[Krasner-24] Краснер, Массачусетс (18 июня 1979 г.). Цифровое кодирование речи и звуковых сигналов на основе требований восприятия слуховой системы (Диссертация). Массачусетский Институт Технологий. ЛВП : 1721,1 / 16011 .

[25] Краснер, Массачусетс (18 июня 1979 г.). «Цифровое кодирование речи на основе требований восприятия слуховой системы (Технический отчет 535)» (PDF) . Архивировано из оригинального (PDF) 3 сентября 2017 года.

[Ahmed-26] Ахмед, Насир (январь 1991 г.). «Как я пришел к дискретному косинусному преобразованию» . Цифровая обработка сигналов . 1 (1): 4–5. DOI : 10.1016 / 1051-2004 (91) 90086-Z .

[pubDCT-27] Ахмед, Насир ; Натараджан, Т .; Рао, КР (январь 1974), "дискретного косинусного преобразования", IEEE Transactions на компьютерах , C-23 (1): 90-93, DOI : 10,1109 / TC.1974.223784

[pubRaoYip-28] Рао, КР ; Ип П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения , Бостон: Academic Press, ISBN 978-0-12-580203-1

[29] JP Princen, AW Johnson и AB Bradley: Кодирование поддиапазонов / преобразований с использованием схем банка фильтров, основанных на отмене наложения спектров во временной области , IEEE Proc. Intl. Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987 г.

[30] Джон П. Принсен, Алан Б. Брэдли: Дизайн банка фильтров анализа / синтеза на основе отмены наложения спектров во временной области , IEEE Trans. Акуст. Обработка речевых сигналов, ASSP-34 (5), 1153–1161, 1986

[Guckert-31] а б Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 .

[Terhardt1982-32] Terhardt, E .; Stoll, G .; Сиванн, М. (март 1982 г.). «Алгоритм извлечения высоты звука и яркости звука из сложных тональных сигналов». Журнал акустического общества Америки . 71 (3): 679. Bibcode : 1982ASAJ ... 71..679T . DOI : 10.1121 / 1.387544 .

[Voice_Coding_for_Communications-33] а б «Голосовое кодирование для связи». Журнал IEEE по избранным областям коммуникаций . 6 (2). Февраль 1988 г.

[musmann-34] Происхождение стандарта кодирования звука MP3 в транзакциях IEEE в бытовой электронике, IEEE, Vol. 52, № 3, стр. 1043–1049, август 2006 г.

[Brandenburg-35] Бранденбург, Карлхайнц; Зейтцер, Дитер (3–6 ноября 1988 г.). OCF: кодирование аудио высокого качества со скоростью передачи данных 64 кбит / с . 85-й съезд общества звукорежиссеров.

[Johnston1988-36] Джонстон, Джеймс Д. (февраль 1988 г.). «Преобразование кодирования аудиосигналов с использованием критериев восприятия шума». Журнал IEEE по избранным областям коммуникаций . 6 (2): 314–323. DOI : 10.1109 / 49.608 .

[37] YF Dehery, et al. (1991) Исходный кодек MUSICAM для цифрового аудиовещания и хранения Proceedings IEEE-ICASSP 91 страницы 3605–3608 Май 1991

[38] "Комментарий DAB от Алана Бокса, представителя EZ и председателя целевой группы NAB DAB" (PDF) .

[39] EBU SQAM CD Оценка качества звука Записи материалов для субъективных тестов . 7 октября 2008 г.

[BusinessWeek_2007-40] а б Юинг, Джек (5 марта 2007 г.). «Как родился MP3» . Bloomberg BusinessWeek . Проверено 24 июля 2007 года .

[41] Витт, Стивен (2016). Как музыка стала бесплатной: конец индустрии, рубеж веков и терпение пиратства . Соединенные Штаты Америки: Penguin Books. п. 13. ISBN 978-0143109341. К Бранденбургу и Грилю присоединились еще четыре исследователя фраунгофера. Хайнц Герхаузер руководил исследовательской группой института аудио; Харальд Попп был специалистом по аппаратному обеспечению; Эрнст Эберлейн был экспертом по обработке сигналов; Юрген Херре был еще одним аспирантом, математические способности которого не уступали Бранденбургу. В последующие годы эта группа будет называть себя «первоначальной шестеркой».

[Sterne2012_Vega-42] Джонатан Стерн (17 июля 2012 г.). MP3: значение формата . Издательство Университета Дьюка. п. 178. ISBN 978-0-8223-5287-7.

[43] Технология цифрового видео и аудиовещания: Практическое руководство по проектированию (сигналы и коммуникационные технологии) ISBN 3-540-76357-0 стр. 144: «В 1988 году метод MASCAM был разработан в Institut für Rundfunktechnik (IRT) в Мюнхене в рамках подготовки к системе цифрового аудиовещания (DAB). Из MASCAM, MUSICAM (универсальное кодирование и мультиплексирование поддиапазонов с универсальным шаблоном маски) Метод был разработан в 1989 году в сотрудничестве с CCETT, Philips и Matsushita ».

[santa-clara-1990-44] «Отчет о состоянии ISO MPEG» (пресс-релиз). Международная организация по стандартизации . Сентября 1990 года Архивировано из оригинала 14 февраля 2010 года.

[Aspec-45] «Аспек-адаптивное спектрально-энтропийное кодирование высококачественных музыкальных сигналов» . Электронная библиотека AES . 1991 . Проверено 24 августа 2010 года .

[sydney1993-46] а б «Принято на 22-м заседании WG11» (пресс-релиз). Международная организация по стандартизации . 2 апреля 1993 года Архивировано из оригинала 6 августа 2010 года . Проверено 18 июля 2010 года .

[Brandenburg1997-47] Бранденбург, Карлхайнц; Бози, Марина (февраль 1997 г.). «Обзор MPEG Audio: текущие и будущие стандарты кодирования аудио с низкой скоростью передачи данных» . Журнал Общества звукорежиссеров . 45 (1/2): 4–21 . Проверено 30 июня 2008 года .

[MPEG-2.5-48] а б в г «Технические характеристики MP3 (MPEG-2 и MPEG-2.5)» . Фраунгофера IIS . Сентября 2007 Архивировано из оригинального 24 января 2008 года «MPEG-2.5» это название патентованного расширения , разработанного Fraunhofer IIS. Это позволяет MP3 удовлетворительно работать при очень низких битрейтах и вводит дополнительные частоты дискретизации 8 кГц, 11,025 кГц и 12 кГц.

[MPEG-2.5-2-49] Б с д е е г ч Супурович, Предраг (22 декабря 1999 г.). «Заголовок аудиокадра MPEG» . Архивировано из оригинала 8 февраля 2015 года . Проверено 29 мая 2009 года .

[mp3tech-iso13818-3-50] а б в «ISO / IEC 13818-3: 1994 (E) - Информационные технологии - Общее кодирование движущихся изображений и связанного звука: аудио» (ZIP) . 11 ноября 1994 . Проверено 4 августа 2010 года .

[motherofmp3-51] «Интересные факты: музыка» . Официальное сообщество Сюзанны Вега .

[paris_press-52] MPEG (25 марта 1994 г.). «Утверждено на 26-м заседании (Париж)» . Архивировано из оригинального 26 июля 2010 года . Проверено 5 августа 2010 года .

[singapore_press-53] MPEG (11 ноября 1994 г.). «Утверждено на 29-м заседании» . Архивировано из оригинала на 8 августа 2010 года . Проверено 5 августа 2010 года .

[ISO/IEC_TR_11172-5:1998-54] ISO. «ISO / IEC TR 11172-5: 1998 - Информационные технологии - Кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с - Часть 5: Моделирование программного обеспечения» . Проверено 5 августа 2010 года .

[Software_Simulation.zip-55] «ISO / IEC TR 11172-5: 1998 - Информационные технологии - Кодирование движущихся изображений и связанного звука для цифровых носителей со скоростью до 1,5 Мбит / с - Часть 5: Моделирование программного обеспечения (Эталонное программное обеспечение)» (ZIP) . Проверено 5 августа 2010 года .

[56] Дехери, Ив-Франсуа (1994). Стандарт высококачественного кодирования звука для радиовещательных, телекоммуникационных и мультимедийных систем . Нидерланды: Elsevier Science BV. С. 53–64. ISBN 978-0-444-81580-4. Эта статья относится к рабочей станции со сжатым цифровым звуком Musicam (MPEG Audio Layer II), реализованной на микрокомпьютере, которая используется не только как профессиональная монтажная станция, но и как сервер в сети Ethernet для библиотеки сжатого цифрового звука, что позволяет предвидеть будущее MP3 в Интернете.

[MP3_Todays_Technology-57] «Технология MP3 сегодня» . Много информативной информации о музыке . 2005. Архивировано из оригинала 4 июля 2008 года . Проверено 15 сентября 2016 года .

[Sterne2012_ThankYou-58] Джонатан Стерн (17 июля 2012 г.). MP3: значение формата . Издательство Университета Дьюка. п. 202. ISBN. 978-0-8223-5287-7.

[59] Небесный музыкальный автомат на The Atlantic «Чтобы показать промышленности, как использовать кодек, MPEG собрал бесплатный образец программы, конвертирующий музыку в файлы MP3. Демонстрационное программное обеспечение создавало некачественный звук, и Фраунгофер не собирался его использовать. «Исходный код» программного обеспечения - его основные инструкции - хранился на легкодоступном компьютере в Университете Эрлангена, с которого он был загружен неким SoloH, хакером из Нидерландов (и, как предполагается, фанатом «Звездных войн»). SoloH обновила исходный код для создания программного обеспечения, которое преобразовывало треки компакт-дисков в музыкальные файлы приемлемого качества ». (2000)

[60] Поп-идолы и пираты: механизмы потребления и глобального обращения ... доктор Чарльз Фэирчайлд

[61] Технологии пиратства? - Исследование взаимодействия между коммерциализмом и идеализмом в развитии MP3 и DivX ХЕНДРИК ШТОРШТЕЙН СПИЛКЕР, СВЕЙН ХЁЙЕР, стр. 2072

[62] www.euronet.nl/~soloh/mpegEnc/ ( Archive.org )

[63] "Об Интернет-подпольном музыкальном архиве" .

[seattlepi-64] а б Шуберт, Рут (10 февраля 1999 г.). «Техническая подкованность в получении музыки для песни; индустрия разочарована тем, что Интернет делает бесплатную музыку простой» . Сиэтл Пост-Интеллидженсер . Источник +22 ноября 2 008 .

[Giesler-65] Гислер, Маркус (2008). «Конфликт и компромисс: драма в развитии рынка». Журнал потребительских исследований . 34 (6): 739–753. CiteSeerX 10.1.1.564.7146 . DOI : 10.1086 / 522098 . S2CID 145796529 .

[Limitations-66] а б в г Бувинь, Габриэль (2003). «Технология MP3 - Ограничения» . Архивировано из оригинального 7 -го января 2011 года.

[mpeg1-67] «ISO / IEC 11172-3: 1993 / Cor 1: 1996» . Международная организация по стандартизации . 2006 . Проверено 27 августа 2009 года .

[Amorim-68] Аморим, Роберто (3 августа 2003 г.). «Результаты теста публичного прослушивания с расширением 128 кбит / с» . Проверено 17 марта 2007 года .

[listening-test-128-2006-69] Марес, Себастьян (декабрь 2005 г.). «Результаты публичного многоформатного прослушивания при 128 кбит / с» . Проверено 17 марта 2007 года .

[Dougherty-70] Догерти, Дейл (1 марта 2009 г.). «Обжигающий звук музыки» . О'Рейли Радар .

[noisey-71] «Познакомьтесь с музыкальным ясновидящим, который находит призраков в ваших MP3» . ШУМ . 18 марта 2015.

[schroeder2015-72] «Призраки в mp3» . 15 марта 2015 г.

[hull2015-73] «Бюро находок: аспирант Университета Вирджинии обнаруживает призраков в MP3» . UVA сегодня . 23 февраля 2015.

[Maguire2014-74] Призрак в MP3

[lame-usage-75] «Руководство по параметрам командной строки (в CVS)» . Проверено 4 августа 2010 года .

[RC-EX30-76] «Руководство по эксплуатации JVC RC-EX30» (PDF) (на нескольких языках). 2004. с. 14. Поиск - поиск нужного места на диске (только аудио компакт-диск).( Бумбокс 2004 года )

[DV-RW250-77] "DV-RW250H Руководство по эксплуатации GB" (PDF) . 2004. с. 33. • Ускоренное воспроизведение вперед и обзорное воспроизведение не работает с дисками MP3 / WMA / JPEG-CD.

[78] «Сравнение качества звука Hi-Res Audio, CD и MP3» . www.sony.com . Sony . Дата обращения 11 августа 2020 .

[Woon-Seng-79] Вун-Сенг Ган; Сен-Мо Куо (2007). Встроенная обработка сигналов с помощью Micro Signal Architecture . Wiley-IEEE Press . п. 382. ISBN. 978-0-471-73841-1.

[Bouvigne-80] Бувинь, Габриэль (28 ноября 2006 г.). "свободный формат на 640 кбит / с и foobar2000, возможности?" . Проверено 15 сентября 2016 года .

[81] "lame (1): создание аудиофайлов в формате mp3 - справочная страница Linux" . linux.die.net . Проверено 22 августа 2020 .

[82] «Linux Manpages Online - справочные страницы man.cx» . man.cx . Проверено 22 августа 2020 .

[LAME_GPSYCHO-83] а б «GPSYCHO - переменная скорость передачи данных» . LAME MP3 Encoder . Проверено 11 июля 2009 года .

[TwoLAME-84] «TwoLAME: MPEG Audio Layer II VBR» . Проверено 11 июля 2009 года .

[MPEG-1_and_MPEG-2_BC-85] Подгруппа ISO MPEG Audio. «Часто задаваемые вопросы по MPEG Audio, версия 9: MPEG-1 и MPEG-2 BC» . Проверено 11 июля 2009 года .

[LAME_Y-86] «Хромой переключатель Y» . База знаний Hydrogenaudio . Проверено 23 марта 2015 года .

[Rae-87] Рэй, Кейси. «Метаданные и вы» . Будущее музыкальной коалиции . Проверено 12 декабря 2014 .

[Patel-88] Патель, Кетан; Смит, Брайан Ч .; Роу, Лоуренс А. Производительность программного декодера видео MPEG (PDF) . Конференция ACM Multimedia 1993.

[mpegfa31.txt-89] «MPEG-FAQ, версия 3.1» . 14 мая 1994 года Архивировано из оригинала 23 июля 2009 года.

[big-list-90] а б «Большой список патентов MP3 (и предполагаемые даты истечения срока действия)» . tunequest . 26 февраля 2007 г.

[Cogliati-91] Коглиати, Джош (20 июля 2008 г.). «Патентный статус MPEG-1, H.261 и MPEG-2» . Kuro5hin . В этой работе не учитывались патентные деления и продолжения.

[US5812672-92] Патент США № 5812672

[Patent_expiration-93] «Истечение срока действия патента США на MP3, MPEG-2, H.264» . OSNews.com.

[94] «Патент US6009399 - Способ и устройство для кодирования цифровых сигналов ... - Патенты Google» .

[95] "mp3licensing.com - Патенты" . mp3licensing.com .

[96] «Полная поддержка MP3 скоро появится в Fedora» . 5 мая 2017.

[ffii-97] «Сжатие акустических данных - базовый патент MP3» . Фонд свободной информационной инфраструктуры . 15 января 2005 Архивировано из оригинала 15 июля 2007 года . Проверено 24 июля 2007 года .

[Technicolor-98] «Интеллектуальная собственность и лицензирование» . Цветной . Архивировано из оригинала 4 мая 2011 года.

[Kistenfeger-99] Kistenfeger, Muzinée (июль 2007 г.). «Общество Фраунгофера (Fraunhofer-Gesellschaft, FhG)» . Генеральное консульство Великобритании в Мюнхене. Архивировано из оригинального 18 августа 2002 года . Проверено 24 июля 2007 года .

[chillingeffects-100] «Раннее исполнение патентов на MP3» . Информационный центр Chilling Effects . 1 сентября 1998 . Проверено 24 июля 2007 года .

[101] «Программа лицензирования MPEG Audio компании SISVEL» .

[ZDNet_India-102] «Audio MPEG и Sisvel: Thomson подали в суд за нарушение патентных прав в Европе и США - MP3-плееры остановлены таможней» . ZDNet Индия . 6 октября 2005 года Архивировано из оригинала 11 октября 2007 года . Проверено 24 июля 2007 года .

[SISVEL-103] «предоставляет Motorola патентную лицензию на звук в форматах MP3 и MPEG 2» . SISVEL. 21 декабря 2005 года Архивировано из оригинала 21 января 2014 года . Проверено 18 января 2014 года .

[104] «Патенты США на MPEG Audio» (PDF) . Sisvel.

[SanDisk_MP3_seizure-105] Огг, Эрика (7 сентября 2006 г.). «Порядок изъятия SanDisk MP3 отменен» . CNET News . Архивировано из оригинала 4 ноября 2012 года . Проверено 24 июля 2007 года .

[Patent_Wild_West-106] «Sisvel приносит патентный Дикий Запад в Германию» . Блог IPEG . 7 сентября 2006 . Проверено 24 июля 2007 года .

[law360-107] «Apple, SanDisk урегулировали спор о патентах MP3 в Техасе» . Закон об интеллектуальной собственности 360 . 26 января 2009 . Проверено 16 августа 2010 года .

[Kelly-108] «Специалисты Baker Botts LLP: Лиза Кэтрин Келли - Представительские обязательства» . ТОО «Бейкер Боттс» . Архивировано из оригинала на 10 декабря 2014 года . Проверено 15 сентября 2016 года .

[MP3_payout-109] «Microsoft грозит выплата в размере 1,5 млрд долларов в формате MP3» . BBC News . 22 февраля 2007 . Проверено 30 июня 2008 года .

[Microsoft_wins_reversal-110] «Microsoft выигрывает отмену решения о патенте MP3» . CNET . 6 августа 2007 . Проверено 17 августа 2010 года .

[Alcatel-Lucent-111] «Апелляционный суд по решению федерального округа» (PDF) . 25 сентября 2008 г. Архивировано из оригинального (PDF) 29 октября 2008 г.

[brandenburg-112] а б Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» . Архивировано из оригинального (PDF) 19 октября 2014 года.

[businesswire-113] «Via Licensing объявляет об обновленной совместной патентной лицензии AAC» . Деловой провод . 5 января 2009 . Проверено 18 июня 2019 .

[aac-licensors-114] «Лицензиары AAC» . Via Corp . Дата обращения 6 июля 2019 .

[115] ttps://www.nytimes.com/1999/09/30/technology/news-watch-new-player-from-sony-will-give-a-nod-to-mp3.html

[116] ttps://www.cnet.com/reviews/sony-nw-e100-review/

[4]

MP3