Акустический отпечаток пальца


Акустический отпечаток — это сжатая цифровая сводка, отпечаток , детерминировано сгенерированный из аудиосигнала , который можно использовать для идентификации аудиосемпла или быстрого поиска похожих элементов в аудиобазе данных . [1]

Практическое использование акустических отпечатков пальцев включает идентификацию песен , мелодий , мелодий или рекламы ; управление библиотекой звуковых эффектов ; идентификация видеофайла . Идентификация носителей с помощью акустических отпечатков пальцев может использоваться для мониторинга использования определенных музыкальных произведений и исполнений в радиотрансляциях , пластинках , компакт -дисках , потоковых медиа и одноранговых сетях. Эта идентификация использовалась для соблюдения авторских прав, лицензирования и других схем монетизации .

Надежный алгоритм акустического отпечатка пальца должен учитывать характеристики восприятия звука. Если два файла звучат одинаково для человеческого уха, их акустические отпечатки должны совпадать, даже если их двоичные представления сильно различаются. Акустические отпечатки пальцев — это не хеш-функции , которые должны быть чувствительны к малейшим изменениям данных. Акустические отпечатки пальцев больше похожи на отпечатки пальцев человека, где допускаются небольшие вариации, незначительные по сравнению с функциями, которые использует отпечаток пальца. Можно представить случай смазанного отпечатка пальца человека, который можно точно сопоставить с другим образцом отпечатка пальца в справочной базе данных; акустические отпечатки пальцев работают аналогичным образом.

Воспринимаемые характеристики, часто используемые звуковыми отпечатками пальцев, включают среднюю скорость пересечения нуля , предполагаемый темп , средний спектр , спектральную однородность , заметные тона в наборе частотных диапазонов и ширину полосы пропускания .

Большинство методов сжатия аудио вносят радикальные изменения в двоичное кодирование аудиофайла, не влияя радикально на то, как он воспринимается человеческим ухом. Надежный акустический отпечаток позволит идентифицировать запись после такого сжатия, даже если качество звука значительно ухудшилось. Для использования в мониторинге радиовещания акустические отпечатки также должны быть нечувствительны к артефактам аналоговой передачи .

Генерация подписи из аудио необходима для поиска по звуку . Одним из распространенных методов является создание частотно-временного графика, называемого спектрограммой .