Вокодер

Вокодер ( / ˈ v oʊ k oʊ d ər / , сочетание голоса и кодера ) — это категория кодирования речи , которая анализирует и синтезирует сигнал человеческого голоса для сжатия аудиоданных , мультиплексирования , шифрования голоса или преобразования голоса.

Вокодер был изобретен в 1938 году Гомером Дадли из Bell Labs как средство синтеза человеческой речи. ^[1] Эта работа была развита в канальный вокодер , который использовался в качестве голосового кодека в телекоммуникациях для кодирования речи для сохранения полосы пропускания при передаче.

Зашифровав управляющие сигналы, можно защитить передачу голоса от перехвата . Его основное использование таким образом - для безопасной радиосвязи. Преимущество этого метода шифрования в том, что не передается ни один исходный сигнал, а только огибающие полосовых фильтров. Приемный блок необходимо настроить в той же конфигурации фильтра, чтобы повторно синтезировать версию исходного спектра сигнала.

Вокодер также широко использовался в качестве электронного музыкального инструмента . Декодерная часть вокодера, называемая водером , может использоваться независимо для синтеза речи.

Человеческий голос состоит из звуков , генерируемых открытием и закрытием голосовых связок , что создает периодический сигнал со многими гармониками . Этот основной звук затем фильтруется носом и горлом (сложная резонансная система труб) для контролируемого создания различий в гармоническом содержании ( формантах ), создавая широкое разнообразие звуков, используемых в речи. Существует еще один набор звуков, известный как глухие и взрывные звуки, которые по-разному создаются или изменяются ртом.

Вокодер исследует речь, измеряя, как ее спектральные характеристики изменяются с течением времени. В результате получается серия сигналов, представляющих эти частоты в любой конкретный момент времени, когда говорит пользователь. Проще говоря, сигнал разделяется на несколько частотных диапазонов (чем больше это число, тем точнее анализ), и уровень сигнала, присутствующий в каждом частотном диапазоне, дает мгновенное представление о спектральном энергетическом составе. Чтобы воссоздать речь, вокодер просто меняет процесс, обрабатывая источник широкополосного шума, пропуская его через этап, который фильтрует частотный контент на основе первоначально записанной серии чисел.

Вокодер HY-2 (разработанный в 1961 году) был последним поколением канального вокодера в США . ^[3]^[4]