Siren (кодек)


Siren® — семейство запатентованных форматов широкополосного кодирования звука на основе преобразования и их реализации аудиокодеков, разработанных и лицензированных корпорацией PictureTel (приобретенной Polycom, Inc. в 2001 году).[1] Существует три варианта кодека Siren: Siren 7, Siren 14 и Siren 22.

Siren 7 (или Siren7 или просто Siren) обеспечивает 7 аудио кГц, битрейт 16, 24, 32 кбит/с и частота дискретизации 16 кГц. Сирена основана на алгоритме PictureTel PT716plus.[2] В 1999 году ITU-T одобрил рекомендацию для кодека G.722.1, основанную на алгоритме Siren 7. Он был одобрен после четырехлетнего процесса отбора, включающего всестороннее тестирование.[2] Кодек G.722.1 обеспечивает только скорость передачи 24 и 32 кбит/с и не поддерживает скорость передачи 16 кбит/с Siren 7.[3][4] Алгоритм Siren 7 идентичен его преемнику G.722.1, хотя форматы данных немного отличаются.

Siren 14 (или Siren14) обеспечивает 14 аудио кГц, битрейт 24, 32, 48 кбит/с для моно, 48, 64, 96 кбит/с для стерео и частота дискретизации 32 кГц. Siren 14 поддерживает стерео и моно звук. Он предлагает алгоритмическую задержку 40 миллисекунд, используя длину кадра 20 миллисекунд. Моно версия Siren 14 стала ITU-T G.722.1C (14 кГц, 24/32/48 кбит/с) в апреле 2005 г.[5][6][7] Алгоритм основан на технологии кодирования с преобразованием с использованием модулированного перекрывающегося преобразования (MLT),[8] типа дискретного косинусного преобразования (DCT) [9] или модифицированного дискретного косинусного преобразования (MDCT).[10]

Siren 22 (или Siren22) обеспечивает 22 аудио кГц, частота дискретизации 48 кГц, скорости передачи 64, 96, 128 кбит/с стерео и 32, 48, 64 кбит/с моно. Siren 22 предлагает алгоритмическую задержку 40 миллисекунд с использованием длины кадра 20 миллисекунд. В мае 2008 года ITU-T утвердил новый полнодиапазонный кодек G.719, основанный на аудиотехнологии Polycom Siren 22 и передовых аудиотехнологиях Ericsson.[11][12]

Кодирование звука кодеком Siren 7 обычно используется в системах видеоконференцсвязи, а также является частью Microsoft Office Communicator при использовании аудио/видеоконференций. Microsoft Office Communications Server использует Siren 7 во время аудиоконференций. В клиенте Office Communicator по умолчанию передача звука «точка-точка» по умолчанию выполняется с использованием проприетарного кодека Microsoft RTAudio . Когда вызов транслируется в аудиоконференцию (каждый раз, когда к ней присоединяются 3 или более участников), кодек на лету переключается на сирену. Это сделано из соображений производительности. Обратите внимание, что даже если в конференции участвует менее 3 участников, OCS не переводит конференцию в режим «точка-точка»; она остается аудио/видеоконференцией до тех пор, пока конференция не будет завершена.