Лог-спектрального расстояния (ЛСД) , также называемый лог-спектрального искажения или среднеквадратичное лог-спектрального расстояния , является мера расстояния (выраженное в дБ) между двумя спектрами . [1] Лог-спектральное расстояние между спектрами а также определяется как:
где а также - спектры мощности . В отличие от расстояния Итакура – Сайто , логарифмическое спектральное расстояние симметрично. [2]
При кодировании речи логарифмическое спектральное искажение для данного кадра определяется как среднеквадратичная разность между исходным логарифмическим спектром мощности LPC и квантованным или интерполированным логарифмическим спектром мощности LPC. Обычно вычисляется среднее значение спектрального искажения по большому количеству кадров, которое используется в качестве меры производительности квантования или интерполяции .
Смотрите также
Рекомендации
- ^ Рабинер, Лоуренс R; Хуанг, Бин-Хван (1993). Основы распознавания речи . PTR Prentice Hall.
- ^ Энквист, Пер; Карлссон, Йохан (2008). «Минимальное расстояние Итакура-Сайто и ковариационная интерполяция». 2008 47-я конференция IEEE по решениям и контролю : 137–142. DOI : 10.1109 / CDC.2008.4739312 . ISBN 978-1-4244-3123-6. S2CID 146126 .