Синтез речи


Си́нтез ре́чи — в широком смысле — восстановление формы речевого сигнала по его параметрам[1]; в узком смысле — формирование речевого сигнала по печатному[уточнить] тексту. Часть искусственного интеллекта.

Синтезом речи прежде всего называется всё, что связано с искусственным производством человеческой речи.

Синтезатор речи — структура, способная переводить текст/образы в речь, в программном обеспечении и/или аппаратных средствах.

Голосовой движок — непосредственно система/ядро преобразования текста/команд в речь, это также может существовать независимо от компьютера.

Синтез речи может потребоваться во всех случаях, когда получателем информации является человек. О качестве синтезатора речи прежде всего судят по его сходству с человеческим голосом, а также способности быть понятным. Самую простую синтезированную речь можно создавать путём объединения частей записанной речи, которые затем будут храниться в базе данных. И как ни странно, с таким способом синтезирования мы сталкиваемся уже повсеместно, даже не обращая порой на это внимания.

Параметрический синтез речи является конечной операцией в вокодерных системах, где речевой сигнал представляется набором небольшого числа непрерывно изменяющихся параметров. Параметрический синтез целесообразно применять в тех случаях, когда набор сообщений ограничен и изменяется не слишком часто. Достоинством такого способа является возможность записать речь для любого языка и любого диктора. Качество параметрического синтеза может быть очень высоким (в зависимости от степени сжатия информации в параметрическом представлении). Однако параметрический синтез не может применяться для произвольных, заранее не заданных сообщений.