CereProc

CereProc

Разработчики)	CereProc Ltd., Великобритания
изначальный выпуск	2005 ; 16 лет назад ( 2005 )

Стабильный выпуск	Июль 2013 г . ; 7 лет назад ( 2013-07 )

Написано в	C / Python
Операционная система	Кроссплатформенность
Доступно в	Английский, немецкий, французский, испанский, итальянский, голландский, каталонский, румынский, японский, португальский, шотландский гэльский, шведский, польский, ирландский
Тип	Текст в речь
Лицензия	Коммерческий
Интернет сайт	www .cereproc .com

CereProc ( / с ɛ г ə ˌ р г ɒ к / SERR -ə-Прок ) представляет собой синтез речи компании , базирующейся в Эдинбурге, Шотландия, основана в 2005 году Компания специализируется на создании природного и выразительный звучащие текста в речь голоса, синтез голоса с региональными акцентами и клонирование голоса .

Технология построения голоса [ править ]

CereProc создает голоса, используя две различные технологии построения голоса: синтез выбора единиц и параметрическое моделирование.

Голоса для выбора устройства CereProc построены на основе больших баз данных записанной речи. Во время создания базы данных каждое записанное высказывание сегментируется на некоторые или все из следующего: отдельные телефоны , слоги , морфемы , слова , фразы и предложения . Разделение на сегменты производится с помощью специально модифицированного распознавателя речи . ^[1] Индекс единиц в базе данных речевого Затем создается на основе сегментации и акустических параметров , как на основной частоте ( шаг), длительность, положение в слоге и соседние телефоны. Во время исполнения желаемое целевое высказывание создается путем определения наилучшей цепочки единиц-кандидатов из базы данных (выбор единицы). Выбор единицы измерения обеспечивает максимальную естественность, поскольку он применяет цифровую обработку сигналов (DSP) к записанной речи только в точках конкатенации. DSP часто делает записанную речь менее естественной.

Параметрические голоса CereProc производят синтез речи на основе методологий статистического моделирования. В этой системе одновременно моделируются частотный спектр ( речевой тракт ), основная частота (источник голоса) и продолжительность ( просодия ). Речевые сигналы генерируются из этих параметров с помощью вокодера . Важно отметить, что эти голоса могут быть построены из значительно меньшего количества записанной речи, чем голоса выбора единиц, и при установке занимают гораздо меньшую площадь, из-за чего они используются для клонирования частного голоса. ^[2]

Голоса и языки [ править ]

CereProc имеет 46 общедоступных голосов, говорящих на четырнадцати языках с различными региональными акцентами:

Американский английский: Изабелла, Кэтрин, Ханна, Меган, Адам, Натан, Энди (детский голос), Джордан (детский голос), Кэролин
Британский английский: Сара, Уильям, Джек, Лорен, Джайлз, Эми
Северный английский: Джесс
Шотландский английский: Хизер, Кирсти, Стюарт, Эндрю (детский голос), Майри (детский голос)
Глазго английский: Додо
Ланкаширский английский: Клэр
Ирландский английский: Кейтлин
Уэст-Мидлендс английский: Сью
Специальные голоса FX: демон, призрак, гоблин, пикси, робот
Метрополитен французский: Сюзанна, Лоран
Канадский французский: Флоренция
Каталанский: Рита
Кастильский испанский: Сара
Латиноамериканский испанский: Ана
Итальянский: Лаура, Дарио
Ирландский: Peig
Голландский: Ада
Немецкий: Гудрун, Алекс
Австрийский немецкий: Леопольд
Португальский: Lúcia
Бразильский португальский: Габриэль
Японский: Юки
Шотландский гэльский: Ceitidh
Шведский: Ylva
Польский: Pola
Румынский: Дарья
Английский с французским акцентом: Николь
Русский: Аврора
Мандарин: Майлин

Кроме того, компания разработала ряд голосов знаменитостей, которые обычно не доступны широкой публике. К ним относятся Джордж Буш , Барак Обама и Арнольд Шварценеггер . ^[3]

Клонирование голоса [ править ]

В 2009 году кинокритик Роджер Эберт использовал CereProc для создания синтетической версии своего голоса. Эберт потерял дар речи после операции по лечению рака щитовидной железы . CereProc добывал ленты и комментарии на DVD с голосом Эберта, чтобы создать голос для преобразования текста в речь, который больше походил на его собственный. ^[4] Роджер Эберт использовал голос в своем появлении 2 марта 2010 года на шоу Опры Уинфри .

CereProc клонировал голос игрока НФЛ Стива Глисона после того, как ему поставили диагноз БДН . Глисон появился в Microsoft «s Super Bowl XLVIII коммерческого прославляя мощь технологии, используя свой синтетический голос повествовать.

Технология клонирования голоса CereProc в настоящее время используется в Великобритании людьми, страдающими БДН, для создания синтезированных голосов до того, как они потеряют способность говорить. Этот процесс был показан в документальном фильме BBC Radio 4 « Вернув критику его голос» , который транслировался в августе 2011 года ^[5].

Совместимость системы [ править ]

Голоса CereProc могут быть развернуты в разных операционных системах и на разных типах устройств. Настольные голоса CereProc совместимы с Microsoft Windows и Apple Mac OS X . Они устанавливаются как системные голоса и могут использоваться другими приложениями с поддержкой речи. CereProc в клиент / сервер системы CServer, направлена главным образом на корпоративном рынке IVR, может работать на Windows , и Linux . Голоса CereProc Mobile можно развернуть на Android и Apple iOS . SDK доступен для Android, Linux, MacOS, iOS и Windows. SDK имеет привязки для C / C ++, C #, Java и Python.

См. Также [ править ]

Язык
Обработка естественного языка
Обработка речи
Список программ чтения с экрана

Ссылки [ править ]

^ Алан В. Блэк , Идеальный синтез для всех людей в любое время. IEEE TTS Workshop 2002.
^ "Cerevoice Me" .
^ "Голоса CereProc" .
↑ Roger Ebert: The Essential Man «Esquire», 16 февраля 2010 г. Доступ: 21 сентября 2011 г.
^ "Вернуть критику его голос" . Программы BBC Radio Scotland. Проверено 26 октября 2011 года.

Внешние ссылки [ править ]

Официальный веб-сайт
Роджер Эберт демонстрирует свой голос в CereProc на TED2011 в 7:28

[1] Алан В. Блэк , Идеальный синтез для всех людей в любое время. IEEE TTS Workshop 2002.

[2] "Cerevoice Me" .

[3] "Голоса CereProc" .

[4] Roger Ebert: The Essential Man «Esquire», 16 февраля 2010 г. Доступ: 21 сентября 2011 г.

[5] "Вернуть критику его голос" . Программы BBC Radio Scotland. Проверено 26 октября 2011 года.

[1]