Из Википедии, бесплатной энциклопедии
  (Перенаправлено из модели Source-filter )
Перейти к навигации Перейти к поиску

Модель « источник-фильтр» представляет речь как комбинацию источника звука, такого как голосовые связки , и линейного акустического фильтра, речевого тракта . Хотя эта модель является приблизительной, она широко используется в ряде приложений, таких как синтез речи и анализ речи из-за ее относительной простоты. Это также связано с линейным предсказанием . Развитие модели в значительной степени связано с ранними работами Гуннара Фанта , хотя другие, особенно Кен Стивенс , также внесли существенный вклад в модели, лежащие в основе акустического анализа речи и синтеза речи. [1]Фант основывается на работах Цутому Чиба и Масато Кадзиямы, которые первыми показали взаимосвязь между акустическими свойствами гласных и формой речевого тракта. [1]

Важное допущение, которое часто делается при использовании модели источник-фильтр, - это независимость источника и фильтра. [1] В таких случаях модель следует более точно называть «моделью независимого источника-фильтра». [ необходима цитата ]

История [ править ]

В 1942 году Чиба и Кадзияма опубликовали свое исследование акустики гласных и речевого тракта в своей книге «Гласный: его природа и структура» . Создав модели речевого тракта с помощью рентгеновской фотографии , они смогли предсказать формантные частоты разных гласных, установив связь между ними. Гуннар Фант, новатор в области речевого образования, использовал исследование Чибы и Кадзиямы по рентгеновской фотографии речевого тракта для интерпретации своих собственных данных о звуках русской речи в Acoustic Theory of Speech Production , которая установила модель источника-фильтра. [2]

Приложения [ править ]

В разной степени разные фонемы можно различать по свойствам их источника (источников) и их спектральной форме . Звонкие звуки (например, гласные) имеют по крайней мере один источник из-за в основном периодического возбуждения голосовой щели, которое может быть аппроксимировано последовательностью импульсов во временной области и гармониками в частотной области, а также фильтром, который зависит, например, от языка положение и выступание губ. [3] С другой стороны, фрикативы , такие как [s] и [f] , имеют по крайней мере один источник из-за турбулентного шума, создаваемого сужением в ротовой полости или глотке . Так называемые звонкие фрикативы , такие как[z] и [v] , имеют два источника - один в голосовой щели, а другой в надгортальном сужении.

Синтез речи [ править ]

При реализации модели формирования речи источник-фильтр источник звука или сигнал возбуждения часто моделируется как периодическая последовательность импульсов для вокализованной речи или как белый шум для невокализованной речи. Фильтр речевого тракта в простейшем случае аппроксимируется всеполюсным фильтром, где коэффициенты получаются путем выполнения линейного прогнозирования, чтобы минимизировать среднеквадратичную ошибку в воспроизводимом речевом сигнале. Затем свертка сигнала возбуждения с ответом фильтра дает синтезированную речь.

Моделирование производства человеческой речи [ править ]

Одна из возможных комбинаций источника и фильтра в голосовом тракте человека.

При воспроизведении человеческой речи источником звука являются голосовые связки , которые могут издавать периодический звук при сжатии или апериодический (белый шум) звук при расслаблении. [4] Фильтр - это остальная часть голосового тракта, которая может изменять форму в результате манипуляций с глоткой , ртом и носовой полостью. [3] Фант грубо сравнивает источник и фильтр с звучанием и артикуляцией соответственно. Источник генерирует ряд гармоник различной амплитуды , которые проходят через речевой тракт и либо усиливаются, либо ослабляются для получения звука речи. [4]

См. Также [ править ]

  • Обратный фильтр

Ссылки [ править ]

  1. ^ a b c Arai, Takayuki (2004). «История Чибы и Кадзиямы и их влияние на современную науку о речи». От звука к чувству: более 50 лет открытий в области речевой коммуникации (PDF) . С. 115–120.
  2. ^ Фант, Гуннар. "Т. Чиба и М. Кадзияма, пионеры акустики речи" . Журнал Фонетического общества Японии . 5 (2). DOI : 10.24467 / onseikenkyu.5.2_4 . Дата обращения 3 июля 2020 . CS1 maint: обескураженный параметр ( ссылка )
  3. ^ a b Фант, Гуннар (1970). Акустическая теория речевого образования с расчетами на основе рентгеновских исследований артикуляций русского языка . Де Грюйтер.
  4. ^ a b Zsiga, Элизабет С. (2012). Звуки языка: введение в фонетику и фонологию . Джон Вили и сыновья. ISBN 978-1-118-34060-8.
  • Chiba, T .; Кадзияма, М. (1942). Гласный: его природа и структура . Токио: паб Tokyo-Kaiseikan. Компания с ограниченной ответственностью.
     (в 1952 году было переиздание, а в 2003 году издание было переведено на японский язык как ISBN 4-00-002107-9 ) 
  • Стивенс, KN (2001). «Книга Чиба и Кадзияма как предшественник акустической теории речевого образования» . Журнал фонетического общества Японии . 5 (2): 6–7.
  • Стивенс, KN (1998). Акустическая фонетика . Кембридж, Массачусетс: MIT Press . ISBN 978-0-262-19404-4. (твердая обложка в 1999 г.) / (мягкая обложка в 2000 г.).