Источник – модель фильтра - Source–filter model - Wikipedia

В модель источник – фильтр представляет речь как комбинацию источника звука, такого как голосовые связки, и линейный акустический фильтр, голосовой тракт. Хотя эта модель является приблизительной, она широко используется в ряде приложений, таких как синтез речи и речь анализ из-за его относительной простоты. Это также связано с линейное предсказание. Развитие модели в значительной степени связано с ранними работами Гуннар Фант, хотя другие, особенно Кен Стивенс, также внесли значительный вклад в модели, лежащие в основе акустического анализа речи и синтеза речи.[1] Фант построил работу Цутому Чиба и Масато Кадзияма, который первым показал связь между акустические свойства гласных и форма голосового тракта. [1].

Важное допущение, которое часто делается при использовании модели источник-фильтр, - это независимость источника и фильтра.[1] В таких случаях модель следует более точно называть «моделью независимого источника-фильтра».[нужна цитата ]

История

В 1942 году Чиба и Кадзияма опубликовали в своей книге исследование акустики гласных и речевого тракта. Гласный: его природа и структура. Создавая модели речевого тракта с помощью Рентгеновская фотография, они смогли предсказать формантные частоты различных гласных, установив связь между ними. Гуннар Фант, новатор в области речевого искусства, использовал исследования Чибы и Кадзиямы по рентгеновской фотографии речевого тракта для интерпретации собственных данных о звуках русской речи в Акустическая теория речевого образования, который установил модель источник-фильтр.[2]

Приложения

В разной степени разные фонемы можно отличить по свойствам их источника (ов) и их спектральная форма. Звонкие звуки (например, гласные) имеют по крайней мере один источник из-за в основном периодического возбуждения голосовой щели, что может быть приблизительно выражено импульсный поезд во временной области и по гармоникам в частотной области, и фильтр, который зависит, например, от положения языка и выступа губ.[3] С другой стороны, фрикативы, Такие как [s] и [f], имеют по крайней мере один источник из-за турбулентного шума, создаваемого сужением в полости рта или глотка. Так называемый озвученные фрикативы, Такие как [z] и [v], имеют два источника - один в голосовой щели, а второй - в надгортальном сужении.

Синтез речи

При реализации модели формирования речи источник-фильтр источник звука или сигнал возбуждения часто моделируется как периодическая последовательность импульсов для вокализованной речи или как белый шум для невокализованной речи. Фильтр речевого тракта в простейшем случае аппроксимируется всеполюсным фильтром, где коэффициенты получаются путем выполнения линейного предсказания, чтобы минимизировать среднеквадратичную ошибку в воспроизводимом речевом сигнале. Свертка сигнала возбуждения с характеристикой фильтра затем дает синтезированную речь.

Моделирование производства человеческой речи

Одна из возможных комбинаций источника и фильтра в голосовом тракте человека.

В производстве человеческой речи источником звука является голосовые складки, который может издавать периодический звук при сжатии или апериодический (белый шум) звук при расслаблении.[4] Фильтр - это остальная часть голосового тракта, которая может изменять форму в результате манипуляции глотка, рот и полость носа.[3] Фант примерно сравнивает источник и фильтр с звучание и артикуляция, соответственно. Источник производит ряд гармоники различных амплитуды, которые проходят через голосовой тракт и либо усиливаются, либо ослабленный для воспроизведения звука речи.[4]

Смотрите также

Рекомендации

  1. ^ а б c Араи, Такаяки (2004). «История Чибы и Кадзиямы и их влияние на современную науку о речи». От звука к чувству: более 50 лет открытий в области речевого общения (PDF). С. 115–120.
  2. ^ Фант, Гуннар. "Т. Чиба и М. Каджияма, пионеры акустики речи". Журнал Фонетического общества Японии. 5 (2). Дои:10.24467 / onseikenkyu.5.2_4. Получено 3 июля 2020.
  3. ^ а б Фант, Гуннар (1970). Акустическая теория речевого образования с расчетами на основе рентгеновских исследований артикуляций русского языка. Де Грюйтер.
  4. ^ а б Жига, Элизабет С. (2012). Звуки языка: введение в фонетику и фонологию. Джон Вили и сыновья. ISBN  978-1-118-34060-8.