Источник – модель фильтра - Source–filter model - Wikipedia

В модель источник – фильтр представляет речь как комбинацию источника звука, такого как голосовые связки, и линейный акустический фильтр, голосовой тракт. Хотя эта модель является приблизительной, она широко используется в ряде приложений, таких как синтез речи и речь анализ из-за его относительной простоты. Это также связано с линейное предсказание. Развитие модели в значительной степени связано с ранними работами Гуннар Фант, хотя другие, особенно Кен Стивенс, также внесли значительный вклад в модели, лежащие в основе акустического анализа речи и синтеза речи.^[1] Фант построил работу Цутому Чиба и Масато Кадзияма, который первым показал связь между акустические свойства гласных и форма голосового тракта. ^[1].

Важное допущение, которое часто делается при использовании модели источник-фильтр, - это независимость источника и фильтра.^[1] В таких случаях модель следует более точно называть «моделью независимого источника-фильтра».^{[нужна цитата ]}

История

В 1942 году Чиба и Кадзияма опубликовали в своей книге исследование акустики гласных и речевого тракта. Гласный: его природа и структура. Создавая модели речевого тракта с помощью Рентгеновская фотография, они смогли предсказать формантные частоты различных гласных, установив связь между ними. Гуннар Фант, новатор в области речевого искусства, использовал исследования Чибы и Кадзиямы по рентгеновской фотографии речевого тракта для интерпретации собственных данных о звуках русской речи в Акустическая теория речевого образования, который установил модель источник-фильтр.^[2]

Приложения

В разной степени разные фонемы можно отличить по свойствам их источника (ов) и их спектральная форма. Звонкие звуки (например, гласные) имеют по крайней мере один источник из-за в основном периодического возбуждения голосовой щели, что может быть приблизительно выражено импульсный поезд во временной области и по гармоникам в частотной области, и фильтр, который зависит, например, от положения языка и выступа губ.^[3] С другой стороны, фрикативы, Такие как [s] и [f], имеют по крайней мере один источник из-за турбулентного шума, создаваемого сужением в полости рта или глотка. Так называемый озвученные фрикативы, Такие как [z] и [v], имеют два источника - один в голосовой щели, а второй - в надгортальном сужении.

Синтез речи

При реализации модели формирования речи источник-фильтр источник звука или сигнал возбуждения часто моделируется как периодическая последовательность импульсов для вокализованной речи или как белый шум для невокализованной речи. Фильтр речевого тракта в простейшем случае аппроксимируется всеполюсным фильтром, где коэффициенты получаются путем выполнения линейного предсказания, чтобы минимизировать среднеквадратичную ошибку в воспроизводимом речевом сигнале. Свертка сигнала возбуждения с характеристикой фильтра затем дает синтезированную речь.

Моделирование производства человеческой речи

Одна из возможных комбинаций источника и фильтра в голосовом тракте человека.

В производстве человеческой речи источником звука является голосовые складки, который может издавать периодический звук при сжатии или апериодический (белый шум) звук при расслаблении.^[4] Фильтр - это остальная часть голосового тракта, которая может изменять форму в результате манипуляции глотка, рот и полость носа.^[3] Фант примерно сравнивает источник и фильтр с звучание и артикуляция, соответственно. Источник производит ряд гармоники различных амплитуды, которые проходят через голосовой тракт и либо усиливаются, либо ослабленный для воспроизведения звука речи.^[4]

Смотрите также

Обратный фильтр

Рекомендации

^ ^а ^б ^c Араи, Такаяки (2004). «История Чибы и Кадзиямы и их влияние на современную науку о речи». От звука к чувству: более 50 лет открытий в области речевого общения (PDF). С. 115–120.
^ Фант, Гуннар. "Т. Чиба и М. Каджияма, пионеры акустики речи". Журнал Фонетического общества Японии. 5 (2). Дои:10.24467 / onseikenkyu.5.2_4. Получено 3 июля 2020.
^ ^а ^б Фант, Гуннар (1970). Акустическая теория речевого образования с расчетами на основе рентгеновских исследований артикуляций русского языка. Де Грюйтер.
^ ^а ^б Жига, Элизабет С. (2012). Звуки языка: введение в фонетику и фонологию. Джон Вили и сыновья. ISBN 978-1-118-34060-8.

Chiba, T .; Кадзияма, М. (1942). Гласный: его природа и структура. Токио: паб Tokyo-Kaiseikan. Компания с ограниченной ответственностью.
(было переиздание 1952 г., Японское переведенное издание 2003 г. в качестве ISBN 4-00-002107-9)
Стивенс, К. Н. (2001). «Книга Чибы и Кадзиямы как предшественник акустической теории речевого образования». Журнал фонетического общества Японии. 5 (2): 6–7.
Стивенс, К. Н. (1998). Акустическая фонетика. Кембридж, Массачусетс: MIT Press. ISBN 978-0-262-19404-4. (твердая обложка в 1999 г.) / (мягкая обложка в 2000 г.).

[arai-1] а ^б ^c Араи, Такаяки (2004). «История Чибы и Кадзиямы и их влияние на современную науку о речи». От звука к чувству: более 50 лет открытий в области речевого общения (PDF). С. 115–120.

[2] Фант, Гуннар. "Т. Чиба и М. Каджияма, пионеры акустики речи". Журнал Фонетического общества Японии. 5 (2). Дои:10.24467 / onseikenkyu.5.2_4. Получено 3 июля 2020.

[gf-3] а ^б Фант, Гуннар (1970). Акустическая теория речевого образования с расчетами на основе рентгеновских исследований артикуляций русского языка. Де Грюйтер.

[zs-4] а ^б Жига, Элизабет С. (2012). Звуки языка: введение в фонетику и фонологию. Джон Вили и сыновья. ISBN 978-1-118-34060-8.

[1]

[2]

[3]

[4]