Введение. В работе целью исследования было показать различные изменения статистических характеристик фонем речи в процессе кодирования речи методом RPE/LPC/LTP

В работе целью исследования было показать различные изменения статистических характеристик фонем речи в процессе кодирования речи методом RPE/LPC/LTP. Для этого анализировались сигналы, относящиеся к различным классам фонем (гласные «У», полугласные «Р», согласные носовые «М», согласные взрывные невокализированные «П», фрикативные вокализированные «Ж»). Физические процессы, лежащие в основе формирования этих фонем, существенно отличаются. Математически они описываются различными системами линейных и нелинейных уравнений. Поэтому статистические характеристики различных классов фонем существенно отличаются. Сформированные сигналы можно отнести к квазипериодическим (гласные и полугласные), сигналам со смешанным спектром (вокализированные), квазишумовым (невокализированные) и другие.

Различия в формировании анализируемых фонем существенным образом влияют на характеристики сигналов в процессе их кодирования. Параметры обеляющих РФ определяются величиной корреляции сигналов, которые зависят от формы и ширины полосы спектров анализируемых сигналов. При этом следует учитывать, что количество звеньев РФ кратковременного и долговременного предсказания фиксировано. Поэтому синтезируемые модели линейного предсказания кодируемых процессов не имеют оптимального порядка. Особенно на характеристики модели влияет ограниченность длины выборки (160 отсчетов). Следует также отметить, что в большинстве случаев при кодировании речи определяются статистические характеристики не только «чистых» фонем, а переходные участки от одной фонемы к другой, не установившиеся начальные и конечные участки фонем. На статистические характеристики речи оказывает влияние интонация, звуковые помехи окружающей среды и другие факторы.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: