Введение. В данном разделе представлено исследование работы кодека речи на разных этапах прохождения сигнала через функциональные блоки обработки информации

В данном разделе представлено исследование работы кодека речи на разных этапах прохождения сигнала через функциональные блоки обработки информации. Структурная схема кодека была показана на рис. 3.11. Для моделирования использовалась программа, разработанная в среде MATLAB.

4.1 Исследования работы кодека для фонемы «О»

На рис. 4.1 представлен график мгновенных значений оцифрованной фонемы с частотой дискретизации 8 кГц. Из графика видно, что сигнал является стационарным процессом, в котором присутствуют колебания с несколькими частотами.

Рисунок 4.1 –Мгновенное значение фонемы «О»

На рис.4.2 показан график АКФ выборки фонемы «О». Пик, приходящийся на 151 отсчет, характеризует наличие в сигнале периода основного тона.

Рисунок 4.2 – АКФ фонемы«О»

ПСПМ, полученная по модели АР(8), показана на рис. 4.3.

Рисунок 4.3 – ПСПМ фонемы«О»

При сжатии речи, оцифрованный сигнал поступает на блок кратковременного предсказания, где получают выборочные оценки восьми коэффициентов отражения РФ, представленных на рис. 4.4. С ростом индекса коэффициентов отражения РФ их величина убывает, т.к. сигнал существенно обеляется.

Рисунок 4.4 – Коэффициенты отражения фильтра LPC для фонемы «О»

АКФ остатка предсказания LPC для фонемы «О» показана на рис. 4.5. На рис. 4.5 видно, что период основного тона находится на 151 отсчете КФ и его уровень равный 0.2835. Восьмизвенный РФ не может скомпенсировать полностью колебания с периодом основного тона из-за большого периода колебаний.

Рисунок 4.5 –АКФ остатка предсказания LPC для фонемы «О»

Остаток кратковременного предсказания поступает на РФ долговременного предсказания. В качестве фильтра применяется РФ третьего порядок. Длина подвектора для сигнала, являющегося ошибкой долговременного предсказания, представленного в виде СВСП, равна 68 отсчетов. Такая длина позволяет учесть в коэффициентах РФ третьего порядка, долговременные изменения в речи с периодом основного тона более сотни отсчетов. На рис. 4.6 представлены три коэффициента отражения РФ.

Рисунок 4.6 – Коэффициенты отражения фильтра LTP с использованием СВСП представления

АКФ остатка предсказания показана на рис. 4.7. Несмотря на то, что уровень пика корреляционной функции со сдвигом, равном периоду основного тона снизился незначительно, громоздкие операции по определению периода основного тона не использовались. Это существенно экономит вычислительные затраты процессора при анализе речевых сигналов. Математическое ожидание модулей коэффициентов предсказания равно 0.075102. Из рисунка 4.7 видно, что РФ обелил частично сигнал, но сохранил информацию об основном тоне в коэффициентах отражения. Поэтому необходимо использовать в качестве порождающего процесса остаток долговременного предсказания, обработанный блоком RPE.

Рисунок 4.7 – АКФ остатка предсказания LTP

Остаток долговременного предсказания поступает на RPE блок, где происходит прореживание ошибки предсказания по схеме: первые 10 значений остаются неизменными, т.к. при воспроизведении, такое количество показало наилучшее качество. Процедура децимации производится в соотношении один к трем.

На рис. 4.8 показан график АКФ сигнала, дополненного нулями, на выходе блока RPE.

Рисунок 4.8 – АКФ на выходе блока RPE

ПСПМ сигнала поступающего в мультиплексор показана на рис. 4.9. Нижний уровень на графике соответствует нижнему уровню рис. 4.3. Как видно из рис. 4.9 в мультиплексор подается практически белый шум.

Рисунок 4.9 – ПСПМ сигнала поступающего в мультиплексор

На приемной стороне принятый сигнал демультиплексируется. На вход генератора долговременного предсказания поступает сигнал, который был на выходе блока RPE и коэффициенты отражения блока LTP. На рис. 4.10 показана АКФ сигнала на выходе генератора долговременного предсказания.

Рисунок 4.10 – АКФ на выходе генератора LTP

Затем сгенерированный сигнал с восстановленными долговременными изменениями поступает на генератор кратковременного предсказания. На рис. 4.11 изображен график АКФ восстановленной фонемы, а её ПСПМ показана на рис. 4.12.

Рисунок 4.11 – АКФ восстановленной фонемы

Рисунок 4.12 – ПСПМ восстановленной фонемы

Если сравнить графики на рис. 4.2 и рис. 4.3; рис. 4.3 и рис. 4.12, то не сложно заметить, что синтезированный сигнал соответствует кодируемому. Некоторые отличия связаны с некоторой потерей информации.

3-й вариант

4 РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЙ КОДЕКА РЕЧЕВОГО СИГНАЛА


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: