Полосное кодирование и блок фильтров

Наилучшим методом кодирования звука, учитывающим эффект маскирования, оказывается полосное кодирование. Сущность его заключается в следующем. Группа отсчетов входного звукового сигнала, называемая кадром, поступает на блок фильтров (БФ), который содержит, как правило, 32 полосовых фильтра. Учитывая сказанное ранее о критических полосах и маскировании, хорошо бы иметь в блоке фильтров полосы пропускания, по возможности, совпадающие с критическими. Однако практическая реализация цифрового блока фильтров с неравными полосами сложна и оправданна только в устройствах самого высокого класса. Обычно используется блок фильтров на основе квадратурно-зеркальных фильтров (КЗФ) с равными полосами пропускания, охватывающих с небольшим взаимным перекрытием всю полосу слышимых частот (рисунок 2.10).

При частоте дискретизации 48 кГц полоса пропускания секции фильтра составляет 750 Гц. Каждая секция фильтра позволяет проводить расщепление полосы пропускания на две равные части, не увеличивая при этом объем данных в каждой половине полосы, т.е. с одновременной понижающей дискретизацией. Расщепление на N = 2 ^m полос производится каскадным включением m секций, содержащих соответственно 1, 2, 4...2 ^m ^-1 фильтров (рисунок 2.11).

Рисунок 2.10 — Номинальная АЧХ блока фильтров

Рисунок 2.11 — Трехсекционный квадратурно-зеркальный фильтр

На выходе каждого фильтра оказывается та часть входного сигнала, которая попадает в полосу пропускания данного фильтра. Далее в каждой полосе с помощью ПАМ анализируется спектральный состав сигнала и оценивается, какую часть сигнала следует передавать без сокращений, а какая лежит ниже порога маскирования и может быть переквантована на меньшее число битов.

Поскольку в реальных звуковых сигналах максимальная энергия обычно сосредоточена в нескольких частотных полосах, может оказаться, что сигналы в других полосах не содержат различимых звуков и могут вообще не передаваться. Наличие, например, сильного сигнала в одной полосе означает, что несколько вышележащих полос будут маскироваться и могут кодироваться меньшим числом битов.

Для сохранения максимального динамического диапазона определяется максимальный отсчет в кадре и вычисляется масштабирующий множитель, который приводит этот отсчет к верхнему уровню квантования. На этот же множитель умножаются и все остальные отсчеты. Масштабирующий множитель передается к декодеру вместе с кодированными данными для коррекции коэффициента передачи последнего. После масштабирования производится оценка порога маскирования и осуществляется перераспределение общего числа битов между всеми полосами.