double arrow

Параметры дискретизации


Стандартный формат оцифровки звука

Ясно, что в ходе представления звукозаписи в цифровой форме в нее вносятся некоторые искажения. Во-первых, измеренная амплитуда звука не обязана выражаться в нашем представлении целым числом. В результате возникает погрешность округления, которая может проявляться в возникновении шумового фона. Представление звука в виде дискретной последовательности сигналов, а не в виде непрерывной волны также способно порождать дефекты звучания.

Тем самым, качество и особенности записи определяется параметрами аналогово-цифрового преобразования. Разрядность представления указывает, сколько битов выделяется для записи сигналов, то есть задает точность представления амплитуды звуковой волны. Например, при восьмиразрядной записи звука величина сигнала может изменяться от -127 до 127 (всего 255 значений), при шестнадцатиразрядной - от -32767 до 32767 (всего 65535 значений).

От разрядности зависит отношение максимально возможной громкости звука к громкости шумового фона, появляющегося из-за неизбежных погрешностей дискретизации. Слуховая система человека способна воспринимать звуки, диапазон которых превышает 100 дБ (децибел). При восьмиразрядной записи представимый диапазон составляет 48 дБ, при шестнадцатиразрядной 96 дБ, что уже сравнимо с предельными возможностями человеческого слуха.




Частота дискретизации указывает, сколько раз в секунду регистрируются сигналы. В принципе, понятно, что чем выше эта частота, тем более точной оказывается запись. Однако при выборе частоты дискретизации необходимо учитывать свойства человеческого уха и законы физики.

Человеческое ухо способно слышать звук в частотном диапазоне примерно 15-20000 Гц. Существует правило, которое у нас называют теоремой Котельникова, а за рубежом - правилом Найквиста, согласно которому частота дискретизации должна не менее чем вдвое превосходить максимальную частоту записываемого звука. Если это ограничение не выполнено, то при воспроизведении такой записи слышны звуки низкой частоты, которые отсутствовали в исходной звуковой волне.

Понять, почему такое происходит, можно на следующем примере. Вспомните, как на кино- и телеэкране выглядит движение автомобиля, особенно на старых пленках. Порою кажется, что колеса машины вращаются очень медленно и притом вообще в другую сторону. Это вызвано тем, что частота кадров (которая в данном случае играет роль частоты дискретизации) слишком мала.

Между двумя последовательными кадрами, запечатленными на пленке, колесо автомобиля делает почти полный оборот, а зрительная система человека воспринимает "почти полный оборот вперед" как "небольшой поворот назад". Применительно к этому примеру теорема Котельникова гласит, что частота кадров должна быть такой, что между последовательными кадрами колесо не должно поворачиваться больше, чем на пол-оборота.



Точно то же самое происходит и в случае звукозаписи. При недостаточной частоте дискретизации пропускаются "пики" или, наоборот "впадины" звуковой волны, в результате чего регистрируемая частота оказывается значительно меньше реальной.

"Восстановленная" аналоговая форма из-за недостаточной частоты дискретизации содержит значительно меньше колебаний, чем исходная волна.

Понятно, что чем выше частота дискретизации и разрядность, тем более качественной окажется запись. Однако просто увеличивать эти параметры не имеет смысла, так как при этом увеличивается объем отдельного сигнала и число сигналов, а, следовательно, и объем записи (в том числе объем данных, которые должны обрабатываться каждую секунду при ее воспроизведении). Таким образом, нужны минимальные значения, обеспечивающие высокое качество.







Сейчас читают про: