Кодирование звуковой информации

Принцип оцифровки (кодирования) звука заключается в преобразовании непрерывного разного по величине амплитудно-частотного звукового сигналов в закодированную последовательность чисел, представляющих дискретные значения амплитуд этого сигнала, взятые через определённый промежуток времени. При этом на каждом временнóм отрезке определяют среднюю амплитуду сигнала. Вариант преобразования аналогового сигнала в цифровой представлен на Рис. 3.

Полученное в результате дискретизации множество значений называется дискретным представлением исходной непрерывной функции «n» и является конечной величиной. Очевидно, что чем меньше «n», тем меньше узлов, и, как следствие, меньше точность, которая может привести к потере информации, а чем реже (меньше) промежутки времени, тем качество закодированного сигнала выше. К потерям преобразуемой информации способны привести и помехи от используемых технических устройств.

 

Рис. 3.

 

Согласно Теореме отсчётов Котельникова (1933 год, аналогичные теоремы представил и американский учёный Шеннон) непрерывный сигнал можно полностью отобразить и точно воссоздать по последовательности измерений или отсчётов величины этого сигнала через одинаковые интервалы времени, меньшие или равные половине периода максимальной частоты, имеющейся в сигнале.

То есть минимальная частота дискретизации должна быть в два раза больше максимальной частоты передаваемого непрерывного сигнала (например, для дискретизации воспринимаемого человеком звукового сигнала потребуется частота квантования не менее 40 КГц). В этом случае преобразования будет выполнено без потерь информации.

Согласно Шеннону (первая теорема) можно создать систему эффективного кодирования дискретных сообщений, у которой среднее число двоичных символов на один символ сообщения асимптотически стремится к энтропии источника сообщений (в отсутствии помех).

Вторая теорема Шеннона гласит, что при наличии помех в канале всегда можно найти такую систему кодирования, при которой сообщения будут переданы с заданной достоверностью.

 

Преобразование аналогового сигнала в цифровой (двоичную форму) осуществляется с помощью аналогово-цифровых преобразователей (АЦП; англ. «analog-to-digital conversion»). После дискретизации (преобразования непрерывного сигнала в многоуровневый ступенчатый сигнал) осуществляется квантование отсчётов – второй этап алфавитно-цифрового преобразования. При этом производятся измерения мгновенных значений уровней сигнала, полученных в каждом отсчёте.

Количество выборок в секунду, т.е. частота дискретизации аналогового звукового сигнала, может принимать различные значения. Минимально для кодирования амплитуды звукового сигнала отводят один байт (8 бит), что позволяет описать 256 уровней громкости. В этом случае частота дискретизациисоставляет 5,5 КГц, и в результате получается не слишком высокое качество звука. Такую кодировку в монофоническом канале используют при записи звука на диктофон, так как человеческий голос самый неприхотливый к компрессии, а также музыки с преобладанием низких частот.

Поскольку максимальная частота речевого сигнала в телефонных системах составляет 4 КГц, то частота его дискретизации равна 8 КГц, а одна минута звучания – менее 480 Кб. Если для кодирования звука взять два байта, то можно задавать более 65 тысяч значений амплитуды сигнала. В этом случае получается высококачественная запись звука, соответствующая кодированию звука с частотой дискретизации 44,1 КГц или 48 КГц. Таким образом, качество звука в дискретной форме может быть очень плохим (качество радиотрансляции) при 8 битах и 5,5 КГц и очень высоким (качество aудиo CD) при 16 битах и 44 кГц. Основные виды звуковых сигналов и соответствующие им частоты аналоговых и цифровых сигналов приведены в таблице 3.

 

Таблица 3

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: