Кодирование звуковой информации

Звуковые сигналы образуют непрерывный спектр, т. е. являются аналоговыми, поэтому их представление в виде дискретных цифровых сигналов выполняется с помощью специальных устройств – аналого-цифровых преобразователей (АЦП). Обратное преобразование, которое необходимо для воспроизведения звука, закодированного числовым кодом, производится с помощью цифро-аналоговых преобразователей (ЦАП).

Проще говоря, при вводе звука в компьютер АЦП с определенной частотой записывает в память число, соответствующее уровню сигнала в данный момент. Стандартными являются частоты дискретизации 8000 (телефон), 11025, 22050 (радио), 44100 (Аудио CD), 48000 (DVD), 96000 и выше Гц – в процессиональных системах обработки звука.

Как следует из теоремы Котельникова, для того, чтобы однозначно восстановить исходный сигнал, частота дискретизации должна более чем в два раза превышать наибольшую частоту в спектре сигнала. Человеческое ухо воспринимает звуковые волны частотой до 20 кГц, поэтому в качестве базовой для Аудио CD выбрана частота 44100 Гц.

Кодирование видео

С программной точки зрения видео – это последовательность картинок, которые необходимо показывать одну за другой. Поэтому видео можно хранить просто как набор графических файлов, каждый из которых соответствует определенному кадру видео. Однако, объем такого видео будет очень большим (п: 1920х1080х3байтах25кадровх60секх60мин = 1час видео = 560 Гб.)

Поэтому видео хранят в сжатом виде, применяя специальные алгоритмы компрессии с потерями.

Квантование:: берется некоторое количество встречающихся чаще всего цветов, при этом учитывается чувствительность глаза человека к определенным цветам. Далее для каждой точки изображения назначается ближайший цвет из выбранных как среднеквадратичная разность RGB-составляющих.

Преобразование RGB-YUV. Чувствительность глаза человека к яркостной составляющей выше, чем к цветовой, поэтому цветовые составляющие кодируются с большими потерями

Цифровое косинус-преобразование (DCT – Digital Cosines Transform)

Раскладывает изображение на частотные составляющие. Глаз человека воспринимает искажение в высокочастотной составляющей гораздо меньше, чем в низкочастотной - такую особенность зрения и эксплуатирует DCT, кодирующий высокочастотные искажения ("цветовой шум") со значительными потерями.

Также используются сложные математические алгоритмы «слежения» за движущимися частями изображения, энтропийного кодирования и т.п. При этом достигается очень высокая степень сжатия при практически неощутимом ухудшении качества.