1. Очевидной техникой сжатия, которую можно применять к речи, является удаление пауз, т.е. вместо того, чтобы использовать 44 100 выборок с нулевым значением для записи каждой секунды тишины (частота дискретизации 44,1 кГц) просто указывается длительность паузы – это сжатие без потерь.
2. Если амплитуда звука не достигает максимального уровня, который можно представить при данном размере выборки, эффективным может быть кодирование Хаффмана (Хофмана). В этом случае сигнал представляется выборками меньшего размера. Это алгоритм сжатия без потерь – всего лишь частный случай сжатия.
3. Техника компандирования (расширения) также внесла вклад в технологии сжатия речи. Она основывается на восприятии человеком разных уровней громкости и состоит в использовании нелинейных уровней квантования. Если расстояние между более высокими уровнями больше расстояния между низкими, то тихие звуки представляются детальнее, чем громкие.
4. Другая техника сжатия – это дифференциальная импульсно-кодовая модуляция. Эта схема связана с межкадровым сжатием и основана на записи разностей последовательных выборок, а не их абсолютных значений.
|
|
5. Эффективное сжатие с потерями заключается в определении данных, не имеющих значения (т.е. не влияющих на восприятие сигнала), и их отбрасывании. Если аудиосигнал оцифровывается прямолинейным образом (в ПК), в оцифрованную версию могут включаться данные, соответствующие неслышным звукам. Это объясняется тем, что сигнал записывает все физические колебания давления воздуха, являющиеся причиной звука, но за восприятие звука отвечает мозг, который (вместе с ухом) совсем не так просто реагирует на звуковые волны.
Звук часто используется как часть видео- или анимационной продукции. В этом случае необходима синхронизация звука и изображения. Для решения этой проблемы используется временная шкала, которая позволяет упорядочить аудио- и видео в некоторых приложениях редактирования видео, например, в Final Cut Pro. Изучая сигналы, редактор может определить контрольные точки звуковой дорожки (начало слогов или ударные такты в музыке), по которым выстраиваются подходящие картины.
Существует два способа генерации движущихся изображений в цифровой форме для мультимедийной продукции.
Во-первых, с помощью видеокамеры можно записать последовательность кадров реального движения в реальном мире.
Во-вторых, можно создать все кадры по отдельности либо с помощью ПК, либо записывая по одному неподвижные изображения.
В первом случае мы будем создавать видео, а во втором – анимацию.
Видеоряд состоит из набора кадров, каждый из которых является отдельным изображением.
|
|
n Считается, что для адекватной передачи исходного изображения требуется 16 млн. оттенков, поэтому используется 24-битовый формат хранения цветной картинки. Если размер изображения 640 пикселей (ширина) на 480 пикселей (высота) и глубина цвета 24 бита, то каждый кадр потребует 640х480х3=900 Кбайт.
n Запись последовательности кадров в цифровом виде требует от компьютера больших объемов внешней памяти. Одна секунда несжатого видео стандарта NTSC (сев. Америка, Япония) содержит 30 кадров. Каждая секунда видео потребует более 26 Мбайт памяти. А для стандарта видео PAL (Зап. Европа и Австралия, 24 кадра) для записи одной секунды нужен 21 Мбайт памяти, для минуты – 1,25 Гбайт.
n Но последовательность кадров недостаточно только запомнить, ее надо еще вывести на экран в соответствующем темпе. Подобной скоростью передачи информации - около 30 Мбайт/с - не обладает ни одно из существующих внешних запоминающих устройств. При таких цифрах запись (воспроизведение) видео на CD, DVD и передача по сетям – проблематична. Запись видео возможна для видео- и телестудий.
n Для уменьшения объема данных необходимы схемы сжатия для видео, а также использование других методов.
Чтобы выводить на экран компьютера оцифрованное видео, приходится идти на уменьшение объема передаваемых данных, которое достигается при помощи:
n вывода уменьшенного изображения в небольшом окне
n снижения частоты кадровой развертки до 10-15 кадров/с
n уменьшение числа бит/пиксель
Это приводит к ухудшению качества изображения.
Существуют различные форматы видео: WMA, ASF, RM, SWF, DVC, VOB, но используются редко, так как либо имеют серьезные недостатки, либо плохо совместимы с обычными средствами создания мультимедийных приложений (но можно конвертировать в другой формат с помощью любого видеоредактора).
n Самые распространенные форматы –AVI и MPEG.
n Audio Video Interleaved (AVI) – «родной» формат для Windows Media от Microsoft. Система Windows использует запатентованный кодек. При записи в этом формате используются несколько различных алгоритмов сжатия (компрессии) видеоизображения. Среди них: Cinepak, Indeo video, Motion-JPEG (M-JPEG) и др. Но только M-JPEG был признан среди них как
международный стандарт для сжатия видео. Первоначально для захвата и воспроизведения видео использовались возможности программного комплекта Video for Windows, разработанного Microsoft, однако сейчас у пользователя имеется для этого лучшие возможности. Файл формата AVI не может иметь размер больше 2 Гбайт. Понимая это, компания Microsoft объявила о разработке новых форматов, призванных заменить формат AVI:
n ASF (Advanced Screaming Format)
n AAF (Advanced Authoring Format)
Поддержка указанных форматов началась с 1999 г. При этом старый формат AVI также применяется, существуют средства для преобразования этих форматов.
Формат AVI – не только видео, но и синхронизированный с ним звук. Обычно звуковую составляющую называют звуковой дорожкой или аудиотреком. Для AVI это звук в формате WAV. В любом видеоредакторе можно выделить звуковую дорожку, сохранить в звуковом файле, отредактировать в звуковом редакторе
n Windows Media Video (WMV) – новый формат видео от Microsoft, который приходит на смену формату AVI. В его основе Windows Video Codec, разработанный на базе стандарта MPEG-4.
n Quick Time Movie (MOV) – наиболее распространенный формат для записи и воспроизведения видео, разработанный фирмой Apple для компьютеров Macintosh в рамках технологии QuickTime. Включает поддержку не только видео, но и звука, текста, потоков MPEG, расширенного набора команд MIDI, векторной графики, панорам и объектов (QT VR) и трехмерных моделей. Поддерживает несколько различных форматов сжатия видео, в том числе MPEG и Indeo, а также свой собственный метод компрессии.
n MPEG (MPG, MPEG) – формат для записи и воспроизведения видео, разработанный в 1992 г. группой экспертов по движущимся изображениям (Moving Pictures Expert Group - MPEG). Предназначен для сжатия звуковых и видеофайлов, для загрузки или пересылки, например, через Интернет.
|
|
MPEG-4 – стандарт, описывающий правила кодирования цифровой мультимедийной информации. При разработке данного стандарта основное внимание было сконцентрировано на возможности сжимать видеоданные значительно сильнее, чем предусмотрено, например, стандартом MPEG-2. Это позволяет передавать данные на низких скоростях, менее 1 Мбит/с. Такие скорости характерны для большинства пользователей Интернет и актуальны для потребителей мобильных беспроводных устройств. Записи MPEG-4 компактнее и значительно дешевле по сравнению с файлами мультимедийной информации, закодированными с MPEG-2. Также средства кодировки и расшифровки MPEG-4 проще