MPEG-4 обеспечивает большую степень сжатия для:
1) видеосвязи по тлф и низкоскоростным каналам (64 кбит/с);
2) передачи видео и звука по Интернет;
/обеспечивает интерактивность/
Выбор метода кодирования - по характеру изображения и коэффициенту сжатия. MPEG-4 сжимает натуральные, синтетические изображения и объединяет их при воспроизведении.
Методы кодирования натуральных изображений:
1) Прямоугольные изображения (обычные ТВ кадры) -
гибридный метод, с оценкой и компенсацией движения для МБ (16x16) и ДКП ошибки предсказания в блоках (8x8).
2 уровня:
1.Очень низкой скорости VLBV (Very Low Bitrate Video)-
для низкого разрешения и fк = 10...15 Гц по узкополосным каналам с 5...64 кбит/с.
Используется в видео-тлф с невысоким качеством изображения.
2. Высокой скорости (High bitrate) -
для высокого разрешения, 64 кбит/с... 10 Мбит/с.
Используется в видеосвязи с высоким качеством,
для передачи тв-программ.
2) Кодирование объектов сложной формы, основанное на содержании (большее сжатие при учете свойств VO)
При предсказании с компенсацией движения смещаются не прямоугольные МБ, а выделенные области, изменяющие форму.
Т.о. ошибка предсказания и объем информации
/разность изображений/- уменьшаются (на сх.-Пред.2)
Вместо векторов движения передаются изменения координат и формы видеообъекта. (Кодер формы)
Данные о форме VO > объема данных о векторе движения
45. Какие методы используются в МРЕG-4 для передачи изображений человеческих лиц?
Методы кодирования синтезированных изображений:
Синтетические изображения лица и тела м.б. использованы вместо настоящих. Передача параметров модели требует меньшей скорости.
• в статике описываются параметрами
FDP (Facial Definition Parameters),
• в динамике - FAP (Facial Animation Parameters).
Статические FDP - передаются в начале сеанса связи. Для воспроизведения мимики лица и движений тела передаются FAP
Модель лица, (сетка из D-ячеек, заполненных текстурой).
2-мерные изображения- из проекции 3-х мерной модели на плоскость.
Иногда:
информацию об изменениях «картинки» получают на основе другой информации.
Пример: Движения рта и мимика говорящего
м.б. синтезированы по звуку речи.