Лекция № 13. Развития стандартов сжатия видеоинфомации

Основными организациями по стандартизации кодирования видео являются:

- ITU-T - Группа экспертов кодирования видео (Video или VisualCodingExpertsGroup - VCEG) в Международном союзе электросвязи - Телекоммуникационный сектор стандартизации (InternationalTelecommunicationsUnion - TelecommunicationsStandardizationSector - ITU-T, организация ООН, ранее МККТТ - CCITT), Исследовательская группа 16, Вопрос 6 (StudyGroup 16, Question 6);

- ISO/IEC - Группа экспертов подвижных изображений (MovingPictureExpertsGroup - MPEG) в Международной организации по стандартизации и Международной электротехнической комиссии, Объединенный технический комитет 1, Подкомиссия 29, Рабочая группа 11 (InternationalStandardizationOrganizationandInternationalElectrotechnicalCommission, JointTechnicalCommitteeNumber 1, Subcommittee 29, WorkingGroup 11).

Движущей силой создания стандартов кодирования видеоинформации являются различные приложения и развитие их аппаратного обеспечения. Блочное гибридное кодирование является, по сути, ядром всех стандартов сжатия видео. Среди ранних стандартов можно перечислить H.261, MPEG-1, MPEG-2/H.262, H.263 и MPEG-4, часть 2 (рисунок 13.1).

Наиболее эффективным является стандарт H.264/AVC (MPEG- 4, Part 10).

Недавно были приняты поправки по кодированию масштабируемого видео (SVC - scalablevideocoding), кодированию многоракурсного видео (MVC - multiviewvideocoding) и реконфигурируемого кодирования видео [18].

Такие системы требуют разработки кодеров, позволяющих декодерам обладать некоторой гибкостью. Предположим, сигналы от многих камер совместно кодировались с использованием инструментов, развитых в контексте кодирования множества ракурсов (MVC - multiviewcoding). Тогда пользователь может изменять угол наблюдения экрана, на самом деле выбирая только один из ракурсов в потоке бит.

Наиболее известные на сегодняшний день алгоритмы сжатия видео H.261, H.263, H.264 и группа MPEG-1, MPEG-2, MPEG-4. Все они используют гибридную модель, основанную на дискретном косинусном преобразовании (ДКП) для устранения пространственной внутрикадровой избыточности и дифференциальной импульсно-кодовой модуляции (ДИКМ) для удаления межкадровой избыточности.

Рисунок 13.1 - История развития методов кодирования видео

 

В 2013 г. появился новый стандарт сжатия видеоизображений H.265. Разработчики полагают, что он позволит вдвое сократить необходимую для передачи видеоинформации пропускную способность каналов.

В таблице 13.1 приведена классификация подходов к решению задачи сжатия изображений и видео, а также соответствующее развитие технологий.

 

Таблица 13.1 – Классификация подходов к сжатию изображений и видеоинформации

Поколение Подход Технология
  Прямое кодирование аналогового сигнала Импульсно-кодовая модуляция (ИКМ)
  Устранение избыточности ДКП, ДВП, ….
  Структурное кодирование Сегментация изображений
  Анализ и синтез Кодирование на основе моделей
  Распознавание и восстановление Кодирование на основе базы знаний
  Интеллектуальное кодирование Семантический анализ и кодирование

 

Говоря о 4-м и 5-м поколениях, можно отметить, что распознавание и восстановление подразумевает определение типа контента (дом, автомобиль, пейзаж, лицо и т.д.) с целью применения метода кодирования, ориентированного на данный конкретный контент. В этом направлении сделан большой шаг в алгоритме MPEG-4, который применяет специфическую технику распознавания, кодирования и дальнейшую «анимацию» изображения лица и фигуры человека.

В стандарте MPEG-7 сделан еще один шаг на пути к 5-му поколению. В нем задается некоторый стандартный способ описания различных типов аудиовизуальной информации. Элементы, являющиеся описанием аудиовизуального контента известны как «метаданные». Кодируется не само изображение, а метаданные, его описывающие. То есть достаточно задать массив атрибутов, например, лица человека, для воспроизведения на приемной стороне.

Высшим уровнем представления является семантическая информация в виде описания сцены словами.

Можно заметить аналогию с историей развития алгоритмов кодирования звуковых сигналов. От простой «оцифровки» к устранению избыточности, затем к обработке на основе модели слухового аппарата человека и к распознаванию отдельных фонем (вокодеры) с целью передачи только параметров модели речи для дальнейшего синтеза на приемной стороне.

В настоящее время активно развивается направление исследований, связанное с ортогональными базисами и вейвлет-преобразованиями. Например, матрицы Адамара-Марсенна, Адамара-Эйлера, Адамара-Ферма, 3D вейвлет-декомпозиция. Первые эксперименты показывают, что одновременно можно осуществлять сжатие, защиту от несанкционированного доступа и защиту от преднамеренного искажения.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: