Лекция № 9. Перспективы увеличения скорости, пропускной способности сетевых каналов. Алгоритмы сжатия видеоинформации. Стандарт сжатия видео MPEG-2, MPEG-4

 

9.1 Видеоинформационныеприложенияиобъемцифровойинформации

 

Основными организациями по стандартизации кодирования видео являются:

- ITU-T - Группа экспертов кодирования видео (Video или VisualCodingExpertsGroup - VCEG) в Международном союзе электросвязи - Телекоммуникационный сектор стандартизации (InternationalTelecommunicationsUnion - TelecommunicationsStandardizationSector - ITU-T, организация ООН, ранее МККТТ - CCITT), Исследовательская группа 16, Вопрос 6 (StudyGroup 16, Question 6);

- ISO/IEC - Группа экспертов подвижных изображений (MovingPictureExpertsGroup - MPEG) в Международной организации по стандартизации и Международной электротехнической комиссии, Объединенный технический комитет 1, Подкомиссия 29, Рабочая группа 11 (InternationalStandardizationOrganizationandInternationalElectrotechnicalCommission, JointTechnicalCommitteeNumber 1, Subcommittee 29, WorkingGroup 11).

Движущей силой создания стандартов кодирования видеоинформации являются различные приложения и развитие их аппаратного обеспечения. Блочное гибридное кодирование является, по сути, ядром всех стандартов сжатия видео. Среди ранних стандартов можно перечислить H.261, MPEG-1, MPEG-2/H.262, H.263 и MPEG-4, часть 2 (рисунок 9.1).

Наиболее эффективным является стандарт H.264/AVC (MPEG- 4, Part 10).

Недавно были приняты поправки по кодированию масштабируемого видео (SVC - scalablevideocoding), кодированию многоракурсного видео (MVC - multiviewvideocoding) и реконфигурируемого кодирования видео [18].

Такие системы требуют разработки кодеров, позволяющих декодерам обладать некоторой гибкостью. Предположим, сигналы от многих камер совместно кодировались с использованием инструментов, развитых в контексте кодирования множества ракурсов (MVC - multiviewcoding). Тогда пользователь может изменять угол наблюдения экрана, на самом деле выбирая только один из ракурсов в потоке бит.

Наиболее известные на сегодняшний день алгоритмы сжатия видео H.261, H.263, H.264 и группа MPEG-1, MPEG-2, MPEG-4. Все они используют гибридную модель, основанную на дискретном косинусном преобразовании (ДКП) для устранения пространственной внутрикадровой избыточности и дифференциальной импульсно-кодовой модуляции (ДИКМ) для удаления межкадровой избыточности.

Рисунок 9.1 - История развития методов кодирования видео

 

В таблице 9.1 приведена классификация подходов к решению задачи сжатия изображений и видео, а также соответствующее развитие технологий.

Говоря о 4-м и 5-м поколениях, можно отметить, что распознавание и восстановление подразумевает определение типа контента (дом, автомобиль, пейзаж, лицо и т.д.) с целью применения метода кодирования, ориентированного на данный конкретный контент. В этом направлении сделан большой шаг в алгоритме MPEG-4, который применяет специфическую технику распознавания, кодирования и дальнейшую «анимацию» изображения лица и фигуры человека.

 

Таблица 9.1 – Классификация подходов к сжатию изображений и видеоинформации

Поколение Подход Технология
  Прямое кодирование аналогового сигнала Импульсно-кодовая модуляция (ИКМ)
  Устранение избыточности ДКП, ДВП, ….
  Структурное кодирование Сегментация изображений
  Анализ и синтез Кодирование на основе моделей
  Распознавание и восстановление Кодирование на основе базы знаний
  Интеллектуальное кодирование Семантический анализ и кодирование

 

В стандарте MPEG-7 сделан еще один шаг на пути к 5-му поколению. В нем задается некоторый стандартный способ описания различных типов аудиовизуальной информации. Элементы, являющиеся описанием аудиовизуального контента известны как «метаданные». Кодируется не само изображение, а метаданные, его описывающие. То есть достаточно задать массив атрибутов, например, лица человека, для воспроизведения на приемной стороне.

Высшим уровнем представления является семантическая информация в виде описания сцены словами.

Можно заметить аналогию с историей развития алгоритмов кодирования звуковых сигналов. От простой «оцифровки» к устранению избыточности, затем к обработке на основе модели слухового аппарата человека и к распознаванию отдельных фонем (вокодеры) с целью передачи только параметров модели речи для дальнейшего синтеза на приемной стороне.

В настоящее время активно развивается направление исследований, связанное с ортогональными базисами и вейвлет-преобразованиями. Например, матрицы Адамара-Марсенна, Адамара-Эйлера, Адамара-Ферма, 3D вейвлет-декомпозиция. Первые эксперименты показывают, что одновременно можно осуществлять сжатие, защиту от несанкционированного доступа и защиту от преднамеренного искажения.

На рисунке 9.2 поясняются основные тенденции развития современных видеоинформационных систем. Наряду с ростом числа пикселов в системах ТВ с одной точкой наблюдения, выражающемся в переходе от систем ТВ к ТВЧ, и затем к ТУВЧ, наблюдается рост числа точек наблюдения - два ракурса для стереоскопических систем, до 16 ракурсов для систем многоракурсного ТВ, и практически бесконечное число видов для систем ТСПТН (FTV).

Между тем передавать эти изображения предстоит с использованием суще­ствующих каналов связи, пропускная способность которых, естественно, остается прежней. Частотное пространство телевидения во многих случаях ограничено, а, кроме того, крайне привлекательным представляется внедрять новые системы телевидения, не меняя при этом существующую линейную каналообразующую аппа­ратуру. Поэтому решение такой задачи, как обеспечение возможности передачи хотя бы 4-6 программ телевидения в стандартном радиоканале, является сегодня исключительно важным, прежде всего с точки зрения экономической [18].

 

 

Рисунок 9.2 - Основные тенденции развития современных видеоинформационных систем

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: