Основными организациями по стандартизации кодирования видео являются:
- ITU-T - Группа экспертов кодирования видео (Video или VisualCodingExpertsGroup - VCEG) в Международном союзе электросвязи - Телекоммуникационный сектор стандартизации (InternationalTelecommunicationsUnion - TelecommunicationsStandardizationSector - ITU-T, организация ООН, ранее МККТТ - CCITT), Исследовательская группа 16, Вопрос 6 (StudyGroup 16, Question 6);
- ISO/IEC - Группа экспертов подвижных изображений (MovingPictureExpertsGroup - MPEG) в Международной организации по стандартизации и Международной электротехнической комиссии, Объединенный технический комитет 1, Подкомиссия 29, Рабочая группа 11 (InternationalStandardizationOrganizationandInternationalElectrotechnicalCommission, JointTechnicalCommitteeNumber 1, Subcommittee 29, WorkingGroup 11).
Движущей силой создания стандартов кодирования видеоинформации являются различные приложения и развитие их аппаратного обеспечения. Блочное гибридное кодирование является, по сути, ядром всех стандартов сжатия видео. Среди ранних стандартов можно перечислить H.261, MPEG-1, MPEG-2/H.262, H.263 и MPEG-4, часть 2 (рисунок 13.1).
Наиболее эффективным является стандарт H.264/AVC (MPEG- 4, Part 10).
|
|
Недавно были приняты поправки по кодированию масштабируемого видео (SVC - scalablevideocoding), кодированию многоракурсного видео (MVC - multiviewvideocoding) и реконфигурируемого кодирования видео [18].
Такие системы требуют разработки кодеров, позволяющих декодерам обладать некоторой гибкостью. Предположим, сигналы от многих камер совместно кодировались с использованием инструментов, развитых в контексте кодирования множества ракурсов (MVC - multiviewcoding). Тогда пользователь может изменять угол наблюдения экрана, на самом деле выбирая только один из ракурсов в потоке бит.
Наиболее известные на сегодняшний день алгоритмы сжатия видео H.261, H.263, H.264 и группа MPEG-1, MPEG-2, MPEG-4. Все они используют гибридную модель, основанную на дискретном косинусном преобразовании (ДКП) для устранения пространственной внутрикадровой избыточности и дифференциальной импульсно-кодовой модуляции (ДИКМ) для удаления межкадровой избыточности.
Рисунок 13.1 - История развития методов кодирования видео
В 2013 г. появился новый стандарт сжатия видеоизображений H.265. Разработчики полагают, что он позволит вдвое сократить необходимую для передачи видеоинформации пропускную способность каналов.
В таблице 13.1 приведена классификация подходов к решению задачи сжатия изображений и видео, а также соответствующее развитие технологий.
Таблица 13.1 – Классификация подходов к сжатию изображений и видеоинформации
Поколение | Подход | Технология |
Прямое кодирование аналогового сигнала | Импульсно-кодовая модуляция (ИКМ) | |
Устранение избыточности | ДКП, ДВП, …. | |
Структурное кодирование | Сегментация изображений | |
Анализ и синтез | Кодирование на основе моделей | |
Распознавание и восстановление | Кодирование на основе базы знаний | |
Интеллектуальное кодирование | Семантический анализ и кодирование |
|
|
Говоря о 4-м и 5-м поколениях, можно отметить, что распознавание и восстановление подразумевает определение типа контента (дом, автомобиль, пейзаж, лицо и т.д.) с целью применения метода кодирования, ориентированного на данный конкретный контент. В этом направлении сделан большой шаг в алгоритме MPEG-4, который применяет специфическую технику распознавания, кодирования и дальнейшую «анимацию» изображения лица и фигуры человека.
В стандарте MPEG-7 сделан еще один шаг на пути к 5-му поколению. В нем задается некоторый стандартный способ описания различных типов аудиовизуальной информации. Элементы, являющиеся описанием аудиовизуального контента известны как «метаданные». Кодируется не само изображение, а метаданные, его описывающие. То есть достаточно задать массив атрибутов, например, лица человека, для воспроизведения на приемной стороне.
Высшим уровнем представления является семантическая информация в виде описания сцены словами.
Можно заметить аналогию с историей развития алгоритмов кодирования звуковых сигналов. От простой «оцифровки» к устранению избыточности, затем к обработке на основе модели слухового аппарата человека и к распознаванию отдельных фонем (вокодеры) с целью передачи только параметров модели речи для дальнейшего синтеза на приемной стороне.
В настоящее время активно развивается направление исследований, связанное с ортогональными базисами и вейвлет-преобразованиями. Например, матрицы Адамара-Марсенна, Адамара-Эйлера, Адамара-Ферма, 3D вейвлет-декомпозиция. Первые эксперименты показывают, что одновременно можно осуществлять сжатие, защиту от несанкционированного доступа и защиту от преднамеренного искажения.