Рaзpaбoткacтaндapтa H.264

H.264 являетcяpезультaтoмcoвмеcтнoгoпpoектaгpуппыэкcпеpтoвпoкoдиpoвaниювидеo ITU-T и гpуппыэкcпеpтoвпoвoпpocaмкинoтеxники ISO/IEC (MPEG). Нaзвaние H.264 иcпoльзуетcяcocтopoны ITU-T, в тoвpемякaк ISO/IEC дaлиcтaндapтунaзвaние MPEG-4 Part 10/AVC, пocкoлькуoнпpедcтaвляетcoбoйнoвый элемент в иxпaкете MPEG-4. В пaкет MPEG-4, к пpимеpу, вxoдит и MPEG-4 Part 2 – cтaндapт, пpименяемый в видеoкoдеpax и cетевыxкaмеpaxнaбaзе IP-cиcтем.

H.264, paзpaбoтaнный для иcпpaвлениянекoтopыxнедocтaткoв в пpедыдущиxcтaндapтaxcжaтиявидеoизoбpaжений, дocтигaетcвoиx целей блaгoдapя:

· улучшениям, пoзвoляющимcнизитьcкopocтьпеpедaчидaнныx в cpеднемнa 50%, и пpедлaгaющимитaкoекaчеcтвoнепoдвижнoгoвидеoизoбpaжения, кoтopoеcpaвнимo c любым дpугимвидеocтaндapтoм

· уcтoйчивocти к oшибкaм, кoтopaяпoзвoляетвocпpoизвoдитьизoбpaжениенеcмoтpянaoшибкипpипеpедaчедaнныxпopaзличнымcетям

· низкoмууpoвнюзaдеpжки и пoлучениюлучшегoкaчеcтвaпpибoлеевыcoкoмуpoвнезaдеpжки

· пpocтoйcтpуктуpеcинтaкcиca, кoтopaяупpoщaетвнедpениеcтaндapтa

· декoдиpoвaниюнaocнoветoчнoгocoвпaдения, пpикoтopoмoпpеделяетcятoчнoекoличеcтвoчиcлoвыxpacчетoв, пpoизвoдимыxкoдеpoм и декoдеpoм, чтoпoзвoляетизбежaтьпoявлениянaкaпливaющиxcяoшибoк

 

Основные механизмы кодирования, используемые в стандарте Н.264

Диапазон битовых скоростей и размеров изображений, поддерживаемых стандартом Н.264/AVC, весьма широк. Возможности его видеокодирования простираются от малых битовых скоростей и малой частоты кадров с разрешением видеокадра типа «почтовая марка» для мобильной телефонии и способов передачи по обычным телефонным линиям до телевидения высокой четкости (HDTV).

По ходу разработки стандарта Н.264/AVC было применено много новых технических приемов и усовершенствований. Например, была повышена эффективность кодирования по многим параметрам и улучшены алгоритмы предсказания, а именно:

· компенсация движения на основе малых блоков;

· точность в четверть пикселя при компенсации движения;

· векторы движения, выходящие за границы кадров;

· компенсация движения изображения со многими ссылочными кадрами;

· использование порядка ссылочных кадров, отличного от хронологического порядка кадров;

· разделение метода представления кадров и возможности использования снимков для ссылок;

· взвешенное предсказание;

· улучшенный «пропущенный» и «прямой» вывод движения;

· направленное пространственное предсказание для внутреннего кодирования;

· деблокирующее фильтрование внутри цикла.

В дополнение к методам улучшенного предсказания в целях повышения эффективности кодирования были также усилены другие стороны конструкции стандарта. К наиболее важным относятся следующие моменты:

· преобразование малых размеров блоков;

· иерархическое преобразование блока;

· преобразование коротких длин слов;

· преобразование по точному совпадению;

· арифметическое энтропийное кодирование;

· контекстно-адаптивное энтропийное кодирование.

 

Кодек стандарта Н.264

Как и в предыдущих стандартах компрессии рекомендация Н.264 не дает конкретного описания «кодека» (то есть пары Кодер/Декодер). Вместо этого делается описание синтаксиса закодированного битового видеопотока вместе с методом его декодирования. Фактически, на практике реальные кодер и декодер будут состоять из функциональных элементов, показанных на рис. 8.2 и 8.3. За исключением деблокирующего фильтра большинство функциональных элементов (устройства прогноза, преобразования, квантования, энтропийного кодирования) присутствовали и в предыдущих стандартах (MPEG-2, MPEG-4). Однако, в стандарте Н.264 осуществлена существенная переработка всех функциональных элементов.

 

 

Рис. 8.2. Функциональная схема кодирующего устройства стандарта Н.264

 

Рис. 8.3. Функциональная схема декодирующего устройства стандарта Н.264

 

Кодер (см. рис. 8.2) имеет два направления потоков данных: прямое (слева направо) и реконструированное (справа налево). Поток данных в декодере (см. рис. 8.3) изображен в направлении справа налево для того, чтобы подчеркнуть его схожесть с потоком данных кодера.

Рассмотрим прямое направление потока данных в кодере. Входной кадр или полукадр Fn обрабатывается единицами макроблоков. Каждый макроблок кодируется в моде intra или inter, и для каждого блока макроблока, то есть подмакроблока, формируется прогноз PRED на основе реконструкции пикселей изображения (снимка). В моде intra прогноз PRED формируется с помощью пикселей текущего слоя, ранее закодированных, декодированных и реконструированных (). При формировании прогноза PRED используются нефильтрованные элементы изображения. В моде inter прогноз PRED строится с помощью компенсации движения по одному или двум ссылочным кадрам. Ссылочный кадр берется в виде ранее закодированного снимка , а ссылочный прогноз для каждой части макроблока (в моде inter) может быть взят из прошлых или будущих снимков (в порядке их отображения на телевизионном экране), которые уже были закодированы ранее, реконструированы и отфильтрованы.

Прогноз PRED вычитается из текущего блока, и их разность, которую для удобства назовем остатком, обозначается символом Dn. Далее, после блока Dn к остатку применяется соответствующее преобразование, результат квантуется, и создается блок x. Полученное множество квантованных коэффициентов переупорядочивается и кодируется энтропийным кодером. Выходные коэффициенты энтропийного кодера вместе с некоторой дополнительной информацией, необходимой при декодировании каждого блока данного макроблока (мода прогноза, параметры квантователя, информация о векторах движения и т.п.), записываются в битовый поток, который проходит через абстрактный сетевой модуль NAL для дальнейшей передачи или хранения.

Каждый закодированный и переданный блок макроблока декодируется (реконструируется) самим кодером для получения ссылочного материала последующих прогнозов. При этом коэффициенты х деквантуются (Q–1), и к результату применяется обратное преобразование (T–1) для получения разностного (остаточного) блока . Прогнозный блок PRED складывается с блоком для образования реконструированного блока (декодированная версия исходного блока, и означает, что он не фильтрован). Затем применяется фильтр для погашения эффекта блочной дисторсии (искажения). В итоге реконструированный ссылочный кадр строится по ряду блоков .

Декодер (см. рис. 8.3) получает сжатый битовый поток из NAL, и сначала применяет энтропийный декодер для получения элементов данных, из которых формируются множества квантованных коэффициентов х. Эти коэффициенты деквантуются, к результату применяется обратное преобразование, и получается блок (идентичный блоку кодера). Используя информационный заголовок, извлеченный из битового потока, декодер создает блок-прогноз PRED, который в точности совпадает с исходным блоком PRED кодера. Этот блок складывается с для получения блока , который затем фильтруется для формирования декодированного блока .

 

8.3. Стандарт кодированного представления визуальной информации Н.265/HEVC

С момента появления первого 4K и 8K Ultra HD контента возникла одна общая проблема – они «весят» слишком много.Необходимы огромные дисковые массивы для хранения сырого материала и неоправданно большие для хранения конечного продукта и его продвижения на оптических носителях, в эфире или в Интернете.

Потому были ускорены работы над созданием нового стандарта кодирования и результатом стал H.265, также известный как HighEfficiencyVideoCoding (HEVC, высокоэффективное кодирование видеоизображений).

H.265 - новый формат (стандарт) сжатия видео (видеокодек), который является логическим продолжением H.264 и характеризуется более эффективными алгоритмами кодирования. Технически эффективность улучшена на 50% (примерно двукратное уменьшение размера файла при одинаковом визуальном качестве, по сравнению с H.264). ‎Для достижения этой цели создан ряд алгоритмических средств, учитывающих многие аспекты сжатия видео. Рекомендация стандарта разработана в связи с растущей потребностью в ‎более высокой степени сжатии движущихся ‎изображений для самых разных ‎приложений, таких как потоковая передача в ‎интернете, передача данных, видеоконференц-связь, ‎цифровые запоминающие устройства и телевизионное вещание.

 

Стандарт предполагает поддержку высоких разрешений вплоть до 8K UHD (8192×4320). Первая версия стандарта H.265 была опубликована в начале 2013 года.

Вместо макроблоков, которые применялись в H.264, в HEVC используются блоки с древовидной структурой кодирования.

В качестве требований к стандарту предложено много новых возможностей:

· Двумерный неразделимый адаптивный интерполяционный фильтр (AIF)

· Разделимый AIF

· Направленный AIF

· Компенсация движения с точностью до 1/8-пикселя (Qpel)

· Адаптивное предсказание ошибок кодирования (APEC) в пространственной и частотной областях

· Адаптивный выбор матрицы квантования (AQMS)

· Основанная на сравнении схема выбора и кодирования вектора движения

· Режимо-зависимое изменение настройки внутрикадрового кодирования

Предполагается, что эти приёмы принесут наибольшую пользу при многопроходном кодировании.
Областями применения нового стандарта в первую очередь являются вещательное телевидение, мультимедиа и видеонаблюдение. Новый кодек является важным ключом к переходу на более высокое качество изображения и поможет уменьшить нагрузку на сети. H.265 при вдвое меньшем битрейте обеспечивает такое же визуальное качество, что и нынешний H.264 / MPEG-4 Part 10 AdvancedVideoCoding (AVC), которым сейчас сжато большая часть видео в эфире и Интернете. Например, сейчас онлайн-кинотеатры для передачи сжатого Н.264 видеопотока 1080p/30 используют битрейт примерно 4-6 мегабит в секунду, а у изображения эквивалентного качества, сжатого Н.265, битрейт вроде как упадет до 2-3 мегабит в секунду. На самом деле цифра в 50% прежде всего касается относительно несложных сцен, где отсутствуют резкие перепады контрастности и не наблюдается интенсивных перемещений объектов и фона. Реальные цифры на произвольном видео скорее всего близки к отметке 30%.

Стандарт HEVC дает толчок новому этапу инноваций, начиная от мобильных устройств до телевидения в формате Ultra HD. Также изменения затронут коллекции видеоконтента в онлайн-кинотеатрах, системах VOD, OTT и тому подобное. А вдобавок H.265 будет основой для кодирования видео на дисках 4K Blu-ray.

Акцентируем внимание на основных новшествах H.265. Можно выделить следующие основные улучшения:
* Поддержка разрешений вплоть до так называемого 8К Ultra HD (8192 х 4320 = 35 мегапикселов).
* Максимальный размер блока. В стандарте H.264 это 256 пикселов (16 x16), а в стандарте H.265 максимум в 16 раз больше (4096 = 64 x 64). В Н.265 размер блока выбирается самим алгоритмом в процессе кодирования в зависимости от содержания кодируемого изображения.
* Возможность параллельного декодирования. В отличие от H.264, декодеры H.265 позволяют раздельно и одновременно обрабатывать различные части одного и того же кадра, что на полную задействует преимущества многоядерных процессоров и существенно ускоряет воспроизведение.
* Произвольный доступ к изображениям (CleanRandomAccess). Декодирование произвольно выбранного кадра видеоряда производится без необходимости декодирования каких-либо предшествующих ему в потоке изображений. В H.265 не требуется вставка промежуточных опорных кадров (I-frames), которые еще и заметно увеличивают битрейт видео.
* 10-битное цветовое кодирование и высокое качество цветопередачи, которое обеспечивает «верхний» профиль Main 10. Все существующие стандарты предлагают всего 8 бит. Технология HEVC также может использоваться и для фотографии (вместо 8 бит JPEG можно сохранить снимок с гораздо меньшим размером и поднять дискретизацию до 10 бит, что придаст снимку плавные градации яркости и цветов).
* H.265 предусматривает автоматическое определение типа развертки, но изначально ориентирован на обработку прогрессивного видео (вплоть до 120 кадров). Впрочем, никаких проблем не возникнет и в работе с чересстрочной разверткой.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: