Компенсация движения

Точность предсказания при передаче изображений движущихся объемов можно увеличить за счет оценки вектора движения и компенсации этого движения, которая уменьшает ошибку предсказания.

В стандарте МРЕG -2 используется метод компенсации движения, основанный на макроблоках. Два смежных кадра содержащих только активны строки сигнала яркости (576 активных строк), разбиваются на макроблоки более крупные зоны поиска. Размеры макроблока должны быть согласны со структурой дискретизации кадра ТВ изображения. В стандарте МРЕG-2 ТВ кадр разбивается на целое число зон. По вертикали (576 активных строк / 16) — это 36 зон, по горизонтали (704 активных отсчета / 16) — 44 зоны.

Зона поиска должна быть достаточно большой, чтобы быстро движущийся макроблок изображения первого кадра не вышел из зоны поиск второго кадра. Размеры зоны поиска ограничиваются объемом вычислений, которые необходимо выполнить в реальном масштабе времени. Эти размеры также должны быть согласованы с принятой структурой дискретизации ТВ кадра. Обычно, они в 4 раза больше размеров отдельного макроблока. Иными словами, размеры зоны поиска — это 64×64. Таким образом, в ТВ кадре создается 576 / 64 = 9 зон поиска по вертикали и 704 / 64 = 11 зон по горизонтали.

К примеру, надо определить координаты движения при предсказании вперед. Для этого берется макроблок отсчетов первого кадра и ищется его новое положение в зоне поиска второго кадра, вычисляются межкадровые разности отсчетов. Положение макроблока, при котором суммарное значение модулей межкадровых разностей макроблока получается наименьшим, принимается за его реальное перемещение, после чего координаты вектора движения рассчитываются как смещение макроблока по вертикали и горизонтали относительно его начального положения.

Компенсация движения, применяемая при компрессии P и В -кадр, улучшает фактор сжатия в 3 раза по сравнению с внутрикадровым кодированием, где сохраняется временная избыточность.

Компенсация движения, примененная к макроблокам В -кадра, осуществляется с использованием как предшествующего, так и последующего опорного кадра.

Кодирование по стандарту МРЕG -2 требует запоминания одного или двух кадров опорного макроблока, обеспечивающего данные для предсказания с компенсацией движения. Большой объем компьютерных вычислений занимает поиск и оценка движения для подбора макроблоков в двух кадрах, чтобы найти направление и расстояние, определяющие движение макроблока между кадрами, то есть вектор движения.

Определяемый вектор движения используется для предсказания с компенсацией движения. В кодере вычисляется ошибка предсказания, т.е. разность между фактическим и предсказанным с использованием вектора движения блоками изображения, что сокращает временную избыточность. Ошибка предсказания подвергается ДКП, квантуется и кодируется в кодере с переменной длиной слова. Такой процесс уменьшает и временную, и пространственную, и психофизическую избыточность. Вектор движения также кодируется словами переменной длины. Кодированная ошибка предсказания объединяется с кодами вектора движения, после чего формируется передаваемый цифровой поток.

Чем быстрее движутся снимаемые объекты, тем больше отличаются текущий макроблок и опорный макроблок из предыдущего кадра и тем больше данных об ошибке предсказания должно быть передано, а это снижает эффективность компрессии. Компенсация движения при формировании предсказания уменьшает ошибку предсказания, которая на практике не может быть сведена к нулю. Этому мешают и изменения размеров движущегося объекта, его поворота, неточности в определении вектора движения и т.п. Однако предсказание с компенсацией движения позволяет значительно повысить эффективность ДИКМ при видеокомпрессии.

В декодере выполняется инверсное квантование, инверсное ДКП, в результате чего формируется ошибка предсказания. Ошибка предсказания складывается с декодированным изображением предыдущего кадра, образуя декодированное изображение текущего кадра.

Предсказатели с компенсацией движения в современных системах видеокомпрессии стандарта МРЕG -2 могут использовать целый ряд методов. Например, макроблок может предсказываться на основе предыдущего изображения, на основе последующего изображения, а также на основе и предыдущего, и последующего. В чересстрочных системах поля кадра могут предсказываться раздельно с использованием разных векторов движения или вместе с использованием общего вектора. Существует также возможность нулевого предсказания (если не найден подходящий опорный макроблок). При этом сам текущий макроблок будет кодироваться вместо ошибки предсказания, что означает отказ от межкадрового кодирования и переход к внутрикадровому. Для каждого текущего макроблока кодер выбирает метод предсказания, обеспечивающий наивысшее качество декодированного изображения с учетом ограничений на скорость передачи данных. Сведения о методе предсказания включаются общий поток и передаются декодеру для верного восстановления изображения.

Оценка вектора движения и определение наилучшей стратегии предсказания требуют применения сложных вычислительных процедур, которые должны осуществляться в реальном времени. Поэтому кодер гораздо сложнее декодера, т.е. в стандарте МРЕG-2 система компрессии на базе ДИКМ с компенсацией движения является асимметричной.

2.4. Использование ДКП в стандарте кодирования MPEG -2

Цель внутрикадрового кодирования сокращение пространственной избыточности в пределах кадра (или поля) ТВ изображения. Эта избыточность вызвана сильными корреляционными связями между элементами изображения. Если найти соответствующее ортогональное преобразование, то можно преобразовать массив отсчетов изображения в матрицу коэффициентов, которые уже не будут коррелированны друг с другом. К этим некоррелированным коэффициентам можно применить энтропийное кодирование и добиться сокращения цифрового потока. Наиболее часто используются методы линейных ортогональных преобразований. Линейность ортогонального преобразования означает, что операции сложения, вычитания и умножения на скаляр действительны и после преобразования, а ортогональность — что преобразуемый фрагмент представляется ограниченным набором ортогональных функций.

Линейные ортогональные преобразования характеризуются тем, что между элементами изображения устраняются статистические зависимости, и распределение энергии в преобразованном спектральном фрагменте является неравномерным. Эти особенности используются непосредственно в процессах кодирования. На практике можно подобрать такое ортогональное преобразование, что для типичных изображений большая часть коэффициентов матрицы будет иметь практически нулевые значения. Исключая эти нулевые коэффициенты, можно также сокращать цифровой поток. Среди возможных ортогональных преобразований наиболее широко используется ДКП, основанное на применении ортогональной системы дискретных косинусных функций возрастающей частоты. Преобразования данного типа хорошо согласуются с параметрами ТВ сигнала, что является необходимым условием эффективного кодирования видеоинформации.

Стандарт МРЕG -2 подразумевает применение ДКП составляющих видеосигнала. Например, ДКП действительной последовательности отсчетов х (n) при n = 0, 1, …, N -1 определяется соотношением:

,

где коэффициенты c (k) = .

Обратное ДКП, восстанавливающее исходную последовательность отсчетов по последовательности коэффициентов преобразования XC (k), задается выражением

,

где k = 0, 1… N -1.

ДКП сокращает избыточность и высокочастотную информацию в пределах кадра. Это позволяет получить высокое качество кодированных изображений со сжатием.

ДКП выполняется поблочно, для чего ТВ изображение разбивается на блоки. При этом в ТВ кадре создается: 576 / 8 = 72 зоны по вертикали 704 / 8 = 88 зон по горизонтали, что в общей сложности дает 72×88 = 6336 блоков, подлежащих ДКП в реальном масштабе времени. В результате ДКП исходная сигнальная матрица 8×8 = 64 ТВ отсчетов преобразуется в матрицу частотных коэффициентов ДКП такого же размера 8×8 = 64 (рисунок 2.5).

Каждый коэффициент характеризует амплитуду определенной частотной составляющей кадра, причем коэффициенты в матрице располагаются по возрастанию частот в вертикальном и горизонтальном направлениях.

Поскольку положение ТВ отсчетов сигнальной матрицы определяется двумя координатами, то частотные коэффициенты матрицы ДКП являются функциями этих двух переменных.

Рисунок 2.5 — ДКП отсчетов ТВ изображения:

а — сигнальная матрица отсчетов ТВ изображения;

б — матрица частотных коэффициентов ДКП.

Следует отметить, что матрица частотных коэффициентов ДКП уже не имеет прямой геометрической связи с положением отсчетов ТВ сигнала на ТВ растре, а представляет собой только удобную форму математической записи, при которой частотные коэффициенты, ДКП можно трактовать как двумерный спектр ТВ изображения в горизонтальном и вертикальном направлениях ТВ кадра. Каждый частотный коэффициент ДКП содержит информацию не об одном отсчете ТВ изображения и сигнальной матрицы, а обо всех 64 элементах.

При этом справедливо и обратное положение — знание матрицы коэффициентов, т.е. значений амплитуд базисных косинусоидальных функций разных частот позволяет сформировать блок элементов изображения (сигнальную матрицу) Таким образом, ДКП является обратимым.

Спектр ДКП имеет очень важную, если ее оценивать с позиций компрессии видеоданных особенность: для большинства блоков типичных изображений основная энергия частотных составляющих этого спектра концентрируется в небольшой области около нулевых частот. Например, постоянная составляющая и несколько низкочастотных базисных функций, имеющих значимые величины, отображаются совокупностью коэффициентов ДКП в левом верхнем углу матрицы. Амплитуда высокочастотных составляющих или мала, или просто равна нулю, поэтому их потеря почти не сказывается на качестве изображения. Передаче подлежат только те частотные коэффициенты матрицы ДКП, величины которых превышают принятые пороговые значения, коэффициенты ниже порогового значения считаются нулевыми, что и приводит к желаемой компрессии.

Введение пороговой (нелинейной) обработки, строго говоря, ведет к потерям информации и, соответственно, к снижению качества восстановленного в декодере ТВ изображения. Однако при разумном выборе величины порога это ухудшение окажется практически незаметным или же допустимым.

Следует отметить, что при внутрикадровом кодировании динамический интервал коэффициентов ДКП возрастает в 8 раз. Так, при уровневом кодировании видеосигнала восемью битами его динамический интервал равен 0 —250 дискретных уровней. При этом динамический интервал коэффициентов спектра ДКП составит от 0 до 2040 и от -1020 до +1020 дискретных уровней для коэффициентов постоянной и переменных составляющих ДКП, соответственно.

Вычисление коэффициентов ДКП с большей точностью, чем имеют значения отсчетов яркости изображения, объясняется необходимостью пренебречь ошибками их определения для исключения возможных неточностей при ДКП.

Кодирование коэффициентов ДКП в таком широком динамическом интервале потребует в последующих узлах кодера перехода от 8 битового к 11-битовому коду. Чтобы избежать этого, после ДКП производится масштабирование (сжатие) динамического интервала сигналов коэффициентов ДКП за счет увеличения шага квантования в 8 раз. Эта операция сводится к делению полученных в матрице значений коэффициентов ДКП на 8. Результат деления затем округляется до ближайших целых значений уровней новой шкалы квантования. Так, например, если исходное значение коэффициента ДКП было 22, то после деления на 8 и округления до ближайшего целого значения (22 / 8 = 2,75) новое значение будет 3. При этом новый динамический интервал составит от -255 до +255 дискретных уровней.

В обычной ИКМ уменьшение разрядности приводит к возрастанию шумов квантования на всех частотах. Коэффициенты ДКП определяют энергию сигнала на различных частотах, поэтому появляется возможность изменять параметры квантования дифференцировано на разных частотах, учитывая различную чувствительность зрения к разным пространственным частотам.

Коэффициент соответствующий постоянной составляющей ТВ сигнала, кодируется с использованием 10 бит, потому что при более грубом квантовании соседние блоки начинают отличаться по яркости. На экране они проявляются в виде шахматной структуры.

На предельно большое число уровней квантуются и амплитуды нескольких самых низкочастотных косинусоидальных волн, располагающихся в левом верхнем углу блока ДКП. По мере увеличения частоты косинусоидальных компонент (при удалении от левого верхнего угла блока ДКП) количество уровней квантования уменьшается, достигая для самых больших частот значений в нескольких единиц. Например, самая высокочастотная компонента, располагающаяся в правом нижнем углу, может квантоваться всего на два уровня. Это означает, что для ее передачи можно использовать одноразрядные двоичные числа.

Практически квантование выполняется путем поэлементного деления матрицы коэффициентов ДКП на матрицу квантования (взвешивания), значения элементов которой возрастают по мере удаления от левого верхнего угла и приближения к правому нижнему углу. При этом важно отметить, что для квантования сигнала яркости и цветоразностных сигналов используются разные матрицы. Построчные матрицы квантования могут задаваться кодером, но по умолчанию стандарт МРЕG -2 предполагает использование следующих эффективных матриц (таблицы 2.1, 2.2).

При декодировании на приемной стороне коэффициенты матрицы ДКП, значения которых были переданы по каналам связи, умножаются на элементы матрицы квантования, что восстанавливает верные значения коэффициентов, но с ошибкой округления, значение которой мало для низкочастотных компонентов блока отсчетов изображения, но велико для высокочастотных.

Массив коэффициентов, извлекаемых из матрицы ДКП, содержит некоторое количество нулевых значений.

Таблица 2.1 — Матрица квантования яркостного сигнала для блоков изображений I -кадров

               
               
               
               
               
               
               
               

Таблица 2.2 — Матрица квантования цветоразностного сигнала для блоков изображений I -кадров

               
               
               
               
               
               
               
               

Для того чтобы способствовать объединению нулевых элементов в группы и преобразованию в одномерную последовательность, используется зигзагообразное сканирование матрицы, начиная с левого верхнего угла. В этом случае коэффициенты выстраиваются в порядке возрастания частот, причем если пространственные частоты одинаковы, то впереди следуют коэффициенты для меньших вертикальных частот. Зигзаг-сканирование (z -упорядочивание) позволяет сгруппировать самый большой массив нулевых коэффициентов, обычно располагающийся в правой нижней части блока ДКП.

Примером преобразования стандартной сигнальной матрицы 8 × 8 пикселей может служить процесс ДКП, квантования и зигзагообразного сканирования, графически представленный на рисунке 2.6.

Рисунок 2.6 — Графическое представление процесса ДКП, квантования и

зигзагообразного сканирования в аппаратуре кодирования по стандарту MPEG -2

Последний алгоритм сокращения избыточности связан с кодами, образующими комбинации переменной длительности. При этом те коэффициенты ДКП, которые повторяются наиболее часто, кодируются короткими кодовыми комбинациями, а редкие значения коэффициентов — более длинными.

Для экономного представления двоичных сообщений в стандарте МРЕG -2 используется код Хаффмана, позволяющий практически в 1,22 раза сократить поток данных по сравнению с равномерным кодированием. При кодировании символов сообщения комбинациями переменной длины обычно возникает проблема отделения одной комбинации от другой. Код Хаффмана обладает свойством префиксности. т.е. ни одна его кодовая комбинация не является началом другой комбинации, что позволяет обойтись в тексте кодированного сообщения без разделителей между комбинациями.

Энтропийный кодер в устройстве кодирования с информационным сжатием МРЕG-2 должен иметь многокадровый буферный накопитель, в котором происходит накопление данных для их оптимального использования. Например, в случае, если содержание изображения изменяется с очень большой интенсивностью, возможно изменение скорости передачи данных для сохранения соответствующего качества изображения. Однако на практике при передаче и распределении ТВ программ колебания скорости передачи данных могут быть недопустимы. В этом случае используется режим работы энтропийного кодера, при котором обеспечивается фиксированная скорость выходного потока данных. Для чего данные заносятся в буферный накопитель с переменной скоростью, а считываются с постоянной. Для предотвращения переполнения буферного накопителя или полного стирания информации в нем, что может привести к сбоям в работе системы видеокомпрессии, используется адаптивное квантование. Сведения о степени заполнения буферной памяти служат сигналом управления, регулирующим шкалу квантования. Если, например, кодируемое изображение характеризуется высокой детальностью, то число ненулевых элементов матриц коэффициентов ДКП увеличивается. Возрастает и объем передаваемых данных, поэтому буферный накопитель заполняется с повышенной скоростью. Благодаря обратной связи (через регулятор скорости потока данных, см. рисунок 2.1) квантование становится более грубым и скорость поступления данных в буферную память уменьшается, но за счет увеличения шумов квантования и ухудшения качества изображения.

Если кодируется простое по структуре изображение с малой детальностью, то число нулевых элементов сигнальных матриц коэффициентов ДКП увеличивается и скорость поступления данных в буферную память снижается по сравнению со средней величиной. Тогда квантование становится менее грубым (большое число коэффициентов ДКП квантуется на максимальное число уровней). Таким образом, скорость заполнения буферного накопителя в среднем поддерживается на постоянном уровне.

Упрощенная структура декодирования на приемном конце показана на рисунке 2.7.

Рисунок 2.7 — Структура декодирования в декодерах MPEG -2

2.5. Профили и уровни стандарта МРЕG -2

Даже в рамках одного стандарта, как показывает практика, передача сигналов телевидения — и цифрового здесь не исключение, ведется на разных уровнях качества. То же самое можно сказать и о ТВ приемниках, жесткие, а главное узкие допусковые интервалы не жизненны, поскольку лишают систему гибкости, приспособляемости к разным условиям функционирования с ориентацией на различные слои потребителей. При этом любая перспективная система должна иметь резервы для перехода на более высокие уровни качества. Эти и многие другие соображения и требования легли в основу очень важного документа: ISO/IEC 13818-2.

В этом документе определено, что стандарт МРЕG -2 — это целое семейство взаимосогласованных совместимых цифровых стандартов ин формационного сжатия ТВ сигналов с различной степенью сложности используемых алгоритмов. Поэтому в рамках стандарта МРЕG -2 была разработана система профилей и уровней. Профиль — это подмножество стандарта для специализированного применения, задающее алгоритмы и средства компрессии. Уровни внутри каждого профиля связаны с параметрами компрессируемого изображения

Градации качества ТВ изображения для вещательных систем в стандарте ISO/IEC 13818-2 устанавливаются введением четырех уровней для формата разложения строк ТВ изображения и пяти профилей для форматов кодирования сигналов яркости и цветности. Общая идеология построения стандарта МРЕG -2 поясняется таблицей 2.3.

Таблица 2.3 — Профили и уровни стандарта МРЕG -2

Уровни Скорость передачи битов, Мбит/с, для профильного вида
Простой профиль без В -кадров (SP) 4:2:0 Основной профиль без В -кадров (МР) 4:2:0 Профиль с масшта- бируемый отношением С-Ш В -кадры (SNR) 4:2:0 Специальный масшта- бируемый профиль В -кадры (Spatial) 4:2:0 Высший профиль В -кадры (НР) 4:2:0 или 4:2:2
Высокий Уровень (HL) 1920 × 1152 (активных) ×   × ×  
Высокий уровень (Н -14) 1440 × 1152 (активных) ×        
Основной уровень (ML) 720 × 576 (активных)          
Низкий Уровень (LL) 352 × 288 (активных) ×       ×

Расположенный в нижней части таблицы уровень называется «низким уровнем» и ему соответствует новый класс качества ТВ изображения, которое вводится в стандарте МРЕG-2 — телевидение ограниченной четкости. В этом случае в кадре ТВ изображения содержится 288 активных строк (в 2 раза меньше, чем в вещательном телевидении) и каждая строка дискретизируется на 352 отсчета.

Кодирование сигналов телевидения вещательного стандарта выполняется в соответствии с основным уровнем, т.е. с форматом разложения на 576 активных строк в кадре, которые кодируются с использованием 720 отсчетов на строку.

Высокий уровень — 1440 поддерживает ТВ изображения высокой четкости с разрешением 1440 × 1152 элементов.

Высокий уровень — 1920 поддерживает ТВ изображения высокой четкости широкого формата с разрешением 1920 × 1152 (HDTV-plus). В обоих «высоких» уровнях кадр ТВ изображения содержит 1152 активные строки (вдвое больше, чем в вещательном телевидении). Эти строки дискретизируются соответственно на 1440 или 1920 отсчетов.

В стандарте используются 5 профилей, которым соответствуют 5 наборов функциональных операций по обработке (компрессии) видеоданных.

Профиль, в котором используется наименьшее число функциональных операций по компрессии видеоданных, назван простым. В нем при компрессии видеоданных используется компенсация движения изображения и гибридное ДКП.

Следующий профиль назван основным. Он содержит все функциональные операции простого профиля и одну новую: предсказание по двум направлениям. Эта новая операция, естественно, повышает качество ТВ изображения.

Следующий за основным назван профилем с масштабируемым отношением сигнал-шум. Термин «масштабирование», в данном случае, означает возможность обмена основных показателей системы, способность воспроизведения ТВ изображений из части полного потока видеоданных. Этот профиль к функциональным операциям основного профиля добавляет новую — масштабирование. Основная идея — повышение устойчивости цифрового телевидения и сохранение работоспособности при неблагоприятных условиях приема. Операция масштабирования позволит в рассматриваемом случае повысить устойчивость системы за счет некоторого снижения требований к допустимому уровню отношения сигнал-шум в воспроизводимом ТВ изображении.

При масштабировании потоки видеоданных разделяют на две части. Одна из них несет наиболее значимую часть информации — ее называют основным сигналом. Вторую часть, несущую менее значимую информацию, называют дополнительным сигналом. Декодирование только одного основного сигнала позволяет получить ТВ изображение с пониженным отношением сигнал-шум относительно исходного значения.

И все же, что можно извлечь из идеи деления потока данных на более и менее значимые части? А все дело в защите системы от ошибок. Помехоустойчивое кодирование требует введения дополнительных бит, что повышает общий поток информации. Задача упрощается, когда более мощная защита применяется только к части информации и тем самым соблюдается разумный баланс между уровнем потока видеоданных и степенью их защиты. При неблагоприятных условиях приема (например, при низкой напряженности радиополя, при приеме на комнатную антенну и т.п.) сохраняется возможность устойчивого декодирования более защищенного основного сигнала, а неустойчиво воспринимаемый дополнительный сигнал просто отключается. Это ведет к росту уровня шума, зато система остается работоспособной.

Бывают ситуации, когда сигналы приходится передавать по каналам с ограниченной пропускной способностью. Деление потока видеоданных на два, позволяет использовать и «плохие» каналы, ограничивая передачу основным сигналом.

Следующий, четвертый профиль назван специально масштабируемым профилем. Здесь, естественно, сохранены все операции предшествующего профиля и добавлена новая — разделение потока видеоданных по критерию четкости ТВ изображения. Этот профиль обеспечивает переходы между ныне действующими вещательными системами и ТВЧ. С этой целью видеоданные сигнала ТВЧ разделяются на три потока. Первый — это основной (значимый) поток видеоданных, например, по стандарту разложения на 625 строк. Второй поток несет дополнительную информацию об изображении с числом строк до 1250. Одновременное декодирование первого и второго потоков видеоданных позволяет получить ТВ изображение высокой четкости, но с пониженным отношением сигнал-шум. В третьем потоке сосредоточена менее значимая информация, его декодирование позволяет повысить отношение сигнал-шум в видеоканале до уровня, принятого в ТВЧ. Обычно первый поток видеоданных, представляющих сигнал 625-строчного ТВ, — это 6 Мбит/с, Дополняющий его до ТВЧ — 6 Мбит/с, а повышающий отношение сигнал- шум до уровня, когда шумы визуально незаметны 12 Мбит/с.

Стандартом МРЕG -2 потенциально предусмотрена масштабируемость по времени, позволяющая получать от одного источника видеоинформации ТВ изображения с двумя уровнями разрешающей способности по времени. Например, основной поток видеоданных обеспечивает воспроизведение ТВ изображения с частотой кадров 25 Гц и чересстрочной разверткой. Добавление дополнительного потока видеоданных к основному позволяет получить ТВ изображение с частотой кадров 50 Гц и прогрессивной разверткой.

Таким образом, стандарт МРЕG -2 предусматривает возможность организации потоков видеоданных как с масштабируемостью, так и без нее. Однако, масштабируемость, заложенная в стандарте МРЕG-2, пока редко встречается в практических реализациях цифровых ТВ систем, но она является важной предпосылкой их дальнейшего развития.

В рассмотренных четырех профилях при кодировании сигналов яркости и цветности используется формат представления видеоданных 4:2:0, в котором число отсчетов сигналов цветности по сравнению с сигналом яркости уменьшается в два раза не только по горизонтальным, но и по вертикальным направлениям. Следующий, пятый профиль называется высшим и он включает в себя все функциональные операции специального профиля 4:2:2, при котором число Отсчетов сигналов цветности в вертикальных направлениях остается тем же, что и у сигнала яркости. В этом случае коэффициент компрессии минимален, а качество изображения наивысшее.

Приведенные в таблице 2.3 пять профилей и четыре уровня образуют 20 возможных комбинаций видеосигнала, из которых, вероятнее всего, только 11 будут необходимыми. Для этих комбинаций (согласованные точки) в таблице указаны максимальные значения скорости передачи видеоданных в Мбит/с.

Для всех стандартизованных точек указаны максимальные потоки видеоданных, которые позволяют получить ТВ изображение, свободное от каких-либо дефектов. В иных случаях они могут проявиться в процессе кодирования/декодирования видеосигнала. Используемые в конкретных кодерах потоки видеоданных могут быть меньше (в несколько раз) указанных значений. Выбор уровня компрессии и, в конечном итоге, уровня потока зависит от допустимой степени искажений ТВ изображения.

Таким образом, стандарт МРЕG -2 позволяет гибко менять скорость передачи видеоданных в очень широких пределах. Надо заметить, что системы кодирования стандарта МРЕG -2 могут работать как с чересстрочной, так и с прогрессивной развертками при частоте полей 50 или 60 Гц. Для каждой стандартизованной точки в таблице оговорено число отсчетов сигнала яркости на активной части строки. Рассмотренные комбинации параметров информационного кодирования Пригодны для работы с различными цифровыми трактами.

Стандарт МРЕG -2 принципиально нацелен в будущее. Большинство выпускаемых в настоящее время декодеров в интегральном исполнении относится к основному профилю и основному уровню (МР@ML) рассчитанных на ТВ изображение с чересстрочным разложением на 625 строк. Эта система принята для первого поколения цифровых телевизоров для НТВ со спутников, работающих в диапазоне 11/12 ГГц, и кабельной сети распределения.

Однако ряд особенностей основного профиля и основного уровня стандарта МРЕG-2, например, низкое вертикальное разрешение в цветоразностных каналах, ограничивают его применение в условиях ТВ студий, в видеопроизводстве. Для достижения высоких качественных показателей в случае многократного кодирования-декодирования важно кодировать видеосигналы стандарта 4:2:2. Использование видеосигналов, кодированных в стандарте 4:2:0, совместно с основным профилем и основным уровнем МР@МL означает, что вертикальное разрешение в цветоразностных каналах уменьшается вдвое. Взаимное преобразование видеосигналов стандартов 4:2:2 и 4:2:0, необходимое для обеспечения совместимости в ТВ тракте в соответствии с Рекомендацией МСЭ-Р ВТ.601-5, требует в каждой точке преобразования вертикальные фильтры низких частот. Хорошо известно, что каскадное включение таких фильтров быстро приведет к «смягчению», т.е. к размытию цветовых границ. Для сохранения цветового вертикального разрешения лучше осуществлять компрессию видеоданных, кодированных по стандарту 4:2:2. Поэтому в рамках группы МРЕG-2 был разработан дополнительный стандарт 422 Profile @ Main Level (422 Р@МL).

Стандарт 422 Р@МL является подмножеством основного профиля и основного уровня МР@МL. в том смысле, что все значения параметров первого либо равны, либо превышают соответствующие значения второго. Принцип обратной совместимости, заложенный в МРЕG-2, гарантирует, что декодеры 422 Р@МL способны декодировать цифровые потоки МР@МL.

Основные возможности стандарта 422 Р@МI, превосходящие соответствующие свойства основного профиля и основного уровня МР@МL, заключаются в следующем:

— допускается кодирование сигнала по стандарту 4:2:2, в то время как МР@МL ограничен кодированием сигналов способом 4:2:0;

— цифровой поток кодированных видеоданных может принимать любое значение до 50 Мбит/с, а в МР@МL — только 15 Мбит/с;

— вертикальное разрешение ограничено значением 512 ТВ линий в случае 525-строчных систем и 608 ТВ линий в случае 625-строчных систем, а в МР@МL — значениями 480 и 576 ТВ линий соответственно;

— в 625-строчных системах кроме 576 активных строк стандарт 422 Р@МL обеспечивает возможность кодирования еще 32 строк в кадре как составной части видеосигнала. Это позволяет пропускать напрямую через систему цифрового сжатия важные строки полевого интервала гашения. Поэтому стандарт 422 Р@МL гарантирует пропускание такой информации как полевой временной код и сигналы испытательных Строк, не требуя отдельной обработки этих строк.

После того как была сформулирована профессиональная версия МРЕG -2 422 Р@МL, используемая для студийного производства, он получил статус полноценного международного стандарта, который иногда называют 422 Studio Profile/M L. В результате появилась реальная возможность применения стандарта сжатия МРЕG -2 на всех участках технологической цепочки создания ТВ программ: от съемки до телезрителя, включая доставку новостийных сюжетов на телецентр, студийную компоновку программ, их распространение и передачу в эфир. Стандарт предоставляет возможности эффективной работы во всех этих звеньях. Профили МРЕG-2 определяют набор способов и технических приемов по сжатию видеоданных, а уровни — такие параметры, как размер изображения или скорость цифрового потока при выбранном способе кодирования. Профиль 422 характеризуется высокой скоростью цифрового потока и относительно короткими группами изображений, что позволяет монтировать ТВ программу с достаточно высоким качеством

Стандарт МРЕG-2 4:2:2 Р @ НL (профиль 4:2:2 на высоком уровне), ориентирован на использование в системах ТВЧ.

Для кодирования звуковых сигналов с целью их компрессии в МРЕG -2 используется стандарт информационного сжатия звуковых данных MUSICAM (Masked Pattern for Adapted Universal Coding and Multiplexing), обозначаемый также как МРЕG Layer II. Стандарт MUSICAM позволяет передавать моно, стерео, многоязыковый и surround (пространственный) звук.

MUSICAM позволяет снизить скорость потока данных, необходимую для воспроизведения звуковых сигналов, адекватного качеству, получаемому при воспроизведении компакт-дисков, до 128 кбит/с на каждый моноканал звукового сопровождения. Таким образом, для самого низкого уровня — двухканального стереофонического звукового сопровождения — потребуется скорость передачи цифровых данных, равная 128 кбит/с × 2 = 256 кбит/с. В основе стандарта лежат два психоакустических эффекта. Дело в том, что человеческое ухо не способно различать звуки с громкостью ниже определенного минимума, так называемого «порога тишины». Кроме того, более тихие звуки «маскируются» более громкими. Соответственно, алгоритм MUSICAM обеспечивает передачу только тех звуков, которые реально различаются человеком.

В случае воспроизведения пространственного (Surround) звука для передачи шести сигналов звукового сопровождения в отсутствие компрессии потребуется пропускная способность канала, достигаемая 5,18 Мбит/с (48 000 × 18 × 6 = 5,18 Мбит/с, где 18 кГц — частота дискретизации звуковых сигналов, 18 бит — разрядность квантования). По протоколу для передачи звукового сопровождения предусмотрен канал с пропускной способностью 384 кбит/с. В данном случае требуемый коэффициент сжатия, равный 13, сможет обеспечить цифровая система компрессирования Dolby AC -3, основанная на спектральном анализе звуковых сигналов и удалении частотных компонент, не слышимых человеком.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: