Издательский дом ООО "Гейм Лэнд"СПЕЦВЫПУСК ЖУРНАЛА ХАКЕР #54, МАЙ 2005 г.

Эффект сжатия

Главнов Владимир

Спецвыпуск: Хакер, номер #054, стр. 054-008-1


(jascher@list.ru)

Алгоритмы компрессии цифрового видео

Эта статья не претендует на то, чтобы дать полный обзор самых последних решений, применяемых в современных компрессорах. Многие из этих решений производители компрессоров предпочитают хранить как коммерческую тайну. Эта статья скорее о том, в каком направлении и как далеко продвинулись современные компрессоры по сравнению со старыми добрыми MPEG-1 и MPEG-2.

Как бы ни ругали компенсацию движения, она по-прежнему остается лучшим способом устранения временной избыточности видеопоследовательности. Все разработчики компрессоров видео делятся на три категории. Первая категория: любит компенсацию движения и использует ее. Вторая категория, самая большая, не любит компенсацию движения и все равно использует ее. Третья категория, самая маленькая, пытается изобрести альтернативу компенсации движения (подробнее в книжках 6 и 8, см. врезку о литературе).

Видеокомпрессор

Рассмотрим, из каких частей состоит типичный видеокомпрессор, в котором используется оценка и компенсация движения.

Человеческий глаз по-разному воспринимает яркостную и цветовую информацию и по-разному относится к искажениям на разных пространственных частотах. Поэтому крайне желательно отделить цветовую информацию от яркостной и разбить изображение на частотные полосы.

Для отделения цветовой информации каждый кадр исходной видеопоследовательности переводится из цветокомпонентного представления изображения RGB в цветоразностное представление YUV.

После этого видеопоследовательность попадает на блок фильтров предварительной обработки изображения. Здесь происходит незначительное изменение изображения для улучшения компрессии видеопотока. Отсеиваются шумы, устраняется джиттер, сглаживаются некоторые детали изображения и т.д.

Человеческий глаз имеет намного больше рецепторов, чувствительных к изменению яркости изображения, чем рецепторов, чувствительных к изменению цвета, поэтому в каждом кадре проводится цветовое прореживание, то есть цветовая информация представляется более грубо, чем яркостная.

Все кадры в сжатом виде делятся на две большие группы: ключевые кадры и неключевые. Ключевой кадр, в отличие от неключевого, восстанавливается из сжатого вида с применением информации только о нем самом, о других кадрах никакой информации не понадобится. Часто бывают случаи, когда необходимо иметь ключевыми все кадры видеопоследовательности. В MPEG-1, например, ключевым кадром является каждый 15-й кадр. Если необходимо сделать кадр ключевым, то он сразу подается на преобразователь из пространственного представления сигнала в частотно-пространственное. Если же кадр необходимо сделать неключевым, то он предсказывается по соседним кадрам оценкой и компенсацией движения, а на преобразователь подается только ошибка предсказания.

В MPEG имеются однонаправленный и двунаправленный способы предсказания. Однонаправленное ведется по одному из предыдущих кадров, а двунаправленное - по одному из предыдущих и одному из последующих кадров. Кадр предсказывается по соседним кадрам в том виде, в котором они появятся на декодере, то есть с частичной потерей качества. На вход преобразователя подаются отсчеты исходного сигнала, на выходе получаются коэффициенты разложения исходного сигнала по базису, состоящему из специальных локализованных по частоте и в пространстве функций. Подвергнутая преобразованию видеопоследовательность поступает на квантователь, затем на структурный и арифметический кодеры.

Содержание  Вперед на стр. 054-008-2