Издательский дом ООО "Гейм Лэнд"СПЕЦВЫПУСК ЖУРНАЛА ХАКЕР #54, МАЙ 2005 г.

Эффект сжатия

Главнов Владимир

Спецвыпуск: Хакер, номер #054, стр. 054-008-2


rgb2yuv - преобразователь из цветокомпонентного представления изображения RGB в цветоразностное представление YUV;

PP (Preprocessor) - блок фильтров предварительной обработки изображения;

CD (Color Decimator) - блок цветового прореживания;

MEMC (Motion Estimation and Motion Compensation) - блок оценки и компенсации движения;

T (Transformer) - преобразователь из пространственного представления сигнала в частотно-пространственное;

Q (Quantizer) - квантователь;

Q-1 (ВЕРСТАЛЬЩИКУ: "-1" - это степень) (Dequantizer) - деквантователь;

T-1 (ВЕРСТАЛЬЩИКУ: "-1" - это степень) (Reconstructor) - преобразователь из частотно-пространственного представления сигнала в пространственное;

Buffer - буфер хранения нескольких последних кадров;

SC (Structure Coder) - структурный кодер;

AC (Arithmetic Coder) - арифметический кодер.

Предварительная обработка видеопоследовательности

На этом этапе изображение очищается от мелкого мусора, который может значительно снизить степень компрессии в целом. Каждый кадр очищается от высокочастотных шумов, устраняются нежелательные быстрые хаотичные движения камеры – так называемый джиттер (о нем читай книжку 5, врезка о литературе).

Другой полезный ход, выполняемый на стадии предварительной обработки изображения – это так называемая гамма-коррекция. Дело в том, что наш глаз реагирует на изменение яркости нелинейно. Поэтому для того чтобы изменение яркости на единицу воспринималось глазом одинаково, независимо от того, какая яркость меняется, проводят масштабирование яркостей пикселов с использованием степенной функции.

Преобразователи из пространственного представления сигнала в частотно-пространственное и наоборот

В компрессорах MPEG-1 и MPEG-2 использовалось блочное дискретное косинусное преобразование (ДКП). Однако компрессоры, использующие ДКП, страдают массой "пороков". Один из таких недостатков - появление на изображении артефактов правильной формы (кубики). Другой порок - плохая масштабируемость сжатого сигнала по разрешению. При уменьшении разрешения изображения в два раза по горизонтали и в два раза по вертикали можно выкинуть всего 15 коэффициентов из 64, то есть уменьшить объем представления всего на 23%. Кроме того, MPEG-1 и MPEG-2 при высоких степенях компрессии смазывают грани, отправляют в мир иной мелкие детали картинок, подставляют ауры и шероховатости вблизи границ объектов изображения.

Современные компрессоры используют дискретное вейвлет-преобразование, смысл которого довольно прост.

Для одномерного сигнала один уровень разложения выглядит следующим образом.

Исходный сигнал, другими словами, последовательность дискретных значений, разлагается по двум группам функций. Функции хорошо локализованы в пространстве и по частоте, центрированы. Функции такие, что последовательность коэффициентов является уменьшенной копией исходного сигнала

Назад на стр. 054-008-1  Содержание  Вперед на стр. 054-008-3