Архив спецвыпуска журнала Хакер на www.wisesoft.ru, номер #054, стр. 054-008-5, Эффект сжатия

Издательский дом ООО "Гейм Лэнд"

СПЕЦВЫПУСК ЖУРНАЛА ХАКЕР #54, МАЙ 2005 г.

Эффект сжатия

Главнов Владимир

Спецвыпуск: Хакер, номер #054, стр. 054-008-5

Сеточный квантователь – особый вид векторного квантователя, очень похожий на скалярный квантователь с мертвой зоной, но индексы интервалов квантования от отсчета к отсчету меняются по определенному правилу. Получается так, что индекс значения отсчета зависит не только от самого значения, но и от значений соседних отсчетов (книжка 7).

Несмотря на то, что PSNR (Peak Signal Noise Ratio) сейчас чаще других параметров применяется для оценки сходства между исходным и восстановленным изображениями, эта функция не отражает степень визуального сходства между исходным изображением и восстановленным. Физиология зрения и психология восприятия изображения человека настолько сложны, что до сих пор не существует способа математического расчета степени визуальной схожести двух изображений. Тем не менее работа над этой проблемой кипит, и часть наработок уже широко используется в компрессорах изображения и видео (детали - в книжке 1).

Глаз человека по-разному воспринимает одинаковые искажения разных пространственных частот изображения и "усваивает" лишь угловые размеры объектов, на которые смотрит, поэтому пространственные частоты измеряются либо в числе периодов на градус (cpd – cycles per degree), либо в числе периодов на пиксел изображения, но тогда указывается, с какого расстояния, измеренного в размерах пиксела, обозревается изображение.

Этот рисунок демонстрирует тот факт, что наш глаз менее чувствителен к искажениям более высоких частот, поэтому перед квантованием коэффициенты вейвлет-разложения домножают на специальный весовой коэффициент, который увеличивается по мере повышения чувствительности человеческого глаза к искажениям на данной частоте.

Процедура расчета весовых коэффициентов сильно усложняется, когда изображение должно рассматриваться с разных дистанций. Кроме того, для слишком больших искажений функция чувствительности меняет свой вид. И наконец, самый тяжелый случай. Когда сжатое изображение предполагает масштабирование по отношению сигнал/шум, в расчете весовых коэффициентов приходится участвовать сразу нескольким функциям чувствительности.

Другая особенность человеческого зрения - так называемый эффект маскирования. Наш глаз содержит огромное количество рецепторов и способен видеть картинку с очень большим разрешением. Однако число нейронов, идущих от глаза к мозгу, не настолько велико, чтобы передать воспринятую картинку в полном объеме. В результате получается так, что если мы видим множество мелких объектов на ограниченной площади, то эти объекты сливаются. А на чистой поверхности один точно такой же объект был бы виден отчетливо.

Изложенные мной идеи применяются для компрессии и видео-, и статичного изображения. Видеоизображение "течет и изменяется", по-особому воспринимается человеческим глазом, поэтому его компрессия сложнее компрессии "неподвижной" картинки.

Для любопытных

Если хочешь в общих чертах понять, как работает человеческая зрительная система, то прочти книжку 10 (см. врезку о литературе).

Назад на стр. 054-008-4 Содержание Вперед на стр. 054-008-6