Издательский дом ООО "Гейм Лэнд"СПЕЦВЫПУСК ЖУРНАЛА ХАКЕР #44, ИЮЛЬ 2004 г.

Размер не имеет значения

Косякин Антон

Спецвыпуск Xakep, номер #044, стр. 044-010-5


Внутреннее ухо человека осуществляет быстрый анализ критических диапазонов (critical band analysis), где все трансформации происходят на основной мембране. Спектральная функция представлена не на линейной частотной шкале, а на ограниченных частотных диапазонах, называемых критическими (critical bands). Систему восприятия звука человеком можно в двух словах описать как полосно-пропускающий :) набор фильтров (bandpass filterbank), состоящий из строго пересекающихся полосно-пропускающих фильтров с диапазонами частот от 50 до 100 Гц для сигналов ниже 500 Гц и вплоть до 5 кГц для высокочастотных сигналов. Двадцать пять критических диапазонов, покрывающих частоты вплоть до 20 кГц, должны быть приняты во внимание. Одновременное скрывание (simultaneous masking) - феномен частотной области (frequency domain phenomenon), когда слабый сигнал может быть сделан неслышимым одновременным с ним звучанием более сильного (маскировщика), если сам сигнал и маскировщик достаточно близки друг к другу по частоте. Подобное скрывание наиболее сильно проявляется в критическом диапазоне, в котором расположен маскировщик, и в меньшей степени ощущается на соседних. Уровень скрытия (masking threshold) может быть подсчитан, и все слабые сигналы ниже этого уровня не будут слышны. Этот скрытый сигнал может состоять из шума, искажений, ошибок при передаче и так далее. Уровень скрытия, применительно к источнику кодирования, также известен как уровень ощутимого искажения (threshold of just noticeable distortion, JND), изменяющийся во времени. Он зависит от уровня давления звукового излучения (SPL), характеристик маскировщика и скрываемого сигнала. Экспериментально установлено, что более высокие частоты маскируются легче, чем низкие, а разница между маскировщиком и уровнем скрытия меньше при скрытии шумом тонов, нежели наоборот. То есть шум - лучший маскировщик, чем тон :). В MPEG-кодеках оба уровня имеют значение при вычислении уровня скрытия. Без маскировщика сигнал является неслышимым, если уровень его "давления" ниже уровня тишины, который зависит от частоты и простирается в пределах 60 dB. Если исходный сигнал состоит из нескольких маскировщиков одновременно (у каждого из которых есть свой уровень скрытия), то можно подсчитать глобальный уровень скрытия, описывающий JND как функцию от частоты.

Зависимость человеческого звуковосприятия от частоты и сопутствующих ощутимых допустимых ошибок может (и должна) прямо влиять на разработку кодировщика. Техника формирования шума может подчеркивать кодирование шума в частотных диапазонах, где он не важен для восприятия. Однако влияние частоты, основанное на линейной фильтрации, обычное для кодирования речи, не может полностью использовать результаты психоакустики. Поэтому в широкодиапазонном аудиокодировании шумоформирующие параметры динамически контролируются более эффективными методами, чтобы использовать одновременное и временное скрытие.

Назад на стр. 044-010-4  Содержание  Вперед на стр. 044-010-6