Размер не имеет значения Косякин Антон Спецвыпуск Xakep, номер #044, стр. 044-010-1 (deil@real.xakep.ru) Обзор некоторых алгоритмов сжатия звука Со времен появления первых персональных компьютеров прошло много времени. Усовершенствовались технологии, возросли обрабатываемые объемы данных, в нашу жизнь прочно вошли архиваторы. После всплеска развития компьютеров и мультимедиа, сжатие стали применять не только к "обычным" данным. Preamble Известно, что сжатие сокращает объем пространства, требуемого для хранения данных, количество времени, необходимого для передачи данных по сети, записи на съемные носители. Это есть форма кодирования. Однако, кроме сжатия, другими целями кодирования являются поиск и устранение ошибок, шифрование. Но в большинстве случаев они ему противоположны: увеличивают избыточность данных, добавляя дополнительную информацию. Существуют два основных вида сжатия - обратимое (lossless) и необратимое (lossy), оно же "ущербное". Обратимое сжатие характеризуется тем, что первоначальные данные могут быть в точности восстановлены из сжатого состояния. Необратимое же кодирование, которое обычно применяется в цифровой записи аналоговых сигналов, такого гарантировать не может. Процесс записи звуковых файлов называется оцифровкой звука, поскольку при этом происходит преобразование аналогового сигнала в цифровой формат. Аналого-цифровой преобразователь звукового адаптера определяет мгновенное значение аналогового сигнала и кодирует его в цифровом виде. Как и цифровые изображения, звуковые данные могут иметь различное разрешение, от которого зависит размер файла и качество звучания. Вообще говоря, качество и размер файлов зависят от пяти параметров. Размер сэмпла (sample size) - количество возможных значений амплитуды звуковых колебаний, то есть объем данных, описывающих каждое значение. Чем больше эта величина, тем выше качество звука. Выражается в битах. В формате CD-DA используются 16-разрядные сэмплы, то есть амплитуда сигнала может принимать одно из 65536 дискретных значений. Частота дискретизации (sampling rate) - частота измерения амплитуды. Выражается в герцах и килогерцах. Чем выше частота сигнала, тем быстрее меняется его амплитуда. Все изменения, происходящие в промежутках между измерениями, теряются, поэтому частотой дискретизации определяется максимальная частота звука, который может быть записан в данном формате. Чтобы зафиксировать изменение амплитуды, необходимы, по крайней мере, два замера, поэтому максимальная частота сигнала (называемая частотой Найквиста) оказывается вдвое меньше частоты дискретизации. На практике учитывается еще и возникновение погрешностей на частотах, близких к максимальной, поэтому в реализациях аналоговый сигнал пропускается через фильтр низких частот с порогом ниже частоты Найквиста. Метод кодирования (sampling method) - способ записи оцифрованных данных в файл. Формат записи - структура и способ кодирования данных в файле, а также способ их сжатия. Количество каналов - в зависимости от параметров записи, каналов может быть один (моно), два (стерео) и более. Дополнительные каналы повышают реалистичность звучания при воспроизведении. Различные форматы звука допускают запись 1, 2, 4 и 5 каналов. Некоторые рассчитаны только на двухканальный звук. |