Кодирование звуковой информации

Звук – это волны, распространяющиеся в твердых телах, жидкостях и газах, вызванные колебаниями частиц среды. Изменения давления акустической волны на препятствия, позволяет слуховому аппарату человека регистрировать звук.

Основными характеристиками любой волны являются частота и амплитуда. Амплитуда акустического сигнала характеризует громкость звука, а частота – тон.

Акустическая волна является непрерывной, поэтому для обработки на компьютере ее необходимо преобразовать в цифровую форму. В ходе кодирования звуковая информация подвергается временной дискретизации и квантованию.

Процесс временной дискретизации заключается в регистрации параметров звука через определённые очень короткие промежутки времени, в пределах которых сигнал считается неизменным (см. рис. 1). Частоту измерения сигнала называют частотой дискретизации.

В течении временной дискретизации непрерывный диапазон значений амплитуды звуковой волны квантуется путем разбиения на дискретную последовательность значений амплитудных уровней (см. рис. 2).

Временная дискретизация звука

Количество бит, отводимых для записи номеров уровней называется глубиной кодирования звука.

Глубина кодирования звука связана с количеством уровней квантования по формуле:
N = 2 ⁱ
где N – количество уровней разбиения амплитуды сигнала,
i – число бит (глубина кодирования), отводимых для кодирования уровней амплитуды сигнала

Чем выше частота дискретизации и глубина кодирования звука, тем точнее цифровое представление оригинального непрерывного звукового сигнала.

Повышая частоту дискретизации и глубину кодирования звука, можно более точно сохранить, а затем восстановить форму оригинального звукового сигнала. Необходимо заметить, что в этом случае увеличивается объем сохраняемого файла. В различных ситуациях при цифровой записи звука используют разные значения частоты дискретизации и глубины кодирования звука.

Для расчета информационного объема звукового файла используется следующая формула:
I = i • ν • t • k
где i – глубина кодирования
ν – частота дискретизации
t - время звучания файла, k - коэффициент, знaчение которого зависит от качества звука: моно - 1, стерео - 2, квадро - 4