3. Técnicas de compresión
Las técnicas de compresión son objeto de otro de los trabajos
de la asignatura, sin embargo están muy relacionadas con los formatos
de audio digital por lo que las trataré de forma muy general y breve.
Las técnicas de compresión son la herramienta fundamental de la
que se dispone para alcanzar el compromiso adecuado entre capacidad de almacenamiento
y de procesamiento requeridas.
Las técnicas de compresión más elaboradas proporcionan
una reducción muy importante de la capacidad de almacenamiento, pero
requieren también de un importante procesado tanto para compresión
como para la descompresión (sobre todo en la compresión). Las
técnicas más simples ofrecen reducciones moderadas con poco procesamiento.
Las características del sistema digital implicado y la aplicación
determinarán el compromiso entre estos factores y permiten seleccionar
las técnicas de compresión adecuadas. Las técnicas más
avanzadas analizan la respuesta del oído a la señal y simplifican
aquellos elementos irrelevantes para la sensación sonora, consiguiendo
tasas de compresión mucho mayores.
Algunas técnicas de compresión relevantes:
- ADPCM (Adaptative Differential Pulse Code Modulation). Se
trata de una codificación diferencial: en lugar de representar las
muestras de la señal, se almacenan la diferencia entre muestras consecutivas,
que para señales audio, suele ser pequeña. ADPCM se articula
en los estándares CCITT G.721, CCITT G.723 y en el CCITT G.726, que
reemplazó a los dos anteriores definiendo estándares para 16,
24, 32 y 40 kbits por segundo (que corresponden a tamaños de muestra
de 2, 3, 4 y 5 bits respectivamente).
- LPC-10E (Linear Predictive Coder). Este algoritmo hace corresponder
la señal audio con un modelo lineal simple y obtiene los parámetros
que mejor ajustan el modelo a la señal. La señal generada es
poco fiel a la original. Se utiliza en algunos servicios de voz.
- CELP (Code Excited Linear Prediction). Es similar a LPC-10E,
pero además de asignar los parámetros del modelo, tiene en cuenta
el error entre la señal original y la aproximada, creando una tabla
de errores. La señal se compone de los parámetros del modelo
más el índice del error en cada muestra. La tabla es común
a codificador y decodificador.
- GSM 06.10. Es una modificación de LPC denominada RPE-LPC
(Regular Pulse Excited - Linear Predictive Coder). La compresión
es muy elevada pero requiere también de mucho procesamiento.
- MPEG. Es un estándar tanto para audio como para vídeo.
Consigue alta compresión en los datos y requiere de mucha potencia
de cálculo, sobre todo en la codificación. Hay definidos tres
layers para las versiónes MPEG-1 y MPEG-2:
- Layer I: desde 32 a 448 kbps
- Layer II: desde 32 a 384 kbps
- Layer III: desde 32 a 320 kbps