3. Técnicas de compresión

Las técnicas de compresión son objeto de otro de los trabajos de la asignatura, sin embargo están muy relacionadas con los formatos de audio digital por lo que las trataré de forma muy general y breve.

Las técnicas de compresión son la herramienta fundamental de la que se dispone para alcanzar el compromiso adecuado entre capacidad de almacenamiento y de procesamiento requeridas.

Las técnicas de compresión más elaboradas proporcionan una reducción muy importante de la capacidad de almacenamiento, pero requieren también de un importante procesado tanto para compresión como para la descompresión (sobre todo en la compresión). Las técnicas más simples ofrecen reducciones moderadas con poco procesamiento. Las características del sistema digital implicado y la aplicación determinarán el compromiso entre estos factores y permiten seleccionar las técnicas de compresión adecuadas. Las técnicas más avanzadas analizan la respuesta del oído a la señal y simplifican aquellos elementos irrelevantes para la sensación sonora, consiguiendo tasas de compresión mucho mayores.

Algunas técnicas de compresión relevantes:

ADPCM (Adaptative Differential Pulse Code Modulation). Se trata de una codificación diferencial: en lugar de representar las muestras de la señal, se almacenan la diferencia entre muestras consecutivas, que para señales audio, suele ser pequeña. ADPCM se articula en los estándares CCITT G.721, CCITT G.723 y en el CCITT G.726, que reemplazó a los dos anteriores definiendo estándares para 16, 24, 32 y 40 kbits por segundo (que corresponden a tamaños de muestra de 2, 3, 4 y 5 bits respectivamente).
LPC-10E (Linear Predictive Coder). Este algoritmo hace corresponder la señal audio con un modelo lineal simple y obtiene los parámetros que mejor ajustan el modelo a la señal. La señal generada es poco fiel a la original. Se utiliza en algunos servicios de voz.
CELP (Code Excited Linear Prediction). Es similar a LPC-10E, pero además de asignar los parámetros del modelo, tiene en cuenta el error entre la señal original y la aproximada, creando una tabla de errores. La señal se compone de los parámetros del modelo más el índice del error en cada muestra. La tabla es común a codificador y decodificador.
GSM 06.10. Es una modificación de LPC denominada RPE-LPC (Regular Pulse Excited - Linear Predictive Coder). La compresión es muy elevada pero requiere también de mucho procesamiento.
MPEG. Es un estándar tanto para audio como para vídeo. Consigue alta compresión en los datos y requiere de mucha potencia de cálculo, sobre todo en la codificación. Hay definidos tres layers para las versiónes MPEG-1 y MPEG-2:
- Layer I: desde 32 a 448 kbps
- Layer II: desde 32 a 384 kbps
- Layer III: desde 32 a 320 kbps