3 Parámetros fundamentales de los códecs de audio
Frecuencia de muestreo:
Este parámetro determina la velocidad a la que se toman muestras de la señal analógica. Determinado este parámetro, tenemos determinado el rango espectral que se va a codificar de la señal, ya que por el teorema del muestreo de Nyquist-Shannon el ancho de banda de la señal tendrá que ser como máximo la mitad de la frecuencia de muestreo, si queremos que la señal pueda ser recuperada correctamente a través de sus muestras.
Para una señal de audio que abarque todo el rango de frecuencias audible por el ser humano una frecuencia de entre 40 y 44 Khz es suficiente, aunque para aplicaciones de mayor calidad de audio o audio profesional, se usan frecuencias de muestreo mayores, típicamente de 48 o 96 KHz.
Para señales que exclusivamente contengan voz, cuyo espectro típicamente se encuentra en el rango de 300 a 3400 Hz, se suele utilizar una frecuencia de 8 KHz. En este caso el códec se denomina de banda estrecha o narrowband. Aunque en el caso de señales vocales hay códecs que para ofrecer una mayor calidad de audio utilizan una frecuencia superior, de 16 KHz. A estos códecs se les llama de banda ancha wideband.
Tasa binaria o bit rate:
Es el número de bits por segundo que salen del codificador en el proceso de codificación, y que entran al codificador (generalmente) en el proceso de decodificación. Es un parámetro crítico, ya que junto con la frecuencia de muestreo es uno de los parámetros que más determinan la calidad de la señal codificada. Una tasa binaria muy elevada implica que el número de bits a almacenar sea muy elevado (por ejemplo para un archivo de audio), o que el número de bits a transmitir por el canal de comunicaciones sea demasiado elevado para el canal. Generalmente en la codificación se persigue disminuir lo máximo la tasa binaria afectando lo mínimo posible a la señal original.
Para las señales de audio convencionales (para música, cine, televisión) las tasas binarias suelen ser casi siempre superiores a los 32 kbps, mientras que para señales de voz, se suelen usar tasas siempre menores que 64 Kbps, y la tendencia actual de los códecs de voz es disminuir cada vez más la tasa binaria sin afectar a la calidad de la señal.
Calidad de audio:
Aunque más bien esta es una medida subjetiva para cada individuo, existen escalas de valoración de la calidad del audio, realizadas en base a experimentos con muchos individuos en condiciones determinadas. Una escala ampliamente utilizada para medir la calidad del audio es la escala MOS (Mean Opinión Score), que da una puntuación mínima de 1.0 (calidad pésima) y una máxima de 5.0 (calidad excelente). También existen medidas objetivas de la calidad, pero en este trabajo nos centraremos en calidad subjetiva para el usuario, y siempre que hablemos de que un códec proporciona mayor calidad que otro, lo decimos siempre en base a las puntucaciones del códec en la escala MOS.

Número de canales codificados:
Número de canales diferentes que son codificados en una misma señal de audio. Si hay un solo canal se denomina Mono, y si hay 2 Stereo. Este parámetro es muy habitual en los códecs de música, televisión y cine, donde los códecs suelen aprovechar el parecido de los distintos canales para reducir la tasa binaria. En los códecs para señales de voz, casi siempre hay un solo canal , ya que lo más importante para este caso es la inteligibilidad de la voz.
Retardo:
Se define el retardo de un códec como el tiempo que transcurre entre la entrada de una muestra de la señal de audio al codificador, hasta que la señal decodificada correspondiente a dicha muestra sale por el decodificador, suponiendo que la salida del codificador y del decodificador están conectadas directamente. Para códecs cuyas aplicaciones no sean en tiempo real este parámetro no es crítico aunque es importante, porque por ejemplo determina si se tarda mucho en codificar una señal para almacenarla. Para códecs cuyas aplicaciones si sean en tiempo real (telefonía, videoconferencia, VoIP, streaming de audio), este parámetro es muy importante, ya que un códec que introduzca mucho retardo hará que se haga muy difícil la comunicación en tiempo real, ya que en el canal siempre hay un cierto retardo. Valores aceptables para el retardo de un códec (usado en aplicaciones de tiempo real) son entre 5 y 50 ms.
