Windows Media Audio(WMA) es un códec de audio(además de un formato contenedor de audio) desarrollado por Microsoft Corporation con el fin de terminar con la hegemonía del MP3 como códec estándar para el audio de consumo.De hecho, el formato prometía la misma calidad que el MP3 empleando solo la mitad del bitrate y ,además, afirmaba conseguir calidad de CD-Audio con un bitrate de tan solo 64Kbps.

Los archivos codificados con este códec y almacenados en el contenedor WMA tienen la extensión .wma.

Fue creado a finales de los 90 en el centro de procesamiento de señales de Microsoft y fue conocido inicialmente como MSAudio 4.0(lanzado en 1999) y luego renombrado como WMA versión 1. Se sucedieron numerosas versiones hasta llegar a la versión actual, la versión 9(lanzada en el 2003). A día de hoy es uno de los más populares debido a que es el formato estándar del reproductor Windows Media player(incluido en el omnipresente sistema operativo Windows), uno de los más populares a nivel de usuario. Este programa permite tanto la reproducción como la creación de archivos (sólo a partir de la versión 7 de este programa) codificados con este formato. Además también es el formato estándar del reproductor de audio Portatil Zune, el popular competidor del aún más popular Ipod de Apple.

Actualmente existen 4 versiones distintas de Windows Media Audio:

  1. Windows Media Audio: Actualmente en su versión 9 (lanzada en 2003) es el más conocido de los 4 códecs que forman la familia WMA. Es un códec con pérdida que basa la eliminación de información de la señal original en la psicoacustica y los "defectos" del oido humano (aquellos sonidos que se consideran inaudibles son eliminados en el proceso de codificación). Si el bitrate es bajo, se tendrá que descartar mucha información de la señal original lo cual puede provocar la que el sonido de la señal codificada en wma sea distinto del original y presente algunos errores.

    Para llevar a la práctica la codificación WMA se emplea una tasa de muestreo de hasta 48.000Hz con dos canáles estéreo independientes, bitrate variable (VBR, que asigna un bitrate mayor a las secciones de mayor complejidad(transiciones de sonidos graves a agudos más rápida, cambios de volumen bruscos etc)) y la técnica de bitrate medio(average bitrate) en la que no todas las secciones se transmite al mismo bitrate(como en VBR) pero en cada segundo siempre se transmite la misma información en total(como con bitrate constante).Gracias a estas 2 técnica tendremos la misma calidad durante todo el archivo de audio. Tanto VBR como el bitrate medio solo están disponibles a partir de WMA 9.

    Además existe una versión de bajo retardo(sólo a partir de WMA 9.1) para las aplicaciones bidireccionales(Full-duplex) como la VoIP.

    Al igual que el resto de códecs de audio para música como MP3, Vorbis, AAC o ATRAC se basa en la transformada del coseno modificada(MDCT, Modified Discrete Cosine Transform) para transformar la señal del dominio temporal al frecuencial.Finalmente las muestras se codifican con el algoritmo de Huffman. Además, se utilizada una técnica de audio conjunto conocida como codificacion estereo M/S (ver descripción).Además, cuanto el bitrate es extremadamente bajo se utilizan técnicas de predicción de muestras como LSP(Line Spectral Pairs )o LSF(Line Spectral Frequencies).

    Todas esas caracteristicas se ven reflejadas en las conclusiones de algunos estudios sobre códecs de audio:

    Para una comparativa mucho más extensa puede consultarse SoundExpert.

    Al ser un formato desarrollado por una multinacional tan potente como Microsoft, casi todos los reproductores permiten trabajar con WMA, tanto reproductores portátiles, como de sobremesa como de ordenador, aunque el entorno ideal de WMA es usar el reproductoor portatil Zune y el reproductor para el sistema operativo Windows, Windows Media player (su última versión es la 11).

    Uno de los aspectos más controvertidos del formato es que incorpora DRM(Digital Rights Management), lo cual limita la distribución de los archivos con copyright codificados con este formato.

  2. Windows Media Audio Professional:También conocido como WMA Pro es un códec con pérdida basado en WMA pero más avanzado.Al igual que el WMA tradicional tiene un tamaño de muestra de 24 bits pero utiliza una frecuencia de muestreo máxima de 96000Hz, en lugar de los 48000 del WMA, y hasta 8 canales(posibilitando así sonido 7.1) en lugar de los 6 del WMA. También incorpora DRC(compresión del rango dinámico). Además, a partir de la versión 9 de WMA Pro existe una versión de WMA Pro de bajo bitrate y otra de bajo retardo para aplicaciones bidireccionales.

    A pesar de ser superior a WMA y pertenecer al gigante Microsoft WMA tiene poco soporte comercial. Salvo los productos de Microsoft Xbox 360 (consola de videojuegos) y Zune (reproductor portatil) y los últimos móbiles de Toshiba y Motorola pocos sistemas más pueden reproducirlo. Se espera que está situación cambie cuando WMV HD(Windows Media Video High Definition, un códec de video de alta resolución) se estandarice, pues WMV HD incorpora WMA Pro como códec de audio.

  3. Windows Media Audio LossLess: Normalmente conocido como WMA LossLess es un códec sin pérdida para audio que, por tanto, está en competencia directa con otros sistemas de codificación sin pérdida como FLAC, Monkey's Audio o Apple LossLess. Para conseguir esa codificación sin pérdida se utiliza una frecuencia de muestreo de 96Khz, un tamaño de muestra PCM de 24 bits y un bitrate variable en función de la complejidad de la sección a codificar. Además proporciona hasta 6 canales independientes, con lo cual se puede conseguir sonido envolvente 5.1 (5 altavoces con un canal de audio cada uno más un canal especial para sonidos más graves que se reproducen en un altavoz especial llamado subwoofer). Consigue una compresión del 50% sobre el archivo de audio original(en formato CD-Audio), aunque Microsoft(su creador) afirma que esa compresión puede llegar a ser del 66% (es decir, el archivo resultante tendría un tamaño que sería un 33% del original). Una característica interesante es que WMA LossLess incorpora Dynamic Range Compression (DRC), que es una técnica que tiene como fin controlar el volumen de la señal de audio. En concreto, se reduce el volumen de los sonidos con volumen alto(superiores a un umbral) y los sonidos con volumen bajo se dejan como están. Esto se hace por que en entornos con ruido si el volumen es bajo los sonidos de volumen bajo son inaudibles mientras que si el volumen es alto los sonidos de volumen bajo podrán oirse pero los de volumen alto se oirán con un volumen molesto. Gracias a DRC los sonidos de volumen alto y de volumen bajo pueden ser escuchados al mismo tiempo, pues se reduce el volumen de los sonidos de volumen altos pero no el de los bajos, luego el volumen general podrá subirse hasta un punto en que ambos son audibles y los de volumen alto no son molestos. Además, de esta forma se reduce el rango dinámico de la señal.

  4. Windows Media Audio Voice: Es un formato de compresión con pérdida específico para voz que nació para competir con los ya existentes como CELP(Algebraic Code Excited Linear Prediction),Speex(de libre distribución), G.711 o G.729. Como todos los códecs para voz están pensados para bitrates muy bajos y para un ancho de banda situado entre 300 y 3400Hz(puesto que la mayor potencia espectrál de la voz humana se encuentra en ese rango frecuencial). Este en concreto permite un bitrate constante(NO permite bitrate variable) de hasta 20Kbps, un solo canal mono y una frecuencia de muestreo de hasta 22.05Khz. Además subsana un problema que tienen la mayoría de los códecs para voz: Si la señal codificada contiene otro tipo de sonidos además de voz(pues se supone que si se usa un códec de voz es por que se está transmitiendo voz), como música, la codificación no es buena, pues la música tendrá un espectro más amplio que la voz. WMA voice soluciona esta carencia detectando qué secciones contienen algo distinto de voz humana (musica, algún tipo de efecto...) y codifica esa sección con el WMA tradicional.

    La única versión existente hasta el momento, WMA 9 Voice, se utiliza en el servicio de juego online de Microsoft Xbox Live, en los dispositivos móviles que utilizan Windows Mobile y en la radio streaming por internet de la BBC.