martes, 18 de enero de 2011

Que diferencia hay entre todos esos formatos de audio?

En tercer año de la carrera dábamos una asignatura que se llamaba (o se llama, espero que todavía exista), Teoría de señales y circuitos de radio. La impartía un  profesor negrito y jorobado, con unos lentes de fondo de botella que era, en aquella época, una autoridad en la materia (lo siento pero no recuerdo su nombre, lo que si recuerdo era que le decían "El caña" nunca supe porqué). Entre otras cosas trataba toda la parte de modulación y demodulación de señales, filtros, etc. Empecé a leer este artículo y me recordó aquella época, así que este va dedicado al El caña, donde sea que esté. Para los ajenos a la materia les va a dar una idea sobre la composición general de los formatos de audio, y como dice el mismo artículo, quien no tiene hoy un  MP3 por ahí?, el original es de HTG, una de la fuentes recurrentes de este blog. Los dejo con la traducción, provecho.


Que diferencia hay entre todos esos formatos de audio?
El audio digital ha existido desde hace mucho tiempo por lo que está destinado a producir la gran cantidad de formatos de audio que existen.  Éstos son algunos de los más comunes, lo que los diferencia, y para que son usados.
Antes de hablar acerca de los formatos de audio mas comunes, es importante que usted entienda los conceptos básicos, y eso significa la comprensión del PCM (Pulse-Code Modulation, Modulación por pulsos codificados).  Después de eso, analizaremos los formatos comprimidos.

Audio PCM: Donde todo comienza.
PCM fue creado en 1937 y es la más cercana aproximación al audio analógico.  Es decir, reproduce una forma de onda analógica a intervalos regulares.  PCM se caracteriza por dos propiedades: frecuencia de muestreo y profundidad de bits.  La frecuencia de muestreo mide la frecuencia (en veces por segundo) a la que se toma o muestrea la amplitud, y la profundidad de bits es una medidas de los posibles valores digitales.  En términos de formatos de audio, esta es más o menos la base.
El sonido, en el mundo real, es continuo.  En el mundo digital, no lo es.  De alguna manera esto es más confuso con audio que con vídeo, así que vamos a ver el vídeo como punto de comparación.  Lo que interpretamos como "movimiento" o pensamos como "fluido" y en constante movimiento es, en realidad, una serie de imágenes fijas.  De la misma manera, la amplitud de las ondas de sonido en un formato digital no es "fluido" o en constante cambio.  Está cambiando sobre la base de ciertos criterios, a intervalos predefinidos.



Sé que hay mucho aquí que no puede ser una segunda naturaleza a menos que seas un ingeniero, físico, o un melómano, así que vamos descomponerlo aún más con una analogía.
Digamos que el agua que fluye de un grifo abierto es su fuente de sonido "analógico".  La temperatura del agua la podemos comparar con la amplitud de una onda de audio, es una propiedad que necesita ser medida para poder disfrutarla correctamente.  El muestreo es el número de veces por segundo que usted sumerge su dedo en el agua que fluye.  Cuanto más a menudo sumerja su dedo en él, serán mas continuos los cambios de temperatura.  Si metemos el dedo en la corriente de agua 44.100 veces por segundo, es casi como tener el dedo metido todo el tiempo, ¿verdad?  Esa es la idea básica detrás de muestreo.
La profundidad de bits es un poco más difícil.  En lugar de utilizar el dedo, digamos que usted usa un termómetro muy inexacto.   Básicamente, le va a indicar "caliente" para cualquier cosa por encima de la temperatura ambiente y "frío" para lo que sea que esté por debajo.  Independientemente de cuántas veces se sumerja en el agua, realmente no le daría mucha información útil.  Ahora bien, si en lugar de sólo dos opciones, digamos que el termómetro tiene 16 valores posibles que puede utilizar para medir la temperatura del agua.  Más útil, ¿verdad?  La profundidad de bits funciona del mismo modo, de manera que los altos valores permiten cambios mas dinámicos en la amplitud de sonido para ser reflejado fielmente.
Como se mencionó anteriormente, PCM es la base del audio digital, junto con sus variantes.  PCM intenta modelar una forma de onda, tanto como su gloria sin comprimir lo permita.  Es especial, está listo para ser embebido en un procesador de señal digital, y es más o menos universalmente reproducible.  La mayoría del resto de los formatos manipulan el audio a través de algoritmos, por lo que deben ser descifrados durante la reproducción.  El audio PCM se considera "sin pérdidas", no está comprimido, y por lo tanto, ocupa mucho espacio en un disco duro.

La tribu de los formatos sin comprimir: WAV, AIFF



Ambos formatos WAV y AIFF son contenedores de sonido sin pérdidas basados en PCM, con algunos cambios menores en el almacenamiento de datos.  El audio PCM, para la mayoría de la gente, viene en estos formatos, dependiendo de si utiliza Windows o OS X, y puede ser convertido entre ellos sin degradación de la calidad.  Ambos son también considerados "sin pérdidas", no están comprimidos, un archivos de audio estéreo PCM (de dos canales), muestreado a 44,1 kHz (o 44.100 veces por segundo) a 16 bits (la "calidad CD") asciende a aproximadamente 10 MB por minuto.  Si está grabando en su casa para propósitos de mezcla, esto es lo que desea utilizar ya que es de calidad total.



Formatos sin pérdidas: FLAC, ALAC, APE
La Free Lossless Audio Codec (FLAC), Apple Lossless Audio Codec(ALAC), y Monkey's Audio son todos formatos que comprimen el audio, aproximadamente de la misma manera en que se comprime todo en el mundo digital: usando algoritmos.  La diferencia entre los archivos comprimidos y los archivos FLAC es que FLAC está diseñado específicamente para el audio, y así tiene mejores tasas de compresión sin pérdida de datos.  Normalmente, tendremos la mitad del tamaño de WAVs.  Es decir, un archivo FLAC para audio estéreo con "calidad de CD" corre más o menos a 5 MB por minuto. 
La parte interesante es que si usted quiere hacer manipulaciones de audio, puede convertirlo de nuevo a un archivo WAV sin pérdida de calidad.  Si usted es un melómano y escucha mucha música con rangos dinámicos, estos formatos son para ud.  Si usted tiene un gran sistema de altavoces, latas, o audífonos, estos formatos le traerán los tonos para mostrarlos.

Formatos con pérdidas: MP3, WMA, AAC, Ogg Vorbis



La mayoría de los formatos de uso diario son formatos "con pérdidas", un cierto grado de calidad de audio es sacrificada a cambio de una ganancia significativa en el tamaño del archivo (una reducción en realidad ).  Un MP3 promedio de "calidad CD" corre alrededor de 1 MB por minuto.  Hay una gran diferencia en comparación con PCM, ¿no?  Esto es llamado compresión, pero a diferencia de los formatos sin pérdida, no podrás recuperar la calidad anterior una vez que hayas comprimido hacia formatos con pérdidas.  Los diferentes formatos con pérdidas utilizan diferentes algoritmos para almacenar datos, por lo que normalmente varían en tamaño de archivo para calidades comparables.  Los formatos con pérdidas también utilizan el "bit rate" (razón o relación de bits por segundo) para referirse a la calidad de audio, algo que por lo general se parece a "192 kbit / s" o "192 kbps".  Los números más altos significan que se procesan más datos, por lo que se preservarán más detalles.  Éstos son algunos de los detalles de los formatos más populares.

  • MP3: MPEG-1 Audio Layer 3, el códec con pérdidas más común hoy en día.  A pesar de un montón de asuntos relacionados con patentes , sigue siendo increíblemente popular.  ¿Quién no tiene un MP3 por ahí?
  • Vorbis: un formato con pérdidas, libre y de código abierto, más usado en juegos para PC como Unreal Tournament 3.  los fans de software libre, como muchos usuarios de Linux, están obligados a ver un montón de este formato.
  • AAC: Advanced Audio Coding, un formato normalizado que ahora se utiliza con el vídeo MPEG4.  Está muy soportado por su compatibilidad con DRM (por ejemplo, FairPlay de Apple), sus mejoras con respecto a MP3, y porque no se requiere licencia para transmitir o distribuir el contenido en este formato.  los fans de Apple, probablemente tendrá un montón de AAC.
  • WMA: Windows Media Audio, formato de audio con pérdidas de Microsoft.  Ha sido desarrollado y utilizado para evitar problemas de licencia con el formato MP3, pero todavía está aquí debido a varias mejoras y a la compatibilidad con DRM, así como a una implementación sin pérdidas.  Fue muy popular antes de que iTunes se convirtiera en el campeón de la música DRM.
Los formatos con pérdida es lo que ud usa para todo lo que escucha y guarda.  Están diseñados para economizar el espacio en el disco duro.  El formato que usted elija depende de que reproductor de audio digital utilice, la cantidad de espacio que tiene, lo quisquilloso que ud sea, y un montón más de variables.  Hoy en día, los equipos reproducirán cualquier cosa, la mayoría de los reproductores de audio (con excepción de Apple, por supuesto) reproducirán múltiples formatos con pérdida, y cada vez utilizarán mas FLAC y APE.  Apple se apega a MP3, ALAC, y AAC.

¿No es la calidad de sonido subjetiva?
Por supuesto, lo es.  En última instancia, son sus oídos los que están consumiendo la mayor parte de estas cosas, pero esta es una razón más para pensar en la calidad en serio.  Cuando empecé a crear mi colección de música digital, no podía realmente decir la diferencia entre MP3 de 128kbit y CDs de audio.  Para mis oídos, no había una diferencia notable.  Con el tiempo, sin embargo, me di cuenta de que 256 kbit sonaba mucho mejor, y luego de comprar un muy bonito (y caro!) par de audífonos, volví a los CDs de audio a tiempo completo!  También depende del género de la música. 
Hay un montón de variables aquí, amigos, no nos equivoquemos en eso.  Me tomó un tiempo antes de que me estableciera en el uso de FLAC para cierta música y MP3 320 kbps para el resto.  El punto que estoy tratando de hacer ver es que usted debe experimentar qué le funciona mejor respecto a su música, pero tenga en cuenta que a medida que cambien sus gustos, sus percepciones, su equipo, la importancia de la calidad, también cambiará.
Y todo se pone aun más complicado cuando no solo esté hablando de música, sino además de pistas de voz, efectos de sonido, ruido blanco y marrón, etc  Hay todo un mundo de sonido allá afuera, así que no se desanime!  Al aprender lo que puede escuchar por si mismo, puede utilizar esta información para su ventaja en sus proyectos de audio en el futuro.  Les dejo con el mejor consejo que he recibido: "haga lo que simplemente suene bien."