martes, 23 de noviembre de 2010

Los fundamentos del audio digital


5b415a0a74765006f122f979f487f751Iba a escribir yo mismo un artículo sobre los conceptos básicos del audio digital, pero, evidentemente, en internet hay mucha gente que ya lo ha hecho. Me gustó especialmente, por su sencillez y su carácter didáctico, y a pesar de que tiene el aspecto de ser ya un poco antiguo, un artículo escrito por Joost Boomkamp, un estudiante de Diseño de sonido y de Desarrollo de software musical y de audio que vive en Holanda, de modo que os lo voy a traducir directamente. A pesar de que contiene algún que otro anacronismo, he preferido respetar su redacción sin cambiar una sola coma, principalmente porque te ayuda a ponerte en perspectiva sobre el vertiginoso ritmo de evolución de la tecnología (ten en cuenta que este artículo es de hace sólo unos pocos años).



Para poder crear los mejores sonidos posibles por tu cuenta, es importante que tengas algunos conocimientos sobre el sonido digital. En este artículo trataré de explicarte, en un lenguaje sencillo, algunas de las cosas que probablemente te ayuden en gran medida.

Este documento está dividido en varias partes separadas:


* La teoría del sonido digital
--o Teoría del sonido:
---+ Frecuencia
---+ Nivel
--o Teoría del muestreo:
---+ Frecuencia de muestreo
---+ Rango dinámico
---+ Digitalización del sonido
* Grabación de sonido por ti mismo
--o Guía paso a paso


Creo que ambas partes contienen información útil, que todo el mundo que use audio digital para crear música debería conocer. Así que echa un vistazo; probablemente encuentres aquí algo que merezca la pena leer. ;)


Teoría básica de la señal

Como probablemente sepas, el sonido es aire que se mueve muy rápidamente. La velocidad de estos movimientos recibe el nombre de “frecuencia”, y constituye una muy importante propiedad del sonido y, especialmente, la música. La frecuencia de un sonido se mide en Hz (=herzios, nombre que proviene de un hombre llamado Hertz :-/ que hizo un montón de investigaciones sobre el sonido y la acústica hace ya tiempo). La mayoría de las personas pueden oír frecuencias en el rango entre 100 Hz y 15 000 Hz. Sólo algunas personas pueden oír frecuencias muy altas, por encima de los 19 000 Hz, pero, no obstante, los científicos asumen siempre que el oído humano es capaz de discernir frecuencias entre los 20 y los 20 000 Hz, ya que esas cifras facilitan mucho sus cálculos.

Aquí hay unos pocos ejemplos de diferentes frecuencias, por si te interesa jugar un rato con ellas:

60 Hz (muy grave): http://www.hammersound.net/audiobasics/60_Hz.wav

440 Hz (nota la media del piano): http://www.hammersound.net/audiobasics/440_Hz.wav

4000 Hz (audible): http://www.hammersound.net/audiobasics/4000_Hz.wav

13000 Hz (¡ay!): http://www.hammersound.net/audiobasics/13000_Hz.wav

20000 Hz (demasiado aguda): http://www.hammersound.net/audiobasics/20000_Hz.wav


 

Otra muy importante propiedad del sonido es su nivel; la mayoría de la gente lo llama volumen. Se mide en dB (=decibelios, nombre que proviene de un hombre llamado deciBell (¡¡ES BROMA!!)... de acuerdo, su verdadero nombre era Bell, y fue quien inventó el teléfono; gracias a él, los holandeses dicen 'mag ik hier misschien even bellen?' cuando quieren usar tu teléfono).

¿Entonces por qué no medimos el volumen en belios en lugar de decibelios? Bueno, principalmente, porque tu oído en realidad puede discernir una increíble cantidad (1 200 000 000 000, son once ceros) de diferentes niveles de intensidad, de tal modo que tuvieron que pensar en un truco (¡lo siento, no voy a explicarlo aquí!) para poder describir ese increíble rango con sólo unas pocas cifras. Convinieron en usar décimas de belios, decibelios, dB, en lugar de belios.

La mayoría de los equipos de audio profesional usan un vúmetro (VU meter, Volume Unit meter, medidor de unidades de volumen) que te muestra el nivel de entrada o salida del sonido. Es algo de uso muy conveniente, pero sólo si sabes cómo usarlo: una regla general es fijar los niveles de entrada y salida de tu equipo de tal modo que la parte más alta del tema que quieres grabar/reproducir se aproxime a las luces de 0 dB. Es importante quedarse en la parte baja de la línea de 0 dB, porque, en caso contrario, el sonido aparecerá gravemente distorsionado y no habrá modo alguno de restaurarlo. Si grabas en una cinta (¡analógica!) en lugar de un disco duro (digital), podrás incrementar los niveles un poco, ya que existe suficiente del llamado 'espacio de cabezal' (headroom en inglés, o la capacidad de amplificar un poco más sin distorsión) para llevar el vúmetro a +6 dB. Abajo, en la sección sobre grabación, hay algo más de información sobre el calibrado del nivel de los equipos.

Algunos ejemplos de diferentes niveles, por si te interesa jugar con ellos por unos momentos:

0,0 dB = 100%: http://www.hammersound.net/audiobasics/4000_Hz.wav
(nivel máximo)

-6,0 dB = 50,0%: http://www.hammersound.net/audiobasics/4000_Hz-6dB.wav
(a mitad de potencia)

-18,0dB = 12,5%: http://www.hammersound.net/audiobasics/4000_Hz-18dB.wav
(muy bajo)

+6,0dB = 200%:
http://www.hammersound.net/audiobasics/4000_Hz+6dB.wav
(un poco por encima del nivel máximo - mucha saturación)


 

Bueno, ahora que conoces las cosas más importantes sobre el sonido, vayamos finalmente a la parte digital. Hace poco te he hablado sobre las propiedades del sonido 'normal' (analógico). Ahora te hablaré sobre cuáles son las propiedades más importantes del sonido digital.


Teoría del audio digital

En primer lugar, tenemos la famosa 'tasa de muestreo' (sample rate). La tasa de muestreo de una pieza de audio digital se define como 'el número de muestras grabadas por segundo'. Las tasas de muestreo se miden en Hz, o en kHz (kiloherzio, mil muestras por segundo). Las tasas de muestreo más comúnmente usadas en aplicaciones multimedia son:

8000 Hz (una verdadera porquería).

11025 Hz (no mucho mejor que la anterior).

22050 Hz (úsala sólo si te es necesario).

Los profesionales usan tasas más altas:

32000 Hz (sólo un par de samplers antiguos)

44100 Hz (ahh, qué descanso)

48000 Hz (algunas tarjetas de audio, las grabadoras DAT)


 

Algunos equipos modernos tienen la potencia de proceso requerida para permitir tasas aún mayores: 96 000 Hz, o incluso unos impresionantes 192 000 Hz, que serán posiblemente / probablemente las tasas de muestreo profesionales (¿de DVD?) en un par de años. Las ventajas de una tasa de muestreo más alta son simples: mayor calidad de sonido. Las desventajas son también simples: una muestra (sample) con una tasa de muestreo alta requiere mucho más espacio de almacenamiento que otra de baja tasa. No obstante, con los precios de los discos duros y los CD-R de hoy eso no constituye ya un problema.

¡¿...Pero, por qué la calidad es mejor?!

Para responder a eso, observemos un único período de una onda sinusoidal simple:


 
* comienza en cero..
* ..luego sube..
* ..luego vuelve a cero..
* ..luego sigue bajando..
* ..luego vuelve a cero..
* y así sucesivamente... las ondas de seno tienen vidas monótonas. ;)


 

Cuando grabes a cierta frecuencia, necesitarás al menos (aunque preferiblemente más de) dos muestras para cada período, para grabar con precisión su pico y su valle. Esto significa que necesitarás una tasa de muestreo de al menos (más de) el doble de la frecuencia más alta que quieras grabar, lo cual, para los seres humanos, se encuentra alrededor de los 20 000 Hz. ¡Esa es la razón por la que los profesionales usan como mínimo una tasa de muestreo de 44 100 Hz! Con esa tasa pueden grabarse frecuencias de hasta 22 050 Hz. (Ahora ya sabes por qué una muestra de 8 000 Hz suena tan horrible: ¡sólo reproduce una minúscula parte de lo que podemos oír!)

Usando una tasa de muestreo aún más alta, como 96 000 Hz, puedes grabar frecuencias superiores, pero, no obstante, no esperes oír los 48 000 Hz. Ese no es el objetivo principal de esas super-tasas. Si grabas a 96 000 Hz, tendrás más de cuatro muestras para cada período de 20 000 Hz, ¡de modo que la probabilidad de perder las altas frecuencias decrecerá dramáticamente! Faltan aún unos pocos años para que las tarjetas de sonido para el consumidor medio soporten estas cifras, no obstante [nota del traductor: actualmente (2010) ya es normal encontrar tarjetas de audio con esas características para el público general]. Hay ya unas pocas tarjetas profesionales con esas características, pero podrías fácilmente comprarte un automóvil por el mismo precio...

Eso es todo sobre la frecuencia por ahora. Como dije antes, otra muy importante propiedad del sonido es su nivel. Echemos un vistazo a cómo las tarjetas de audio digital procesan los niveles de sonido.



Rango dinámico

La capacidad de las tarjetas de audio se mide en bits, por ejemplo, tarjetas de sonido de 8 bits, o de 16 bits. El número de bits que una tarjeta de sonido puede manejar te indica algo acerca de la precisión con que puede grabar el sonido: te dice cuántas diferencias puede detectar. Cada bit extra en una tarjeta de sonido te proporciona 6 dB adicionales de sonido representable (¿por qué? Pues, porque es algo natural). Esto significa que las tarjetas de 8 bits tienen un rango dinámico (=diferencia entre la señal más débil posible y la más alta posible) de 8 x 6 dB = 48 dB. No es mucho, ya que las personas pueden oír hasta 120 dB. Por eso, inventaron el audio de 16 bits, que nos da 16 x 6 dB = 96 dB. Aún no son 120 dB, pero, como sabes, los CD suenan realmente bien, comparados con las cintas. Algunos friquis, incluyéndome yo mismo ;), queremos ser capaces de hacer un uso completo del potencial del oído gastando dinero en tarjetas con ADC (Analog to Digital Convertors, convertidores de analógico a digital, los artilugios que crean la muestra real) de 18 bits, 20 bits, o incluso 24 o 32 bits, que les dan rangos dinámicos de 108 dB, 120 dB, o incluso 144 dB o 192 dB.

Desafortunadamente, todos los rangos dinámicos que he mencionado son estrictamente niveles máximos teóricos. ¡¡¡No existe forma alguna en el mundo para que obtengas 96 dB de una tarjeta de sonido multimedia estándar!!! La mayoría de los fabricantes de tarjetas de audio están bastante orgullosos de presentar un rango dinámico por encima de los 90 dB en una tarjeta de audio de 16 bits. Esto es en parte por el hecho de que no es tan fácil poner un montón de componentes electrónicos en una zona pequeña sin que un montón de diferentes leyes físicas traten de llamar la atención. La inducción, la conducción o incluso las malas conexiones o (muy probablemente) los componentes baratos, simplememente, no son muy amigos del rango dinámico y la calidad general de una tarjeta de audio. [Nota del traductor: en 2010 ya existe, desde hace varios años, tarjetas como la M-Audio Transit que, con un precio de alrededor de 80 dólares, proporcionan un rango dinámico -real- de 104 dB]. Pero existe otro problema, que se aclarará en el próximo párrafo.



Ruido de cuantización

Antiguamente, cuando aparecieron en el mercado los primeros pianos digitales, (la mayoría de nosotros aún no vivía) nadie los quería. ¿Por qué no? ¡Si era un instrumento moderno y cojonudo, e incluso podías elegir sonidos de piano diferentes...!

El problema con esos 'artefactos' era que no tenían la sofisticación del equipo musical actual. Principalmente porque no presentaban tantos bits (y por lo tanto no tenían ni la mitad de dinámica que el instrumento real), pero también porque tenían un borde claramente abrupto al final de las muestras de sonido.



Imagina una muestra de piano como la que ves arriba. Lentamente se apaga hasta que no oyes nada. Al menos, eso es lo que tú deseas... Pero, como puedes ver en las dos imágenes separadas, eso no es lo que obtienes en absoluto... Estas imágenes son ampliaciones extremas de la misma zona de la muestra de piano original. La imagen superior podría ser el final suave de un tono de piano. ¡La inferior, no obstante, parece más código morse que una muestra de piano! La muestra ha sido convertida a 8 bits, lo cual nos deja tan sólo 256 niveles en lugar de los originales 65 536. El resultado es devastador.

Imagina que tocas el piano de un modo muy suave y sutil, ¿qué obtendrías? ¡Pues, alguna composición futurística para ondas cuadradas! No pagaste para eso. ;) Esta “espuma” recibe el nombre de ruido de cuantización, ya que es ruido generado por la (mala) cuantización.

Hay un modo de evitar que esto ocurra, no obstante. Mientras se digitaliza el piano, la tarjeta de sonido puede añadir un poco de ruido a la señal (alrededor de 3-6 dB, lo cual es literalmente un poco de ruido) que ayudará a que la señal aumente un poco de volumen. De ese modo, podría llegar a tener el tamaño suficiente para aparecer como una variación más realística en lugar de la onda cuadrada. Lo gracioso es que no oirás el ruido, ya que es muy débil y no cambia tanto como la señal grabada, de modo que tus oídos lo olvidarán automáticamente. Esta técnica recibe el nombre de 'difuminado' (dithering). También se usa en algunos programas gráficos, por ejemplo, a la hora de cambiar el tamaño de una imagen.



Variación de retardo (jitter)

Otro problema que existe en los equipos de audio digital es la llamada variación de retardo, o jitter en inglés. Hasta ahora, siempre he asumido que la tarjeta grababa el sample a exactamente 44 100 Hz, tomando una muestra cada 1/44100 de segundo. Desafortunadamente, eso es -absolutamente- irreal. Existe *siempre* un minúsculo error de sincronización que hace que cada muestra se tome un poco más tarde o un poco más temprano.

¿Constituye esto una gran diferencia, entonces? Bien, podrías empezar a quejarte por todo, pero lo más recomendable sería que te hubieses comprado una tarjeta de sonido más cara en primer lugar. Lo peor de todo es que ese jitter depende de la frecuencia. Al estar relacionado con el ritmo del sample, puede alterar un poco las frecuencias grabadas. Si graba una muestra sólo un poco antes de lo debido, la tarjeta pensará que la frecuencia grabada es un poco más baja de lo que realmente es. Esto es apreciable a frecuencias por debajo de los 5000 Hz, pero especialmente malo a las frecuencias más bajas, ya que la influencia de un pequeño error es mucho mayor en ellas. Los tiempos de variación de retardo típicos se encuentran entre 1.0 x 10 -9 segundos (eso es un NANOsegundo, léase: prácticamente nada) y 1.0 x 10 -7 segundos (eso es cien NANOsegundos, no mucho más), pero marcan la diferencia entre un sonido 'pro' y un sonido 'de consumidor medio', por ejemplo, en diferentes reproductores de CD.



Digitalización del sonido

Cuando grabas un sample con tu tarjeta de sonido, éste pasa por un montón de etapas antes de que puedas almacenarlo en tu disco duro como un archivo sonoro. Afortunadamente, no tienes que preocuparte acerca de estas etapas, pues las tarjetas de sonido modernas y los digitalizadores se ocupan de ello en tu lugar. No obstante, voy a ser un poco aburrido y te voy a hablar de esas etapas.

Veamos qué ocurre cuando pulsas 'rec':

La tarjeta de sonido pone en marcha un cronómetro muy preciso (el 'muestreo', o 'samplerate').

Proceso de conversión analógico-digital.


Entonces transforma el sonido que llega: simplemente recorta las frecuencias muy altas que no puede manejar. Esto mutila el sonido en gran medida, pero es necesario para evitar daños aún más serios al sonido, que lo harían irreconocible. Es lo que se conoce como 'filtro antialiasing (de suavizado, difuminado) pasa-bajos' ('low-pass filter', que recorta las frecuencias 'altas', permitiendo el paso de las frecuencias 'bajas') (se llama 'filtro' porque elimina algunas partes y deja el resto). Cada vez que el cronómetro ha completado un ciclo, el ADC (convertidor analógico-digital) de la tarjeta de sonido mira la señal de entrada filtrada. Calcula el volumen del sonido entrante en ese momento exacto de tiempo (de forma muy parecida a como un micrófono mediría la presión del aire) y transforma el nivel de intensidad en el número digital más cercano.

A continuación grita ese número a la computadora/ordenador, la cual lo almacena en algún lugar de la memoria, probablemente en el disco duro.

Los fabricantes ponen un 'filtro de muro' ('brickwall filter') (¡ver la imagen de abajo!) en sus tarjetas de sonido, para prevenir un efecto colateral muy desagradable denominado algo así como 'distorsión de plegado' ('foldover distortion'). El foldover es un concepto bastante complicado, pero trataré de exponerlo de forma simple.

Es más o menos lo mismo que ocurre cuando miras las ruedas de un automóvil al pasar frente a ti muy rápidamente. Algunas veces verás la rueda moviéndose hacia atrás. Otro ejemplo puede encontrarse en películas antiguas del oeste americano (westerns) en las que aparece un tren que pasa. las 'ruedas' del tren se verán moviéndose hacia atrás, también, si el tren se mueve lo suficientemente rápido.

Todas estas 'ilusiones' son efectos de foldover. Ocurren cuando un sistema rápido analiza a intervalos regulares algo que se mueve incluso más rápido que el propio sistema.

Cuando graba a 22 050 Hz, tu tarjeta simplemente no será capaz de grabar ninguna frecuencia por encima de los 11 025 Hz, pues, como dije anteriormente, son necesarios al menos dos muestras para cada período. Sin el filtro pasa-bajos, la tarjeta de sonido tratará ciegamente de grabar esas frecuencias. Pero, posteriormente, cuando reproduzcas el sample, oirás una frecuencia totalmente diferente de la original. Sucede igual que con las ruedas del automóvil, que parecen moverse hacia atrás, aunque realmente no lo hacen. (La frecuencia que realmente oirás es igual a la frecuencia de muestreo menos la frecuencia original, por ejemplo: 22 050 - 12 050 Hz = 10 000 Hz, en lugar de la frecuencia original, en este caso, 12 050 Hz).

Por lo tanto, la frecuencia máxima que puede grabarse con una determinada tasa de muestreo, es la mitad de esa tasa de muestreo. Esa frecuencia recibe el nombre de frecuencia de Nyquist, a veces abreviada como fN, y proviene de un hombre llamado Harold Nyquist, que trabajó en los Laboratorios Bell y más o menos inventó la digitalización de audio. Un gran tipo para el audio digital.

Para evitar todo eso, los fabricantes de tarjetas de sonido ponen un filtro especial en su tarjeta (ver la figura de abajo).


Filtro de muro a 4000 Hz.


Este filtro pasa-bajos elimina las frecuencias altas del mismo modo que lo haría cualquier ecualizador o reductor de corte de altas frecuencias, excepto que es *mucho* más agresivo. Puedes ver que el filtro permite el paso de todos los sonidos por debajo de 1000 Hz, y que le da un pequeño refuerzo al rango de frecuencias entre 1000 y 3500 Hz. (Este refuerzo es necesario para que sea posible el corte de las frecuencias más altas con tal violencia.) Las frecuencias por encima de 4000 Hz se eliminan con agresividad extrema. Esta es la razón por la que lo llaman un filtro de muro: porque su pendiente tiene forma de muro.

El filtro mostrado arriba podría usarse para una tasa de muestreo de alrededor de 8000 Hz, ya que un sample de 8000 Hz tiene una frecuencia de Nyquist, la máxima frecuencia grabable, de 4000 Hz. Esto hace que sea muy importante elegir la tasa de muestreo adecuada para tu sample; es decir, si tienes una razón legítima para no grabar a 44 100 Hz, o más.
;)


Grabación digital de sonido por ti mismo

Vayamos por este asunto paso a paso.

En primer lugar empezaremos seleccionando Archivo->Nuevo [o la opción correspondiente que aparezca en tu programa], algo que pueden hacer todos los editores de samples que conozco. ;) Querrás seleccionar el número de bits que deseas usar para cada sample. También querrás seleccionar la tasa de muestreo. Mi consejo es: elige la mayor tasa que pueda manejar tu hardware. Eso suele ser 16 bits a 44 100 Hz, ya que la mayoría, si no todas, las tarjetas de sonido de consumo medio soportan grabación y reproducción de calidad de CD. [Nota del traductor: con los procesadores y programas actuales es posible grabar fácilmente a frecuencias de hasta 192 000 Hz y a 24 bits].


Vúmetro - Vúmetro demasiado bajo - Vúmetro saturado.


A continuación deja a los artistas, o lo que sea, tocar durante un rato, para ver si los niveles de grabación no son demasiado altos ni demasiado bajos. Tu programa probablemente soporte monitorización/monitoreo de la entrada, y, si no lo hace, ¡debería!: consigue otro programa. ;) Al ejecutar el programa, probablemente verás una variante del viejo y querido vúmetro. A mí me gusta el de arriba. La parte de mayor intensidad que quieres capturar en disco debería estar en algún lugar cercano a los 0.0 dB, pero nunca debería, ¡¡nunca, jamás!!, superar los 0.0 dB, ya que esto da como resultado una distorsión muy desagradable, que es chévere/guay en grabadoras analógicas pero realmente horrible en el mundo digital.

Si deseas ese efecto de distorsión, consigue un programa que lo haga por ti, ¡pero no grabes a un nivel demasiado alto! El Sound Forge de Sonic Foundry [nota del traductor: actualmente, de Sony] tiene una opción de distorsión realmente buena. También, existen muchos plugins de Direct-X que emulan la compresión valvular, la saturación de la cinta, etc. Este tipo de distorsión digital recibe el nombre de 'recorte' ('clipping') porque todas las muestras que exceden el nivel máximo son 'recortadas' (cortadas y reducidas) al propio nivel máximo.

No fijes tus niveles de grabación demasiado bajo, no obstante. A largo plazo reducirá la precisión de tu grabación casera, ya que las tarjetas multimedia ya añaden un ruido muy significativo. ¡De hecho, algunas veces a duras penas te dejan algún rango dinámico en absoluto!

De modo que, sé muy meticuloso con los niveles de entrada.

A continuación, piensa en la fuente de tu grabación. ¿Un micrófono? ¿Un teclado o sintetizador? ¿Una cinta DAT? Si la fuente es ya digital, como es el caso del DAT y el CD, por favor, ¡aprovecha esa circunstancia y permanece digital! ¡Usa una conexión digital entre el DAT y la tarjeta de sonido, para evitar la operación de conversión digital-analógica -> transmisión a través de un cable barato -> conversión analógica-digital con ruido o distorsión adicionales!

Si estás grabando con un micrófono, primero deja que éste grabe un minuto o así de 'silencio'. Entonces reproduce ese 'silencio' grabado a través de los audífonos/auriculares y escucha la cantidad de ruido que proviene de la habitación. Asegúrate de guardar esta información, porque algunos buenos programas pueden eliminar ese ruido de la grabación mediante el uso de dicha información como 'huella de ruido' ('noise print') (analizan los datos de huella de ruido y luego los 'restan' a la grabación real. Sond Forge y CoolEdit tienen esta importante opción.)

También, si tienes la oportunidad, prueba varios micrófonos para la misma grabación. Aprende a confiar en tus oídos. Si tienes varias grabaciones diferentes del mismo evento, elige aquella que suene mejor. No elijas automáticamente la grabada por el micro más caro. ¡Eso! ¡No! ¡Funciona! Elige la que suene mejor. Te sorprenderá conocer la cantidad de grandes éxitos que fueron grabados con micros baratos. Pero tampoco estoy diciendo que debas usar micros baratos... Hay varios micros de propósito general bastante buenos disponibles a partir de 30 dólares (como el Behringer XM-2000). Un micro realmente bueno para la voz y la guitarra es el SM-58 de Shure. Estos son un poco más caros (por encima de 100 dólares), pero se usan en todo el mundo en estudios profesionales. El problema con estos micrófonos es que necesitarás también un pre-amplificador, ya que la señal original del micrófono es muy débil, y un 'cable XLR' para conectarlo a tu equipo. La mayoría de las mesas de mezclas tienen preamplificadores de micrófono sobre ellas. Si buscas una mesa de mezclas de buena calidad para su precio, te sugiero que le eches un vistazo al sitio web de Behringer. No tienen una calidad del 100%, pero, si un 90% es suficientemente bueno para ti (es ese 10% extra de perfección lo que hace que el equipo de audio sea tan caro) Behringer es tu sitio. No, no me pagan por decir esto. ;)

Si grabas desde un hardware diferente, por ejemplo, directamente desde el sintetizador/teclado, mira el manual para ver si ese hardware tiene salidas equilibradas. Si las tiene, necesitarás conseguir/fabricar dos clavijas estéreo y tres cables de la misma longitud, o incluso mejor: un cable aislado con tres cables aislados separados en su interior (eso es algo que te costará muchos dólares, no obstante...) para asegurarte de que el audio no se distorsiona antes de llegar a las entradas de tu tarjeta.

Un cable normal tiene 1) una cable de señal y 2) un cable de tierra. Si usas cables normales a lo largo de grandes distancias, preferiblemente cerca del alumbrado del escenario ;), notarás que el cable recoge un horrible montón de ruido y zumbido por el camino. Esto tiene que ver con la inducción y los campos magnéticos, pero todo lo que necesitas saber es que la jode. Para evitar tal zumbido de 50 Hz (¡corriente alterna!), los profesionales usan cables equilibrados.

El sistema de cable equilibrado es una muy buena forma de conectar equipo a largas distancias sin pérdida de calidad del sonido o inducción no deseada. Esto es posible debido a que un cable equilibrado está formado por tres cables en lugar de dos: 1) un cable de señal, 2) un cable de señal invertida y 3) un cable de tierra. A la salida del sintetizador / mesa de de mezclas / lo que sea, la señal de salida es dirigida hacia tanto el cable de señal como el cable de señal invertida.

La señal que va al cable de señal invertida es entonces invertida (multiplicada por -1, vuelta del revés, con un cambio de fase de 180 grados) y transportada junto con el cable de señal por todo el cable hasta el otro conector. Por el camino, ambos cables recogen todo el ruido y zumbido usual. Pero, cuando la señal llega a su destino, la señal invertida es invertida de nuevo, de tal modo que vuelve a ser normal otra vez. Esta inversión invierte también el ruido y zumbido, de modo que ahora tenemos: una cable de señal con 1) la señal y 2) el ruido, y tenemos el cable de señal reinvertida (=normal!) con 1) la señal y 2) el ruido invertido. Estas dos señales son mezcladas por el equipo: señal + señal + ruido - ruido, lo cual da lugar a una señal con el doble de potencia de la señal original y ningún ruido en absoluto!

Si estás interesado en leer más sobre audio (digital), hay muchos sitios que puedes visitar. Te sugiero que pruebes algunos de ellos:

http://www.prorec.com
http://homerecording.com

 
Espero que este artículo te haya sido útil, o, al menos, te haya gustado.

¿No puedes oír los 18 kHz y crees por eso que oyes mal?

Hay gente que vive obsesionada con la salud de sus oídos. Cuando se hacen una prueba de audición y descubren que su margen superior no llega, por ejemplo, a los 18 000 Hz, se preocupan seriamente, pensando que están volviéndose sordos, ya que, como todos los libros dicen, “el oído humano puede oír desde los 20 hasta los 20 000 Hz (20 Hz - 20 kHz)”.
5b415a0a74765006f122f979f487f751
Para quienes no conozcan el tema, vamos a aclarar primero algunos conceptos. Si conoces la naturaleza del sonido, puedes pasar por alto los próximos párrafos azules.

El sonido, en física, es cualquier fenómeno que involucre la propagación en forma de ondas elásticas (sean audibles o no) que esté generando el movimiento vibratorio de un cuerpo, generalmente a través de un fluido (u otro medio elástico).

El sonido humanamente audible está formado por ondas consistentes en oscilaciones de la presión del aire, que son convertidas en ondas mecánicas en el oído humano y percibidas por el cerebro.

Hemos dicho que el movimiento vibratorio de un cuerpo es lo que produce el sonido. Así pues, el sonido puede definirse como una vibración que se propaga por contacto a través del aire. Una vibración, vista de forma simple, es un movimiento de ida y vuelta alrededor de un punto de referencia. Aunque generalmente las ondas sonoras se representan gráficamente como una línea con subidas y bajadas (la imagen del osciloscopio), el sonido se propaga en realidad en tres dimensiones (imagínate una esfera que nace de la fuente del sonido y que va aumentando de tamaño; la superficie de esa esfera es la que representa el camino que siguen las perturbaciones de presión).

Independientemente de la velocidad de propagación del sonido, que es siempre de 340 metros por segundo en el aire, las oscilaciones de la presión del aire pueden producirse más lentamente o más rápidamente, de tal modo que, al llegar a nuestro cerebro, éste lo interpretará como un sonido más grave (de baja frecuencia) o más agudo (de alta frecuencia). Un sonido grave puede ser, por ejemplo, el que produce un bajo (instrumento musical) o el motor de un automóvil, y un sonido agudo puede ser el del platillo de una batería, o, incluso más agudo, el sonido que produce un televisor de los antiguos (16 000 Hz) o los conocidos acúfenos (“pitidos en el oído”). Un sonido de 30 Hz es el producido por una vibración que realiza 30 “idas y vueltas” cada segundo, y otro de 13 547 Hz corresponderá a una vibración que realiza dicho recorrido de ida y vuelta nada menos que 13 547 veces en un segundo. Visto de otra forma, en un sonido de 20 Hz cada oscilación de la onda mide 17 metros, y, en uno de 20 kHz, 1.7 centímetros.


Representación gráfica de una onda sonora en un osciloscopio.


Propagación del sonido en 3 dimensiones.


Una vez aclarados estos conceptos para quienes lo necesiten, y antes de entrar de lleno en materia con el tema de este post, vamos a hablar un poco sobre la respuesta de frecuencia de un equipo musical.

En un equipo de audio, la respuesta de frecuencia es muy importante, ya que constituye un margen de confianza respecto a las frecuencias que dicho equipo va a reproducir correctamente. Por ejemplo, un equipo que dé una respuesta de 35 a 17 000 Hz nos garantiza que las frecuencias intermedias de ese rango (digamos, por ejemplo, de 40 a 16 000 Hz) se reproducirán a un volumen adecuado y sin artefactos. Un equipo que tenga una respuesta de frecuencia de 10 a 32 000 Hz garantiza que el rango de frecuencias audible (el famoso 20 - 20 000 Hz) se reproducirá con bastante probabilidad de forma correcta. Esa es la razón por la que existe equipo de audio con una respuesta superior a la audible (no voy a entrar a hablar por el momento sobre el efecto de los ultrasonidos sobre la fisiología humana; eso será el tema de otro post).



Curva de respuesta de frecuencia de unos (muy buenos) altavoces. Observa cómo la curva decae un poco en las frecuencias bajas y otro tanto en las frecuencias altas. Cuanto más plana sea la curva, mayor fidelidad tendrán los altavoces respecto a las frecuencias, y ello se conseguirá con materiales de alta calidad.


Como hemos dicho, la calidad de los materiales influye en el resultado final, de tal modo que, por ejemplo, unos auriculares realizados con materiales de baja calidad y con una respuesta de frecuencia de 15 - 35 000 Hz (hay muchos así en el mercado, y a precios bastante económicos) probablemente den peor resultado que otros fabricados con materiales de muy buena calidad y con una respuesta de “tan sólo” 20 - 20 000 Hz. Un neófito podría decir, ¿por qué son tan caros con una respuesta de 20 - 20.000 Hz y los otros tan baratos con una respuesta de 15 - 35 000 Hz, mucho mayor? La respuesta es sencilla: los auriculares baratos darán, efectivamente, los 15 Hz, pero a un volumen mucho más bajo del correcto, y además con distorsiones. Y no sólo fallarán al dar los 15 Hz, sino también, digamos, desde los 15 hasta los 40 Hz. Y el mismo problema sucederá con las frecuencias altas. En cambio, los auriculares “caros” darán los 20 Hz al volumen adecuado y sin distorsiones, y los 20000 Hz también. Su gráfica de respuesta es plana (es decir, con el volumen adecuado) durante todo el rango de frecuencias que produce.

Ten en cuenta todo lo anterior antes de realizar una prueba de audición, y no te deprimas cuando oigas a la gente decir que “han comprobado en su PC que pueden oír incluso más allá de los 20 000 Hz”. Si los altavoces, los auriculares, o la propia tarjeta de sonido no son lo suficientemente buenos, es probable que esos 20 000 Hz que parecen oírse sean realmente artefactos producidos por la mala calidad de los materiales, a una frecuencia menor (15 000 - 18 000 Hz). Un tono de prueba de 20 000 Hz reproducido correctamente en un equipo de alta fidelidad será inaudible para la mayoría de las personas. Si tú eres una excepción, considérate afortunado/a.

Así pues, y entrando ya en el tema de este post, ¿es realmente tan importante que seamos capaces de oír de 20 a 20 000 Hz?

Normalmente oímos mejor las frecuencias bajas que las altas, de tal modo que, con la edad, perdemos poco a poco la capacidad de oír los sonidos agudos, pero no tanto la de oír los sonidos graves. Existen pocas personas adultas capaces de oír bien los 20 000 Hz, y lo normal a partir de los 25 años es ir perdiendo la capacidad de oír las frecuencias superiores a los 15 000 - 16 000 Hz.

Entonces, uno puede preguntarse, “¿y si mi margen superior de audición actual está en 16 000 Hz y el máximo fisiológico para un ser humano son 20 000, ¿no es mucha pérdida de audición 4 000 Hz?”

La respuesta es que no. Y esto es debido a que el oído humano (el cerebro humano, hablando más propiamente) no oye de forma lineal, sino exponencial, tanto en lo referente a la intensidad (volumen) como a la frecuencia.

Hablemos primero del volumen.

La unidad de volumen del sonido que utilizamos en la práctica es el decibelio (dB), y es una unidad exponencial, de tal forma que cada diez decibelios la intensidad del sonido no aumenta en 10 unidades, sino que se multiplica por 10. Así, 10 dB corresponden a una intensidad 10 veces superior a 0 dB, 20 dB corresponden a una intensidad 100 veces superior a 0 dB, 30 dB corresponden a una intensidad 1000 veces superior a 0 dB, y así sucesivamente. Una respiración tranquila genera un sonido de 10 dB, mientras que una conversación normal lo genera de 40 dB. La diferencia entre ambos sonidos es de 30 dB, con lo que podemos concluir que el sonido de una conversación tiene una intensidad 1000 veces superior al de la respiración. Una aspiradora (70 dB) produce un sonido de intensidad 1000 veces superior al de una conversación, y un millón (sí, un millón) de veces superior al de la respiración. Un concierto de rock (120 dB) puede llegar a producir un volumen 100 000 veces superior al de una aspiradora, 100 millones de veces superior al de una conversación, y 100 mil millones de veces superior al de la respiración.

Nunca lo hubieses imaginado, ¿verdad?



Pues con la frecuencia sucede algo muy parecido.

En música, una octava son 8 notas consecutivas (empezando por el do, serían: do-re-mi-fa-sol-la-si-do).




Sabemos que, exactamente cada octava musical que subimos, se dobla la frecuencia. Así, el do0 (do-cero; el do de una octava por debajo de la más baja del piano) tiene 16.35 Hz, y el do1, 32.70 Hz (justo el doble).

La frecuencia del d02 (65.4 Hz) es el doble de la del do1, y el cuádruple de la del do0. La del do3 (130.8 Hz) es el doble de la del do2, el cuádruple de la del do1, y el óctuple de la del do0. Y, así, sucesivamente.



Si nuestra percepción de la frecuencia fuese lineal, el aumento en frecuencia de una nota con respecto a la anterior sería siempre el mismo, pero vemos que lo que realmente sucede es que la diferencia de frecuencia de una nota con respecto a la anterior crece a medida que avanzamos en la escala musical. De esto se desprende que, cuanto más aguda sea la nota, con menor precisión oiremos el sonido, pues, aunque la diferencia de frecuencia entre nota y nota será cada vez mayor, nosotros percibiremos siempre la misma diferencia musical (1 tono).

Vayámonos ahora a las frecuencias más agudas. Si pudiésemos ampliar las teclas del piano indefinidamente, tendríamos lo siguiente:

do9..............................8 372.02 Hz

...

do10...........................16 744.04 Hz

re10...........................18 735.40 Hz

mi10...........................21 039.62 Hz

...

do11...........................33 488.08 Hz


Ahora vemos más claramente que, a partir de los 16 000 Hz, nuestra percepción sonora es muy tosca. De hecho, una persona que deje de oír a partir de los 16 744 Hz se está perdiendo menos de dos notas (dos tonos) respecto al máximo teórico de 20 000 Hz. O, dicho de otro modo, un sonido de 20 000 Hz que no podamos oír podemos imaginárnoslo como el sonido más agudo que podamos percibir aumentado en sólo 2 o tres tonos.

Espero que te haya resultado interesante esta reflexión.

La alta fidelidad en el siglo XXI... ¿es posible?


Si eres una persona joven y te sueles dejar llevar por la corriente, quizás este post te abra un poco los ojos al mundo real de la industria musical.
5b415a0a74765006f122f979f487f751
Si eres joven, probablemente te hayas perdido lo que suelo llamar la época dorada de la música. Me refiero al período que fue desde los años 1970 hasta los 1990. Este período se caracterizó por diversos factores que lo hicieron único:

Se instauraron normas de Alta Fidelidad que garantizaban que sólo los equipos que superasen determinados requisitos pudiesen obtener ese calificativo/certificado.


Los artistas creaban discos especialmente centrados en la calidad del sonido, y dedicaban grandes esfuerzos para ello. Esto era posible debido a que la música generaba inmensos beneficios a las compañías discográficas, y el gasto dedicado a mejorar la calidad del producto final era insignificante en comparación. Este culto al sonido en sí mismo hizo que surgiese un buen número de artistas (Kraftwerk, Depeche Mode, Jean-Michel Jarre, Yazoo...) que basaban gran parte de su éxito en la utilización de sonidos electrónicos de gran calidad, que ponían a prueba las características de los mejores equipos de audio de la época. Otros artistas, como George Michael con su Faith, Dire Straits con su Brothers in Arms, o la mismísima Madonna, crearon discos inolvidables tanto por su calidad musical como por su calidad de audio.

La gente se preocupaba mucho por la calidad del sonido. Había un gran porcentaje de audiófilos o aspirantes a serlo, cuyo sueño era llegar a tener algún día un equipo musical carísimo y que sonase lo más parecido al propio estudio de grabación. Era raro ver el hogar que no tuviese una cadena de alta fidelidad en el salón o en la sala de estar.


Por desgracia para algunos (entre los que me incluyo), gran parte de todo eso se ha perdido. Ahora encontramos cosas como las siguientes:

Cualquier fabricante puede decir que su producto es de “Alta Fidelidad” sin necesidad de cumplir ninguna norma.

Las preferencias de la gente han cambiado, y ahora se prioriza por regla general el tamaño y lo económico frente a la calidad: un reproductor portátil que pueda llevarse en el bolsillo, preferiblemente integrado en el móvil/celular, un *.mp3 que ocupa 10 veces menos que la canción original, y, por supuesto, que escuchar música resulte los más barato posible.

Las propias empresas tienen gran parte de la culpa, pues han inundado el mercado con soportes de audio con pérdida (los famosos mp3, para que se entienda) y han difundido la falsa idea de que un *.mp3 suena igual que un CD, con el objetivo de justificar la valía de sus propios reproductores. Y, efectivamente, los CD escuchados a través de un PC normal no tienen la calidad suficiente como para hacer distinguible la diferencia entre un *.mp3 y el CD original, aunque, claro está, los mp3 se venden como rosquillas puesto que la red está plagada de archivos *.mp3 que pueden conseguirse gratuitamente de forma pirata. Consecuentemente, hoy en día muy poca gente se compra reproductores de CD convencionales, exclusivamente dedicados a tocar música. Y lo peor de todo es que se está llegando al punto de que las propias discográficas publican ya directamente en formatos comprimidos con pérdida; hasta los Beatles han sucumbido a esta vorágine y desde hace unos pocos días ya está disponible su discografía en iTunes. Mientras tanto, los más jóvenes, como no han conocido otra cosa en su vida, no saben lo que se están perdiendo.

Los artistas ya no siempre son los que deciden la calidad final de su producto; en muchas ocasiones los responsables directos son los técnicos de audio. En una industria discográfica cada vez más precaria, no hay lugar para el sibaritismo de los artistas, y lo que manda es el mercado. Como consecuencia, las casas discográficas suben cada vez más el volumen de las pistas de sonido (probablemente para que se escuchen “mejor” por la radio, en el automóvil y en la Ipod). Este fenómeno, bien conocido, recibe el nombre de “Loudness War” (“guerra del volumen”), y no es otra cosa que subir el volumen del máster lo máximo posible, incluso hasta el punto de que la onda de sonido quede cortada por arriba y por abajo, perdiéndose la dinámica. Para que se entienda, el resultado es que los golpes de batería y la voz del cantante suenan prácticamente al mismo volumen, de forma que el sonido se vuelve monótono y sin expresividad (aunque, eso sí, a un volumen ensordecerdor). Muchas “versiones remasterizadas” acusan este problema (ojo la próxima vez que encuentres un remáster). No obstante, en un mundo inundado de *.mp3, ¿a quién le importa...?

En este vídeo de Youtube (en inglés) se explica de forma didáctica en qué consiste la Loudness War.



La Loudness War existe desde hace mucho tiempo, pero se ha acentuado dramáticamente en la última década. Aquí puedes ver la evolución de Something, canción de los Beatles, a través de diferentes ediciones (fuente: Wikimedia Commons).



Paradójicamente, vivimos en una época de gran desarrollo tecnológico. La tecnología de audio nunca fue mejor, y los equipos actuales deverdadera alta fidelidad ridiculizarían a los de hace 30 años. Por desgracia para muchos de nosotros, son demasiado caros...

...¿o no...?

Si lo prioritario para ti es la calidad y no eres millonario, entonces tengo buenas noticias. La alta fidelidad está a nuestro alcance aunque no dispongamos de mucho dinero y haciendo uso del propio ordenador/computadora. Eso se debe fundamentalmente a lo siguiente:

Los ordenadores/computadoras han evolucionado hasta un nivel impensable hace 20 años. Desde que el estándar de audio es digital, las mejoras de calidad han pasado a centrarse en la conversión digital/analógica, ya que la calidad de la fuente digital es virtualmente perfecta dentro de sus posibilidades (tasa de muestreo de 44.100 Hz y 16 bits para los CD, o de hasta 192.000 Hz y 24 bits para las grabaciones en formatos especiales). En lo que al manejo de los datos de la fuente se refiere (antes de realizar la conversión), un procesador de los actuales, como un Quad a 3 GHz, es miles de veces más rápido (y, en consecuencia, más eficiente) que los mejores reproductores de CD de la época, y, por si fuera poco, su software puede ser constantemente mejorado por una comunidad de internet cada vez mayor.

Existen formatos digitales sin pérdida (*.flac, *.ape, *.wav...), que, si bien ocupan mucho más espacio en el disco duro, presentan una calidad incuestionablemente mejor que los *.mp3, los cuales acusan una pérdida de dinámica, de armónicos y de sentido espacial. Por otra parte, los discos duros tienen una capacidad cientos de miles de veces superior a los de 1990, y a un precio relativamente económico, con lo cual ya no es un inconveniente el gran tamaño de los archivos musicales sin pérdida. Y cada vez lo será menos. De hecho, puedes hacer una búsqueda en Google con la palabra “flac”, “ape”, o “lossless” y te sorprenderá ver la cantidad de gente que ya se está subiendo al tren del audio de alta fidelidad.

Para una experiencia de alta fidelidad no hace falta mucho aparataje. Evidentemente la tarjeta de sonido que trae el PC de fábrica no sirve para apreciar la mejora de calidad del audio digital original con respecto al de los *.mp3, y los auriculares/audífonos que se introducen en el oído o los altavoces Creative del PC tampoco van a ayudar mucho. Pero basta con 3 cosas:

1) Un PC más o menos potente (1 GHz o más), con los programas adecuados (Foobar2000 o AIMP2, ambos gratuitos, para reproducir los archivos de audio sin pérdida). Yo tengo un AMD Phenom II X4 965 (4 núcleos) a 3.41 GHz, y tengo 8 GB de RAM, con lo cual jamás voy a tener problemas de audio derivados del propio PC.

2) Una tarjeta de audio de buena calidad. La más económica y adecuada para la alta fidelidad es la M-Audio Transit USB, que se conecta al PC por el puerto USB y tiene frecuencia de muestreo de 96 kHz a 24 bits, aparte de que está reconocida como un dispositivo de enorme calidad. La puedes encontrar por menos de 80 dólares.



3) Unos auriculares realmente buenos. Esta es la parte más cara del conjunto (y el componente crítico), pero que garantiza unos resultados equiparables a los de unos altavoces de miles de dólares (con la ventaja de que no molestas al vecino). Yo uso los Sennheiser HD-650, reconocidos por la crítica como uno de los mejores productos del mercado. Su precio está algo por encima de los 300 dólares.



...Y eso es todo. ¿Amplificador? No lo uso; conecto los auriculares directamente a la tarjeta de sonido, con lo cual, aunque no puedo reventarme los tímpanos subiendo el volumen :P, me evito distorsiones adicionales y obtengo un sonido más puro y cristalino.

Debo decir que tengo, adicionalmente, un equipo formado por un reproductor de CD Rotel de alta gama, un amplificador Audiolab y las míticas columnas Yamaha NS-1000 (con cables especiales), y, para mi entrenado oído, el “improvisado” equipo del PC suena probablemente a la misma altura en cuanto a textura, separación, espacialidad y riqueza armónica. No todo el mundo tiene el mismo oído, podrá decirme alguno, pero el oído también se entrena. Si lo alimentas con sonido de baja calidad durante toda tu vida, jamás llegarás a aprender la diferencia que supone la verdadera alta fidelidad y las emociones que despierta.



Aviso para los más puristas: soy consciente de que esto no es alta fidelidad de máximo rendimiento, pero en este post tampoco propongo sustituir un equipo de MBL (http://www.mbl.de/en/) por una pequeña tarjeta de PC y unos auriculares. Mi única intención es motivar a toda esa gente joven que vive cautivada bajo el principio del mínimo gasto y el máximo beneficio y que jamás se han acercado siquiera a lo que significa la verdadera alta fidelidad, lo cual me parece una verdadera pena.

Ah, y una cosa más. Si por casualidad tienes una Ipod, existe un proyecto de varios años de existencia llamado Rockbox que ha desarrollado en código abierto (o sea, de forma gratuita) una firmware que hace posible que puedas escuchar flac en la Ipod, aparte de que mejora notablemente sus prestaciones aprovechando al máximo la calidad de sus componentes. No suena como la M-Audio Transit, pero, comparada con la Ipod convencional o con la tarjeta del PC, es una pasada total (siempre que tus altavoces/auriculares sean los adecuados).



Espero que este post te haya resultado interesante, y agradezco tus comentarios.

Calidad del audio en diferentes formatos (flac vs. mp3)

En este post voy a hablar acerca de lo que diferencia a la música en mp3 y en flac. En primer lugar, y antes de empezar, vaya por delante lo siguiente:
5b415a0a74765006f122f979f487f751
La calidad de una audición musical depende (y mucho) de la tarjeta de audio y el equipo musical (amplificador, auriculares/altavoces) utilizados, y por otra parte también depende de la sensibilidad del oído de uno. Un recién nacido con un oído perfecto puede oír de 20 Hz a 20 000 Hz. Lo normal para una persona joven es no oír nada por encima de los 18 kHz, aunque algunas personas con un oído excepcional pueden oír los 20 kHz o incluso algo más, y una persona de 25 años o más empieza a perder audición a partir de los 15 000 - 16 000 Hz. Además de la respuesta de frecuencia (aspecto cuantitativo), es igual o más importante el aspecto cualitativo: que las ondas a cada frecuencia se produzcan de la forma más parecida a la fuente original.

Dicho esto, entramos de lleno en el tema en cuestión.

Mucha gente piensa que un mp3 suena con la calidad de un CD. Esto no es exacto. Aparte de que un CD suena con la calidad que le hayan dado quienes lo hayan grabado, los mp3 son formatos con pérdida, y eso quiere decir que una buena parte de la información original se descarta para ahorrar espacio. El truco está en que la información que se descarta es, por regla general, información que está “oculta” entre el resto de la información. Por poner un ejemplo sencillo para que se entienda la idea, si una persona me está hablando a un volumen normal y de repente pasa un helicóptero por delante nuestro, el sonido del helicóptero eclipsará a mis oídos la voz de esa persona; la onda de su voz seguirá llegando a mis oídos pero no percibiré el sonido. Otro ejemplo, para que se me entienda también: si pudiésemos tocar dos pianos muy parecidos exactamente al mismo tiempo de tal forma que sus vibraciones coincidiesen, el mp3 “diría” que “uno de los pianos sobra”. Este tipo de operaciones (pero, por supuesto, a un nivel mucho más sutil, de cambios microscópicos) es el que se hace para que los 40 o 50 MB iniciales que ocupa una canción en el CD queden reducidos, como mucho, a 9 MB o menos, dependiendo del bitrate (128, 160, 192, 256, 320 kbps) del mp3.

Pero toda esa información que el mp3 elimina de un plumazo es información que, desde la fuente original, nos llegaría, y es información que nos afectaría emocionalmente (un violín en mp3 difícilmente puede ponernos la piel de gallina), aunque conscientemente la mayor parte del tiempo no sepamos expresar la diferencia con palabras. Sucede lo mismo, por ejemplo, cuando se recrea en realidad virtual a una persona: tarde o temprano sabremos que esa persona no es real, porque la tecnología de realidad virtual aún no logra recrear los detalles microscópicos que somos capaces de captar y que nos hacen identificar a una persona como real y no virtual.

Otras diferencias entre un mp3 y un wav (archivo de onda sin comprimir de Microsoft) o un flac (Free Lossless Audio Codec, códec libre de audio sin pérdida) se notan al cabo de estar un buen rato escuchando música. El mp3 termina por darte dolor de cabeza, mientras que el sonido original no. Y a esto hay que sumar que hay determinadas canciones que tienen la información musical dispuesta de tal forma que el algoritmo del mp3 no es capaz de “adivinar” qué es lo que no vas a poder escuchar, y el resultado es que hay una pérdida notable de calidad, sobre todo en los agudos. De hecho, un mp3 a 128 kbps corta todas las frecuencias a partir de aproximadamente los 15 kHz, y esto es algo que la mayoría de la gente con una audición normal puede percibir fácilmente.

Para que puedas escuchar las diferencias REALES que existen entre los diferentes formatos de audio, he preparado varias pistas en las que he hecho lo siguiente:

1) He cargado la canción desde el disco original.

2) La he grabado a diferentes formatos: flac, mp3 a 128, mp3 a 160, mp3 a 192, mp3 a 256 y mp3 a 320 kbps.

3) He cargado luego todas las ondas en el programa Sound Forge Pro 10.0.

4) He sincronizado todas las ondas bit a bit. Esto es necesario porque el mp3 introduce un cierto desfase de milisegundos con respecto al original.

5) He copiado cada onda de mp3 (calidad con pérdida) y la he mezclado sobre la onda en flac (calidad original, sin pérdida) con la polaridad invertida. Si ambas ondas fuesen idénticas, el resultado sería silencio. Pero en cambio, como el mp3 tiene menos información (la onda tiene menos puntos de resolución, para que se entienda) queda un ruido residual que corresponde, ni más ni menos, a lo que el mp3 tiene de menos con respecto al flac sumado a lo que el mp3 tiene de más respecto al flac (el mp3 no solamente pierde información; también introduce ruido que no estaba en la grabación original).

6) Lo he grabado todo en flac. Contrariamente a lo que bastante gente piensa, el hecho de pasar un mp3 a un formato de mayor calidad no le añade calidad, pues la información adicional "no puede inventársela" el mp3, y sigue estando ausente. Un mp3 pasado a CD sigue sonando como un mp3.

Bájate uno de los archivos desde los enlaces que hay más abajo; lo descomprimes y lo escuchas por ti mismo.

Nota importante: Para poder escuchar los archivos tu reproductor tiene que poder tocar flac. En primer lugar, asocia los archivos con extensión .flac a tu reproductor para que éste los abra al pincharlos. Si aún así siguen sin sonar, entonces instálate el códec o plugin necesario.

Como reproductor te recomiendo el AIMP2 o el Foobar2000; ambos son gratuitos y dan una calidad de audio excepcional (reproducen el sonido tal como está grabado, sin aditamentos de ningún tipo). Para mi gusto, el mejor de los dos es el Foobar2000, pues además es más estable y liviano. El Winamp y el Windows Media Player colorean el sonido (o dicho en otras palabras, lo ecualizan), lo cual puede ser interesante si se tiene un equipo de audio de baja calidad y se reproducen mp3 a bajo bitrate (128 kbps), pero, si el equipo es de alta fidelidad y la música está codificada en un formato sin pérdida o se reproduce directamente desde el CD original, entonces la diferencia entre el Winamp o el WMP y el AIMP2 o el Foobar2000 se nota bastante.

Tests de comparación flac-mp3 (71,97 MB):
https://mega.co.nz/#fm/gVNSnCpa

En este excelente post (me sirvió de inspiración) se explica todo este asunto de una forma más técnica y precisa:

http://www.taringa.net/posts/info/2081940/Flac-vs-Mp3_-_Hay-diferencia_.html

Y, para los que piensen que lo que teóricamente no oímos no nos afecta, ver también este interesantísimo ensayo por el ingeniero de sonido argentino Andrés Mayo: ¿Hay vida después de los 20 kHz?

http://www.andresmayo.com/images/Hay%20vida%20despues%20de%20los%2020%20KHz.pdf

Buen disfrute musical.

Los flac: sus ventajas e inconvenientes


5b415a0a74765006f122f979f487f751
En este post voy a presentar las ventajas e inconvenientes del formato flac, reflexionando un poco sobre cada uno de ellos para analizar su importancia relativa.

En primer lugar, y para situarnos un poco, hablaremos de qué es eso de los flac. Flac es uno de los varios formatos de audio sin pérdida disponibles en internet. A diferencia de los populares mp3, la tecnología flac codifica el sonido exactamente igual a como estaba en el CD original, ya que comprime la información de forma análoga a como lo hacen los zip o los rar (es evidente que, si un rar o un zip perdiesen información en el proceso de compresión, ninguna aplicación funcionaría correctamente después de haber sido comprimida). Efectivamente, esto puede comprobarse comparando visualmente en un editor las ondas correspondientes a los archivos wav, flac y mp3 derivados de un mismo disco original. Examinando las ondas con el zoom al máximo, veremos que no existe absolutamente ninguna diferencia entre el flac y el wav, así como que el mp3, en cambio, acusa pequeñas diferencias en la mayoría de los puntos de información, que en definitiva se traducen en ruido adicional, distorsión y, si el mp3 es de baja calidad, ausencia de frecuencias altas.



Ventajas de los flac:

1) Ofrecen una mayor calidad en un equipo de alta fidelidad. Esto constituye la mayor ventaja de los flac y, en definitiva, su propia razón de existencia. Y debo matizar este argumento. Indiscutiblemente, un flac suena mejor en un equipo de alta fidelidad que un mp3 (aunque sea a 320 kbps), ya que su bitrate es normalmente entre 900 y 1100 kbps y no elimina información desde el CD original. Pero, si lo que planeas es pasar tu música a CD y escucharla a través de un reproductor de CD portátil “medio decente” o una minicadena más o menos buena, entonces también es recomendable que la fuente sea flac, pues, en caso contrario, se notará la diferencia, sobre todo tras un rato de escuchar música. No esperes grandes diferencias; son diferencias sutiles, pero te harán decir “este álbum no tiene un sonido atractivo”, o “ya no me emociona como antes; he debido escuchar este álbum demasiadas veces”. Si desconoces el hecho de que la calidad de un mp3 es inferior, lo achacarás, probablemente, a la calidad de grabación en el estudio o a tu propio estado de ánimo. Pero debo decirte que no es así; en el estudio sonaba mejor, con un sonido más cálido, con más cuerpo, más limpio. Esto es algo que detectarás inmediatamente en dos situaciones determinadas: cuando lleves mucho tiempo (meses, por ejemplo) escuchando únicamente mp3 a diario, y cuando lleves mucho tiempo escuchando CD. En ambos casos tu oído estará “acostumbrado” a la buena o la mala calidad y la diferencia te resultará razonablemente evidente. Sucede lo mismo, de forma más clara, cuando cambiamos de televisor; por muy sutiles que sean las diferencias, las notaremos. Esto se debe a que nos guiamos más por el sentido de la vista y lo tenemos más “entrenado”. Un ciego, en cambio, notará la diferencia entre un mp3 y un flac con la misma facilidad con que nosotros la notamos entre diferentes televisores. Todo es cuestión de entrenamiento.

2) La información es continua entre pistas separadas. Este aspecto tiene poca importancia si escuchas un álbum de estudio normal, pero se vuelve crítico cuando se trata de un álbum en directo o de pistas sin pausas. El mp3 introduce una inevitable pausa entre pista y pista; una pausa de apenas unas décimas de segundo, pero suficiente para arruinar la audición. Imagínate que estás escuchando Eye in the Sky, de Alan Parsons. El primer tema (Sirius) y el segundo (Eye in the Sky), están unidos, de tal modo que parecen una sola canción. Pues bien, en ese caso, el mp3 hace que notes un corte entre ambas. Aunque grabes las pistas a CD, el corte seguirá estando ahí, pues es inherente a la propia naturaleza del mp3. Comprobarás, incluso, que parte de la información intermedia entre pista y pista se ha perdido. Es una cantidad casi insignificante, pero suficiente para hacer imposible la labor de “pegar” manualmente las pistas de audio en un editor de sonido sin que luego se note al escucharlo. En cambio, el flac dejará la información tal como venía en el CD original, es decir, sin pausas extra y sin pérdida de información intermedia.

3) Son una fuente inalterada de información musical. Si planeas modificar un tema para crear un remix, para cambiarle la ecualización o para añadirle cualquier otro tipo de efecto con un programa de edición de audio como puede ser el Sound Forge, necesitas una fuente de la mayor calidad posible, pues cada operación que realices producirá un pequeño descenso de dicha calidad. Y, en segundo lugar, y no por ello menos importante, cada alteración que realices de un mp3 pondrá en evidencia sus carencias y defectos, que dejarán de estar “ocultos” entre el resto de la información codificada. Una analogía que comprenderás fácilmente es la siguiente: imagina que tienes dos imágenes, una con 16 millones de colores y otra con sólo 256, pero con un antialias que disimula muy bien la carencia de colores. Si cargas ambas imágenes en Photoshop y empiezas a jugar con los controles de brillo, color y contraste, notarás inmediatamente la falta de colores de la segunda imagen. Volviendo al tema del audio, si la fuente es un flac, tendrás la calidad original de partida, con lo cual te aseguras que las posteriores modificaciones que realices dejarán el sonido con la mayor calidad posible dentro de tus posibilidades. Por otra parte, y si la ocasión lo requiere, en cualquier momento puedes hacer copias del flac convertidas a formato mp3, con la diferencia de que siempre tendrás la fuente original disponible. Y además, simplemente quemando los flac en un CD virgen, puedes “reconstruir” el CD original en cualquier momento. Esto no es posible desde un mp3. En el momento en que pasas un formato sin pérdida a otro con pérdida, en nuestro caso, el mp3, pierdes parte de la información de forma irreversible. Aunque vuelvas a pasar los mp3 a flac o a CD, la información seguirá perdida. Efectivamente, al pasar un mp3 a flac, el tamaño del archivo aumenta, pero esto no se debe a que haya aumentado su calidad, sino a que, simplemente, se le han añadido los propios datos del mp3 pero de forma repetida. Es como si haces una foto a 320 x 225 píxeles y la conviertes a 1600 x 1200: no aumentará su calidad; simplemente se verá más grande, pero el pixelado seguirá ahí.

4) Admite frecuencias de muestreo sin límites. Un mp3 está limitado a 44 100 Hz y 16 bits, pero un flac puede reproducir a 24 bits y a frecuencias superiores, como 48 000 Hz, 88 200 Hz, 96 000 Hz, o 192 000 Hz. Esto es muy útil si eres profesional y estas manejando pistas separadas de una misma canción, pues te garantizará que, tras las manipulaciones pertinentes, el resultado seguirá manteniendo, como mínimo, la calidad de CD. También es útil para los audiófilos empedernidos, que gustan de escuchar discos digitales grabados a frecuencias superiores.

5) Es un formato de código abierto. El propio nombre del flac (Free Lossless Audio Codec, es decir, “códec libre de audio sin pérdida”) lo dice. El código de programación de los codificadores de mp3 no puede ser modificado por cualquiera, pues tiene copyright. En cambio, los flac están registrados bajo una licencia de código abierto, lo cual permite que cualquier persona pueda aportar su granito de arena a la hora de mejorarlo. Además, y por razones obvias, es el formato sin pérdida preferido entre los internautas.


Esto han sido las ventajas. Ahora vamos con los inconvenientes.


Inconvenientes de los flac:

1) Ocupan más espacio en el disco duro. Un flac ocupa entre dos tercios y la mitad del tamaño de la pista original en CD. Es decir, tienen un tamaño promedio de entre 25 y 35 MB, y un álbum puede pesar típicamente algo más de 300 MB. Esto parecería una barbaridad hace 10 años, pero actualmente es una posibilidad más que asequible. En un disco duro de 2 TB, que puedes conseguir por unos 200 dólares con impuestos y gastos de envío incluidos, caben la friolera de... 7000 álbumes en formato flac. Podrás grabar con la mayor calidad posible toda la música que se te antoje, y seguirás teniendo espacio libre por mucho que te empeñes en llenar el disco duro. Literalmente, será como si introdujeses directamente toda tu colección de CD en el ordenador/computadora, con los consiguientes ahorro de espacio físico y aumento de la comodidad y posibilidad de manipulación que ello supone.

2) La mayoría de los dispositivos externos de mp3 no soportan todavía flac de forma nativa. Es un hecho que últimamente está cambiando poco a poco, pero el cambio aún es demasiado tímido. La Ipod, tal como viene de fábrica, no permite la reproducción de flac. Esto se puede solucionar con el proyecto RockBox (búscalo en Google), que te brinda la posibilidad de cambiar la firmware de tu Ipod (o de otros dispositivos) de forma gratuita para añadirle más características, incluyendo la reproducción de flac. Yo lo he comprobado con una Ipod clásica y te puedo asegurar que funciona al 100% sin problemas. ¡Puedes escuchar tu álbum en directo con calidad de CD y sin pausas en tu Ipod! Si lo que usas es otro dispostivo no cubierto por el proyecto RockBox, siempre te queda la posibilidad de pasar los flac a wav (ocuparán entre un tercio y el doble más de espacio), que sí reproducen la mayoría de los dispositivos. Y, si el tamaño es algo crítico para ti, como último recurso puedes pasar el flac a mp3, con las ventajas de que el mp3 será de la mayor calidad posible (convertido directamente del original) y que siempre dispondrás de una copia de seguridad con la calidad original.


Bueno, estas son las ventajas e inconvenientes. Juzga por ti mismo.



Mi conclusión:

Los mp3 han sido un formato necesario en el proceso de evolución de la tecnología. En el momento de su creación, eran imposibles formatos de mayor calidad debido a la falta de capacidad y de velocidad de proceso de los ordenadores/computadoras domésticos. La propia industria del marketing hizo el resto, haciendo creer a las masas que la calidad de un mp3 es inmejorable e inundando el mundo con dispositivos mp3, los cuales han reportado a las empresas beneficios multimillonarios. Sin embargo, la tecnología avanza inexorablemente, cada vez más rápido, y, aunque siempre guardaremos en nuestro corazón a los mp3, estos quedarán, simplemente, como sucede con todo, como un simple estandarte de una época que recordaremos con nostalgia. Actualmente existe un conflicto de intereses por parte de los fabricantes de reproductores mp3, que están volcados exclusivamente hacia esta tecnología, pero los formatos sin pérdida, y, en concreto, el flac, vienen pisando pero que muy fuerte. Tanto, que estoy seguro de que no falta mucho para que la evidencia tenga que ser reconocida a nivel mundial y podamos entonar esa famosa frase de “el rey ha muerto; viva el rey”.

Y, por supuesto, llegará el día en que los propios flac se vuelvan obsoletos; me imagino una época futura en la que guardaremos la música en un dispositivo del tamaño de una moneda, en formato sin comprimir, a 192 000 Hz y 32 bits, 30 canales de audio y en modo multipista. Pero, no adelantemos acontencimientos; disfrutemos del momento presente y de lo que éste nos brinda, pues sólo se vive una vez.