Frecuencia de Muestreo y Profundidad de Bits: Explicación sencilla

Actualmente, todos los sistemas de grabación tienen un ordenador como base. Es por esto que es importante entender conceptos tan fundamentales como la frecuencia de muestreo (sample rate) y la profundidad de bits (Bit depth).

La conversión de audio digital es un tema amplio y complejo, con un montón de matemáticas y teoría computacional por en medio. Pero no te preocupes, todo lo que necesitas saber sobre frecuencia de muestreo y profundidad de bits se puede resumir en un párrafo:

La frecuencia de muestreo es la frecuencia con la que se toman muestras de una señal analógica para convertirla en digital y se mide en Herzios (Hz), mientras que la profundidad de Bits es el número de Bits que almacena cada muestra.

¡Uf! Comprimido de esta forma puede que se te atragante. Vamos a masticarlo un poco más:

¿Qué es la Frecuencia de muestreo?

Para comprender bien este concepto es importante entender primero qué es el audio digital.

De la misma manera que nuestros oídos traducen las ondas sonoras en información que nuestro cerebro sea capaz de interpretar, los micrófonos transforman las ondas sonoras en energía eléctrica, pero los ordenadores no entienden de energías eléctricas, entienden de unos y ceros (bits).

Por lo tanto, es necesario convertir la señal eléctrica (analógica) en una señal digital (bits). Los encargados de esta tarea son los conversores analog-to-digital, que se encuentran en las tarjetas de sonido del ordenador o en interfaces de audio externas.

Su trabajo consiste en recoger pequeñas muestras de la onda analógica y almacenar el valor de la amplitud en un instante de tiempo concreto. Esta información es guardada como datos binarios (unos y ceros), de manera que el ordenador la pueda interpretar.

Entonces, como te podrás imaginar ya, la frecuencia de muestreo es la cantidad de muestras que se toman por segundo y se mide en herzios (Hz).

En la gran mayoría de DAW’s podrás escoger entre varias frecuencias de muestreo preestablecidas. Normalmente, el ajuste por defecto será o bien 44.1 kHz o 48 kHz. Estas frecuencias no se han es cogido de manera aleatoria.

¿Por qué 44.1 Hz es la Frecuencia de Muestreo estándar?

Empezamos a meternos en terreno pantanoso. Para explicar esto vamos a utilizar como ejemplo una onda sinusoidal, que es una onda con una frecuencia constante.

Para conocer la frecuencia de esta onda necesitamos detectar y definir un ciclo completo. Todo ciclo tiene una parte negativa y otra positiva. Para conocer la frecuencia de la onda necesitamos detectar un valor positivo y otro negativo, por lo que necesitamos medir, como mínimo, dos veces por cada ciclo completo.

Esto implica que, por ejemplo, para captar toda (cuando digo toda, es toda, 100% de fidelidad) la información relevante de una onda sinusoidal de 1 khz necesitamos, como mínimo, una frecuencia de muestreo de 2 kHz.

Ahora bien, el oído humano es capaz de captar ondas sonoras de, como máximo, 20 Hz hasta 20 kHz. Cabe aclarar que según vamos envejeciendo nuestra capacidad auditiva empeora, sobre todo con las frecuencias altas, por lo que el rango es aún menor cuanto más mayores somos.

Entonces, dado que la frecuencia más alta que podemos escuchar son 20 kHz, necesitamos al menos una frecuencia de sampleo de 40 kHz. De ahí que la frecuencia de sampleo por excelencia sean los 44.1 kHz, pudiendo llegar a representar con total fidelidad frecuencias de hasta 22’05 kHz.

Teorema de Nyquist

Todo el razonamiento anterior se deriva del teorema de Nyquist. El cual dice que, para conseguir una representación exacta de una onda sonora, la frecuencia de muestreo debe ser, al menos, dos veces mayor que la frecuencia más alta presente en el audio que se va a digitalizar.

La frecuencia máxima que es capaz de captar una frecuencia de muestreo determinada, se llama la frecuencia de Nyquist. Las frecuencias superiores a este límite se “traducirán” de manera incorrecta como otra frecuencia inferior o igual a la frecuencia de Nyquist. Este proceso se llama aliasing.

Por lo tanto, con una frecuencia de 44.1 kHz, toda frecuencia superior a 22.05 kHz producirá este efecto indeseado. Para evitar esto, las tarjetas de sonido cuentan con un filtro anti-aliasign.

Su función es eliminar las frecuencias superiores a 20 kHz. Sin embargo, no es posible fabricar un filtro que elimine las frecuencias de manera abrupta, por lo que el filtro disminuye la amplitud de la onda de manera gradual a partir de los 20 kHz.

Pero dado que la frecuencia de Nyquist para 44.1 kHz es 22.05 kHz, el filtro antialiasing tiene un 10% de margen, el cual suele ser suficiente como para no reproducir ninguna frecuencia superior 22.05 kHz.

¿Qué frecuencia de muestreo debo usar?

En la mayoría de los casos 44.1 kHz es la mejor opción. Cierto es que utilizar frecuencias superiores puede tener ciertas ventajas si sabes cómo manejarlas correctamente. Sin embargo, la mayoría de profesionales trabajan en 44.1 kHz o 48 kHz.

Además, el estándar para CD’s o streaming son 44.1 kHz, por lo que, en caso de utilizar 48 kHz, a la hora de exportar el audio tendrás que reducirlo a 44.1 kHz. Pero no te preocupes, tu DAW probablemente lo tenga preestablecido de esta forma.

¿Mayor frecuencia de muestreo implica mayor calidad de sonido?

Este es un tema que genera mucho debate. Como hemos visto antes, una onda queda totalmente representada cuando se toman 2 muestras por cada ciclo. Por lo tanto, el rango de frecuencias audibles queda absolutamente representado con frecuencias de muestreo superiores a los 40 kHz.

La deducción lógica que podríamos sacar es que de nada sirve utilizar frecuencias de muestreo superiores. Sin embargo, no es del todo cierto.

A pesar de que no podamos escuchar frecuencias superiores a los 20 kHz (normalmente no más de 15 kHz o 18 kHz), las frecuencias más altas pueden tener efectos muy sutiles en el tono. Esas frecuencias son los armónicos de los tonos que sí podemos escuchar.

A pesar de todo, tan solo oídos extremadamente entrenados son capaces de captar estas sutilezas, así que no es algo que te deba preocupar en exceso.

Además, utilizar frecuencias de muestreo muy altas tiene sus desventajas:

  • Si utilizas 96 kHz en lugar de 48 kHz, es decir, el doble, el tamaño de tus archivos también será el doble.
  • Cuanto mayor sea la frecuencia de muestreo mayor poder de procesamiento necesitará la CPU.
  • Ciertos plugins no funcionan correctamente con frecuencias altas.

Por todas estas razones, una vez más, no te comas la cabeza y utiliza 44.1 kHz o 48 kHz.

¿Qué es la Profundidad de bits?

Hasta ahora hemos dejado claro que el conversor AD (analog-to-digital) de una tarjeta de sonido “toma muestras” de la señal analógica cada X tiempo (44.1 kHz = 44.100 muestras por segundo) y cada una de esas muestras almacena un valor concreto de amplitud.

La profundidad de bits determina el número de posibles valores de amplitud que cada muestra puede almacenar.

Los valores más comunes son 16-bit, 24-bit y 32-bit:

  • 16-bit = 216 = 65,536 posibles valores
  • 24-bit =224 = 16,777,216 posibles valores
  • 32-bit = 232 = 4,294,967,296 posibles valores

Como te podrás imaginar, cuanto mayor sea la profundidad de bits, mayor será la precisión del valor de la amplitud de cada muestra.

Es por esta razón que a la hora de producir música es recomendable trabajar con, al menos, 24-bits de profundidad, siendo recomendable incluso 32-bits. La razón es que cuanta mayor precisión tenga la señal digital con la que estés trabajando, más acertados serán todos los procesamientos que le apliques.

Pero una vez más, cuanto más precisa sea la señal digital, más cara será en lo que a poder de procesamiento y espacio requerido se refiere. El estándar actual son los 16-bits y 44.1kHz. Sin embargo, la mayoría de la gente no es capaz de apreciar la diferencia de un archivo de 16-bits y uno de 24-bits.

Por lo tanto, una vez que hayas terminado con tu producción, deberás reducir la profundidad de bits a la hora de exportar el archivo para que cumpla los estándares.

Reducir la profundidad de bits no es proceso trivial. De alguna manera tienes que meter toda la información que guardabas en muestras de 24-bits en muestras de 16-bits. Es un proceso parecido a hacer la maleta cuando te vas de viaje. A pesar de que te gustaría poder vestirte de la manera más fiel a tu estilo posible, no te puedes llevar el armario entero, algo tendrá que quedar fuera.

El problema es que al reducir la profundidad de bits no solo se pierde información, si no que se introducen errores. Es por esto que existe un proceso llamado dithering que los atenúa.

¿Qué es el Dithering?

Cuando pasamos de 24-bit a 16-bit, es decir, reducimos el número de posibles valores que puede tomar la amplitud en cada muestra y la mayoría de los valores “viejos” estarán entre dos valores nuevos, de manera que es necesario aproximarlos, creándose cierto error.

El proceso mediante el cual se realizan estas aproximaciones se llama cuantización. Nuestro oído percibirá los errores de cuantización como una distorsión.

Pero todo esto se entiende mejor con un ejemplo. Todos los numeros que utilizo en este ejemplo son inventados, la única finalidad es intentar poner un ejemplo sencillo.

Imagínate que queremos pasar de muestras de 3-bits a muestras de 2-bits.

Digamos que las muestras de 3-bits solo pueden tomar estos 23 = 8 valores:

0 dB – 15 dB – 25 dB – 30 dB – 35 dB – 45 dB – 60 dB – 75 dB

Mientras que las muestras de 2-bits solo pueden tomar estos 22 = 4 valores:

0 dB – 30 dB – 50 dB – 70 dB

Como puedes ver, los valores posibles valores que puede tomar la amplitud con 3-bit son diferentes a los que puede tomar con 2-bit. Por lo tanto, surge el problema de tener que aproximar los valores de algún modo.

Dos formas clásicas de aproximar son el truncamiento y el redondeo. Pongamos 3 muestras de ejemplo, que toman los valores 30 dB, 45 dB y 75 dB.

Aproximadas por truncamiento serían: 30 dB – 30 dB – 70 dB

Aproximadas por redondeo serían: 30 dB – 50 dB – 70 dB

El problema con estos dos métodos de aproximación es que, a lo largo de la onda, produce errores repetitivos (correlacionados con la forma de la onda), de forma que nuestro oído percibe otras frecuencias de manera simultánea (distorsión).

La solución a este problema es el dithering. En lugar de redondear de manera predecible, creando así patrones audibles, se aproxima hacia arriba o hacia abajo de forma aleatoria.

El resultado es un tenue ruido de fondo, llamado ruido blanco, que “camufla” las nuevas frecuencias, de manera que nuestro oído percibe la frecuencia original y un ligero ruido de fondo.

Un ejemplo vale más que mil palabras:

Onda sinusoidal 16-bit

Onda sinusoidal 16-bit a 6-bit por truncamiento

Onda sinusoidal 16-bit a 6-bit con dithering

La amplitud del ruido blanco será el límite inferior del rango dinámico, por eso se le llama también noise floor (suelo del ruido). El límite superior del rango dinámico es el valor más alto que el sistema binario puede crear. Si la amplitud supera este valor la señal también se distorsionará. A este límite se le llama 0 dBFS.

Por lo tanto, la profundidad de bits determina el número de posibles valores que puede tomar la amplitud entre el noise floor y los 0 dBFS.

Por esta razón es una buena idea trabajar con un bit depth de al menos 24-bits, pues de este modo nos aseguramos que el noise floor es lo suficientemente bajo. De este modo, existe una mayor diferencia ente el nivel nominal y el punto de saturación, también conocida como headroom.

Conclusión

Como has podido comprobar, es un tema bastante complejo. Yo, como estudiante de matemáticas y apasionado de los ordenadores que soy, he disfrutado como un niño escribiendo este artículo, pero entiendo que si no es lo tuyo puede que te parezca un tema muy aburrido.

Pero no es algo que te deba preocupar, pues hacer un uso correcto de la profundidad de bits y la frecuencia de muestreo es realmente sencillo, y no es necesario entender en qué consisten estos conceptos.

La mayoría de los DAW’s tendrán los ajustes correctos de manera predefinida, tanto de grabación (44.1kHz/48 kHz y 24-bit/32-bit) como de exportación (44.1 kHz y 16-bit, más el algoritmo de dithering preestablecido).

Si te has quedado con alguna duda o si crees que he metido la gamba en algún sitio, te animo a que me dejes un comentario.

¡Gracias por leer el artículo y hasta la próxima!

Te puede interesar…

  • diferencias ganancia volumen
  • phantom power que es

Leave a Comment