banner
Hogar / Noticias / Los investigadores en acústica descomponen el sonido con precisión en sus tres componentes básicos
Noticias

Los investigadores en acústica descomponen el sonido con precisión en sus tres componentes básicos

Aug 22, 2023Aug 22, 2023

13 de julio de 2023

Este artículo ha sido revisado de acuerdo con el proceso editorial y las políticas de Science X. Los editores han resaltado los siguientes atributos al tiempo que garantizan la credibilidad del contenido:

verificado

fuente confiable

corregir

por la Universidad Aalto

Los investigadores llevan más de 200 años buscando formas de descomponer el sonido en sus ingredientes básicos. En la década de 1820, el científico francés Joseph Fourier propuso que cualquier señal, incluidos los sonidos, se puede generar utilizando una cantidad suficiente de ondas sinusoidales. Estas ondas suenan como silbidos, cada una tiene su propia frecuencia, nivel y hora de inicio, y son los componentes básicos del sonido.

Sin embargo, algunos sonidos, como la flauta y una voz humana entrecortada, pueden requerir cientos o incluso miles de senos para imitar exactamente la forma de onda original. Esto se debe al hecho de que dichos sonidos contienen una estructura menos armónica y más ruidosa, donde todas las frecuencias ocurren al mismo tiempo. Una solución es dividir el sonido en dos tipos de componentes, senos y ruido, con un número menor de ondas sinusoidales silbantes y combinados con ruidos variables, o silbidos, para completar la imitación.

Incluso este modelo de sonido "completo" de dos componentes tiene problemas con el suavizado del comienzo de los eventos sonoros, como las consonantes en la voz o los sonidos de batería en la música. Un tercer componente, denominado transitorio, se introdujo alrededor del año 2000 para ayudar a modelar la nitidez de dichos sonidos. Los transitorios por sí solos suenan como clics. A partir de entonces, el sonido se ha dividido a menudo en tres componentes: senos, ruido y transitorios.

Investigadores del Laboratorio de Acústica de la Universidad Aalto han perfeccionado el modelo de tres componentes de senos, ruido y transitorios, utilizando ideas de la percepción auditiva, la lógica difusa y la reconstrucción perfecta. Su investigación se publica en el Journal of the Audio Engineering Society.

El investigador de doctorado Leonardo Fierro y el profesor Vesa Välimäki se dieron cuenta de que es importante la forma en que las personas escuchan los diferentes componentes y separan los silbidos, clics y silbidos. Si un clic se extiende en el tiempo, comienza a sonar y a sonar más ruidoso; por el contrario, centrarse en sonidos muy breves puede provocar cierta pérdida de tonalidad.

Esta percepción procedente de la percepción auditiva se combinó con una lógica confusa: en cualquier momento, una parte del sonido puede pertenecer a cada una de las tres clases de senos, transitorios o ruido, no sólo a una de ellas. Con el objetivo de lograr una reconstrucción perfecta, Fierro optimizó la forma en que se descompone el sonido.

En el método mejorado, los senos y los transitorios son dos características opuestas del sonido, y no se permite que el sonido pertenezca a ambas clases al mismo tiempo. Sin embargo, cualquiera de los dos tipos de componentes opuestos puede aparecer simultáneamente con el ruido. Así, la idea de lógica difusa está presente de forma restringida. El ruido funciona como un vínculo difuso entre los senos y los transitorios, describiendo todos los matices del sonido que no se captan con simples clics y silbidos. "Es como encontrar la pieza que falta en un rompecabezas para conectar esas dos piezas que antes no encajaban", afirma Fierro.

Este método de descomposición mejorada se comparó con métodos anteriores en una prueba de escucha. Se pidió a once oyentes experimentados que escucharan individualmente varias excepciones musicales cortas y los componentes extraídos de ellas utilizando diferentes métodos.

El nuevo método surgió como la forma ganadora de descomponer la mayoría de los sonidos, según las valoraciones de los oyentes. Sólo cuando hay un fuerte vibrato en un sonido musical, como en una voz cantada o en el violín, todos los métodos de descomposición tienen dificultades, y en estos casos algunos métodos anteriores son superiores.

Un caso de uso de prueba para el nuevo método de descomposición es la modificación de la escala de tiempo del sonido, especialmente la ralentización de la música. Esto se comprobó en una prueba de escucha de preferencias con el método anterior del propio laboratorio, que fue seleccionado como la mejor técnica académica en un estudio comparativo hace unos años. Una vez más, el nuevo método de Fierro fue un claro ganador.

"El nuevo método de descomposición del sonido abre muchas posibilidades interesantes en el procesamiento del sonido", afirma el profesor Välimäki. "La ralentización del sonido es actualmente nuestro principal interés. Llama la atención que, por ejemplo, en las noticias deportivas los vídeos en cámara lenta siempre estén en silencio. Probablemente la razón es que la calidad del sonido en las actuales herramientas de reducción de audio no es lo suficientemente buena. "Ya hemos comenzado a desarrollar mejores métodos de modificación de escala de tiempo, que utilizan una red neuronal profunda para ayudar a estirar algunos componentes".

La descomposición del sonido de alta calidad también permite nuevos tipos de técnicas de remezcla musical. Uno de ellos conduce a una compresión del rango dinámico sin distorsiones. Es decir, el componente transitorio a menudo contiene los picos más fuertes en la forma de onda del sonido, por lo que simplemente reducir el nivel del componente transitorio y mezclarlo nuevamente con los demás puede limitar el valor de pico a pico del audio.

Más información: Leonardo Fierro et al, Descomposición difusa mejorada del sonido en senos, transitorios y ruido, Revista de la Sociedad de Ingeniería de Audio (2023). DOI: 10.17743/jaes.2022.0077

Proporcionado por la Universidad Aalto

Más información:Citación