CUALIDADES DEL SONIDO
ACÚSTICA MUSICAL Y ORGANOLOGÍA
TIRSO DE OLAZÁBAL
RICORDI AMERICANA, BUENOS AIRES, 1954
ORIGINAL, presencias.net, 2003-2008


Cualidades del sonido

Se distinguen habitualmente en la sensación sonora tres cualidades principales: altura, intensidad y timbre, que por su importancia y diversidad constituyen otras tantas sensaciones. Es costumbre correlacionar la altura de un sonido con la frecuencia de las vibraciones que lo originan, la intensidad con la amplitud y el timbre con la ley que rige dicho movimiento vibratorio. Todo esto es cierto en primera aproximación, pero analizando más profundamente las sensaciones y sus respectivos estímulos como lo haremos en los párrafos siguientes, veremos que la realidad no es tan sencilla.
        La duración es una cualidad del sonido que no hemos mencionado hasta ahora pero que posee gran importancia musical pues es la que determina el ritmo, uno de los elementos básicos de la música. La duración de una sensación sonora depende directamente de la duración del movimiento vibratorio que origina el sonido, aunque en algunos casos la sensación persiste después del cesar el estímulo. Cuando la duración es muy pequeña afecta nuestra percepción de la altura: según experiencias realizadas por Ekdahl y Stevens, un sonido de 1000 ciclos cuya duración es de 0,01 segundos produce una sensación cuya altura es igual a la de un sonido de 842 ciclos cuya duración es de 1,5 segundos. Con la intensidad del sonido ocurren fenómenos similares.


        Además de las cualidades del sonido ya mencionadas suelen atribuírsele otras como el volumen y la densidad; esto es perfectamente posible pues con las dos variables (frecuencia y amplitud), pueden existir infinitas funciones [1] diferentes. El volumen es una sensación que aumenta al aumentar la amplitud y disminuye al crecer la frecuencia: una nota de flautín parece tener menos "volumen", menos cuerpo, que una nota de contrabajo de la misma intensidad; al aumentar la intensidad de los sonidos emitidos por un instrumento, parece aumentar su volumen. La densidad de un sonido es una sensación que producen ciertos sonidos de ser más compactos, más "densos" que otros; esta sensación parece depender de la frecuencia y aumentar con ella, debido probablemente a la mayor velocidad con que se suceden las vibraciones en los sonidos agudos.
        La respuesta del oído a las ondas sonoras no es lineal, por lo cual el sonido escuchado difiere a veces considerablemente del que correspondería a las ondas sonoras emitidas en la fuente. La razón de este comportamiento del oído es clara: para que un cuerpo o sistema de cuerpos pueda presentar respuesta lineal es necesario que pueda desplazarse simétricamente y con igual facilidad a cada lado de su posición de equilibrio. En el oído, esto no es posible, pues de un lado del tímpano se halla el mango del martillo, unido a su vez a los demás huesecillos del oído medio y del otro lado hay aire; por otra parte, el oído interno introduce nuevas modificaciones en la respuesta debido a la impedancia de los líquidos linfáticos y sus numerosas asimetrías de construcción, todo lo cual se traduce en una distorsión final considerable [2].

figura 1
figura 1

        En la figura 1 que representa este fenómeno, la sinusoide trazada con línea punteada representa la onda sonora que llega al oído y la onda en trazo lleno, el sonido que resulta de la distorsión; puede verse que la onda resultante ya no es sinusoidal sino que es una curva compleja, descomponible por el teorema de Fourier en varias sinusoides, cada una de las cuales corresponde a un armónico introducido por el oído. Estos armónicos introducidos por el oído se llaman armónicos aurales.

Altura: su definición y dependencia

        La altura de un sonido es la cualidad de la sensación sonora a que nos referimos cuando decimos que un sonido es más agudo (alto) o más grave (bajo) que otro. Depende principalmente de la frecuencia aunque también es afectada por la amplitud del movimiento vibratorio, como veremos de inmediato. Los sonidos agudos corresponden a los de frecuencia elevada y los graves a los de baja frecuencia. Es curioso constatar que en la mayoría de las lenguas europeas los vocablos "alto" y "bajo" corresponden respectivamente a los sonidos agudos y a los graves; la razón de esta asociación no es muy clara pero ha sido observado que al pedir a varios observadores que localicen la fuente aparente de una serie de sonidos emitidos detrás de una pantalla, tienden a situar el punto de emisión de los sonidos agudos a mayor altura que para los sonidos graves, aunque el punto real de emisión no varíe.


        El umbral para la sensación de altura está entre los 16 y los 18 ciclos, denominándose infrasonidos los movimientos vibratorios de frecuencia inferior a ésta. Dicho umbral no es estrictamente el de todas las sensaciones auditivas, pero con frecuencias menores que las citadas, como pulsaciones aisladas, a veces de carácter táctil. Además, es difícil separar los sonidos graves de los armónicos aurales que se originan en el oído del observador.
        La cima de las sensaciones de altura oscila entre los 16000 y los 20000 ciclos, variando considerablemente de sujeto a sujeto; la sensibilidad del oído para los sonidos agudos comienza a decrecer a partir de los 30 años.
        La amplitud afecta la altura: los sonidos de frecuencia baja (hasta 500 ciclos) parecen más graves cuando aumenta su amplitud, ocurriendo lo contrario con los sonidos de alta frecuencia (sobre los 4000 ciclos); los sonidos de frecuencia media sufren poca variación. Los sonidos utilizados en música casi no presentan este fenómeno pues generalmente contienen armónicos situados en la región de las frecuencias medias donde no se lo observa; en cambio, es observable sobre los sonidos puros como los que produce el diapasón: pídase a una persona que reproduzca con la voz el sonido producido por un diapasón, colocándolo primero a un metro y luego al lado del oído del observador; el sonido reproducido en segundo término será más bajo que el reproducido primero, pues al acercar el diapasón al observador, los sonidos que emite llegan a éste con más fuerza. Por lo tanto, para controlar la afinación de un instrumento no conviene acercar mucho el diapasón al oído.
        Es de gran interés determinar si la relación armónica de dos sonidos depende de su altura o de su frecuencia. Las investigaciones realizadas por Fletcher en este sentido, muestran que es la frecuencia y no la altura la que determina esta relación. Ejecutados sucesivamente, un sonido de 400 ciclos y un sonido de 205, pueden producir la sensación de octava, pero simultáneamente son discordantes.
        Los umbrales diferenciales para la sensación de altura varían considerablemente con la frecuencia y la intensidad de los sonidos estudiados. En la región de los 1000 ciclos, el oído puede percibir diferencias de frecuencia de 3 ciclos (0,3 %), o sea de 1/16 de semitono, mientras que en la región de los 60 ciclos, la sensibilidad es de 1 % o sea de casi un semitono. En condiciones favorables, puede distinguirse en aguda, la sensibilidad del oído decae nuevamente.
        Para que un sonido produzca una sensación clara de altura, su duración mínima debe ser del orden del vigésimo de segundo.
        Se llama oído absoluto la cualidad poseída por ciertas personas de reconocer un sonido basándose únicamente sobre su altura. Las experiencias deben hacerse con sonidos puros sin que el observador intente tararearlos o silbarlos pues de otro modo intervendría en el reconocimiento la memoria muscular. Debe notarse que la mayoría de los músicos que creen poseer oído absoluto, sólo lo poseen para el instrumento que ejecutan y cuando los sonidos varían en forma discontinua como en las escalas musicales. Si las frecuencias varían en forma continua, la individualización de una nota determinada es mucho más difícil. El oído absoluto tiene una utilidad musical relativa, siendo mucho más importante el oído de relación; grandes genios como Schumann y Wagner han carecido de oído absoluto aunque otros lo han poseído en grado muy marcado.

Efecto Doppler

        Al estudiar la relación entre frecuencia y altura, es interesante mencionar un fenómeno fácilmente observable en esta época donde la velocidad de los medios de locomoción aumenta constantemente: el efecto Doppler, llamado así en honor del físico alemán que lo descubrió por primera vez en 1842.
        El efecto Doppler consiste en lo siguiente: cuando entre una fuente sonora y un observador existe un movimiento relativo, sea de alejamiento o acercamiento, el observador no oye el sonido con la altura que le correspondería por su frecuencia sino que ésta aumenta en el primer caso y disminuye en el segundo. Por ejemplo, si una locomotora pasa a gran velocidad por una estación haciendo sonar su silbato, los observadores situados sobre los andenes de la estación escuchan dicho silbato como un sonido cuya altura aumenta constantemente mientras la locomotora se acerca, llegando a un máximo cuando la locomotora pasa frente a ellos y disminuyendo luego al alejarse ésta. Esto ocurre porque al aumentar o disminuir la distancia entre la fuente y el observador, éste recibe una cantidad de ondas respectivamente menor o mayor que las que corresponden al sonido producido por aquélla.

Intensidad del sonido

        La intensidad del sonido desde el punto de vista psicológico, es la cualidad de la sensación sonora que queremos indicar cuando decimos que un sonido es más fuerte o más débil que otro; depende principalmente de la amplitud del movimiento vibratorio que origina el sonido.
        Llámase umbral de audibilidad para un sonido de frecuencia dada, el punto en que la intensidad de dicho sonido no puede disminuirse sin que cese de ser oído. La cima de las sensaciones de intensidad es el punto donde éstas no pueden aumentar sin cambiar de especie, convirtiéndose en sensaciones dolorosas; por lo tanto, el umbral de estas últimas es simultáneamente, cima de las primeras.
        El oído puede experimentar sensaciones de intensidad, mismo si la duración del sonido que las produce es de 0,0003 de segundo.
        Desde el punto de vista físico, la intensidad del sonido se mide de dos maneras: como intensidad absoluta, expresando la energía de la onda sonora en unidades de potencia o de presión y como intensidad relativa, mediante escalas que se forman tomando como unidad de medida para cada sonido, su intensidad absoluta en el umbral de audibilidad.
        La medición de la intensidad absoluta se efectúa mediante un procedimiento ideado por Lord Rayleigh que consiste en suspender un disco liviano dentro del campo de acción de una onda sonora y medir el ángulo girado por aquel que tiende a colocarse normalmente a ésta. Como el ángulo girado por el disco, es proporcional a la intensidad absoluta de la onda que sobre él incide, ésta se calcula fácilmente una vez medido dicho ángulo.
        La intensidad absoluta necesaria para llegar al umbral de audibilidad, varía enormemente con la frecuencia de los distintos sonidos. Los sonidos graves y sobreagudos consumen gran cantidad de energía, no así los de la región media y aguda para los que el oído es sumamente sensible.

Escala de la intensidad relativa: el decibel

        Se define como intensidad relativa de un sonido de frecuencia dada, la relación entre su intensidad absoluta en el instante en que se hace la medición y en su umbral de audibilidad.
        Para medir la intensidad relativa de un sonido dado, se establece una escala de la manera siguiente: se mide la intensidad absoluta del sonido en cuestión en un umbral de audibilidad y a esta intensidad absoluta que designaremos con "x" se le hace corresponder el punto cero de la escala para ese sonido. Una vez establecido el cero de la escala, se dice que la intensidad relativa del sonido en cuestión ha aumentado en 1 decibel cuando su intensidad absoluta ha aumentado en un 25 % o sea cuando valga 1,25 x. Cuando la intensidad absoluta haya aumentado en otro 25 %, la intensidad relativa habrá aumentado en otro decibel, o sea que será de 2 decibeles, produciéndose de igual manera para aumentos ulteriores. El decibel equivale prácticamente al umbral diferencial para las sensaciones de intensidad de muchos sonidos; en efecto, en muchos casos el mínimo de intensidad perceptible equivale a un 25 %.
        Ninguna de las escalas de intensidad relativa sobrepasa los 130 decibeles pues este número correspondería a la intensidad relativa de un sonido cuya energía fuera 10 billones de veces mayor que la que poseía en su umbral de audibilidad. Este aumento es el máximo tolerado por el oído, aun en la región media donde su sensibilidad es mayor.
        La intensidad absoluta necesaria para llegar al umbral de audibilidad, es diferente para cada sonido; debido a esto, existen tantas escalas de la intensidad relativa como sonidos de diferente frecuencia y por esta razón, no puede compararse la intensidad relativa de dos sonidos de frecuencia diferente. Para remediar esto, ha sido ideada la escala de la sonoridad, cuyo punto cero es el umbral de audibilidad para los sonidos de frecuencia 1000. La unidad de esta escala es el fon, que es igual al decibel mientras nos refiramos a sonidos de 1000 ciclos. Un sonido de 1000 ciclos cuya intensidad relativa es de "x" decibeles tendrá una sonoridad de "x" fones.
        Para sonidos cuya frecuencia difiere de 1000 ciclos, se procede de la siguiente manera: dos sonidos de diferente frecuencia tienen el mismo número de fones cuando su intensidad psicológica es la misma; diremos que un sonido de frecuencia "n" tiene una intensidad de "x" fones cuando se lo oye con la misma intensidad que un sonido de 1000 ciclos y "x" decibeles.

Área auditiva. Enmascaramiento

        El número de sonidos contenidos en el área auditiva normal ha sido calculado por Stevens y Davis en 340000, basándose sobre los umbrales diferenciales previamente determinados para las sensaciones de altura y de intensidad. Nótese bien que este número se refiere sólo a sonidos puros en los cuales se varía la altura y la intensidad; variando el timbre, el número de sonidos es prácticamente infinito [3].
        La intensidad de los complejos sonoros es difícil de determinar, habiendo tenido poco éxito las determinaciones hasta ahora efectuadas. Cuando la frecuencia de los componentes es suficientemente diferente para que sean estimuladas regiones distintas de la membrana basilar, la intensidad resultante es más o menos la suma aritmética de las intensidades de cada componente. Si las frecuencias son próximas entre sí, se produce un fenómeno llamado enmascaramiento.

figura 2 - Área auditiva normal
figura 2 - Área auditiva normal

        El enmascaramiento consiste en lo siguiente: consideremos dos sonidos A y B de frecuencias bastante próximas y sea "x" la intensidad absoluta de A en el umbral de audibilidad. Si observamos que mientras se escucha el sonido B es necesaria una intensidad mayor que "x" para llegar al umbral de audibilidad de A, decimos que el sonido B enmascara el sonido A. El enmascaramiento se mide en decibeles tomando el umbral de audibilidad de A (sin enmascarar) como punto de partida.
        Es interesante observar que no tendría objeto que nuestro oído fuera más sensible de lo que ya es; en efecto, con mayor sensibilidad que lo que poseemos, oiríamos el "ruido termal" que proviene de los movimientos realizados por las moléculas de los gases que componen la atmósfera, debido a la temperatura.

El timbre: su definición y dependencia

        El timbre es la cualidad de la sensación sonora que permite establecer la proveniencia de los diferentes sonidos y ruidos. Los sonidos producidos por un mismo instrumento tienen todos un timbre igual o similar, cualquiera sea su altura e intensidad; por otra parte, dos sonidos de igual altura e intensidad ejecutados por instrumentos distintos serán inconfundibles, pues su timbre será diferente.
        Dos movimientos vibratorios de igual frecuencia y amplitud producirán sonidos de la misma altura e intensidad; si estos sonidos difieren en su timbre, es evidente que habrá una tercera característica del movimiento vibratorio que será la que producirá dicha diferencia. Esta característica del movimiento vibratorio es la ley según la cual varía la elongación en función del tiempo en el intervalo de un período.
        La representación gráfica de la variación de la elongación en función del tiempo, origina las distintas curvas que caracterizan el timbre de cada sonido. Por esta razón, se dice frecuentemente que el timbre depende de la forma o de la complejidad de la onda sonora. Debe recordarse que las curvas correspondientes a movimientos vibratorios o a las ondas sonoras que éstas originan, no indican el movimiento real de las partículas del cuerpo sonoro o del medio en el cual se propaga la onda sino que representan las variaciones en función del tiempo de la elongación de dichas partículas, mientras que los movimientos se realizan sobre pequeñísimas trayectorias rectilíneas.
        Para aclarar esto, recurramos a la sinusoide; sabemos que ésta representa el movimiento de un punto que se mueve con movimiento armónico simple, ya sea éste el punto material de un péndulo que oscila lateralmente sobre un arco de circunferencia o la pesa de un resorte oscilando sobre una línea vertical. Es evidente que la curva representa solamente la variación de la elongación en función del tiempo, pues de otro modo, el movimiento de la pesa y el movimiento curvilíneo del punto material de la pesa debieran representarse de manera distinta.
        El físico alemán G. S. Ohm fue el primero en proponer una explicación de las sensaciones tímbricas. Expresa la ley de Ohm que el oído analiza las ondas complejas que sobre él inciden, descomponiéndolas en sus componentes sinusoidales, comportándose como si estuviera constituido por una multitud de resonadores, cada uno de los cuales resuena para un sonido simple determinado; entiéndese por sonido simple el producido por una única onda sinusoidal. Los sonidos simples que componen el sonido complejo se llaman en este caso armónico.
        Se llaman armónicos aurales los sonidos generados por la distorsión introducida por el oído. Es fácil demostrar su existencia, creando pulsaciones con sonidos puros de frecuencia próxima.
        Al estudiar el timbre de sonidos producidos por percusión es necesario tomar en cuenta la existencia de parciales transitorios o fugaces, que aparecen inmediatamente después de la percusión y duran fracciones pequeñas de segundo, modificando grandemente sin embargo, el timbre del sonido.
        Hermann von Helmholtz en su libro "Sensaciones sonoras", publicado en 1862, resumió los resultados de 8 años de experiencias realizadas para confirmar la ley de Ohm diciendo: "las diferencias de timbre de los distintos sonidos, provienen únicamente de la presencia de armónicos y de su intensidad relativa". Helmholtz y Ohm sostenían que la fase de los diferentes armónicos no influye en el timbre del complejo, pero este aspecto de su teoría ha sido refutado por observadores más recientes.
        En su aspecto fisiológico, las teorías de Helmholtz y Ohm suponen que las fibras de la membrana basilar y los órganos de Corti desempeñan el papel de resonadores para los sonidos simples. La teoría de Helmholtz, muy conveniente bajo ciertos aspectos, no explica con todo varios fenómenos como ser las pulsaciones y el enmascaramiento, razón por la cual ha caído en desuso.
        El profesor Fritz Volbach, en su interesante libro "La orquesta moderna", sostiene que hay sólo dos formas básicas en las ondas sonoras: una forma sinuosa y una forma dentada, con todos los posibles tipos de transición, correspondiendo las formas sinuosas a los sonidos de la flauta y la trompa y las formas dentadas al oboe y la trompeta; los armónicos se agregan a estas ondas formando ondas de superposición, pero sin alterar su carácter básico; sostiene además, que los armónicos de un sonido poseen ya el timbre de éste. Según Volbach, no podrá nunca sintetizarse el timbre de la trompeta a partir de parciales de la flauta, por ejemplo, aunque se varíen sus intensidades y se quiten o añadan parciales. Haciendo estudios sobre los instrumentos de viento, deduce que el modo de provocar la vibración del aire influye decisivamente sobre el timbre: si las compresiones y dilataciones se producen suavemente, la forma básica de la onda será sinuosa, evolucionando hacia la forma dentada cuanto más violenta es la producción de las ondas. El estudio de las ondas producidas por explosiones, parece confirmar esta teoría.
        Una de las contribuciones modernas que más interesa al estudio del timbre, es la teoría del formante. Según la teoría clásica de Helmholtz, el timbre de los sonidos, dependía de la relación entre las frecuencias de los distintos armónicos y la frecuencia de la fundamental, cualquiera sea esta última. La teoría del formante sostiene por el contrario que para cada timbre existe una banda estrecha de frecuencias, de altura absoluta fija, que está siempre presente, cualquiera sea la frecuencia de la fundamental. En el caso del violín, las frecuencias formantes que caracterizan su timbre estarían siempre comprendidas entre 3500 y 5000 ciclos.
        Las sensaciones de timbre no son mensurables como las de altura y de intensidad, pues la mayor o menor complejidad de un movimiento vibratorio no constituye una magnitud para la cual pueda establecerse unidad de medida ni escalas. No existen por lo tanto umbral ni cima para las sensaciones de timbre. Para ordenar los sonidos según su complejidad, se establece una relación entre la energía total y la energía de todos los parciales menos la fundamental; un sonido con 3 % de distorsión será uno en que la fundamental posee el 97 % de la energía total.
        El estudio del timbre se puede realizar por dos vías opuestas y complementarias: por análisis y por síntesis. El primero en analizar sonidos fue Helmholtz que efectuó sus análisis mediante los resonadores por él inventados. El uso de resonadores permite determinar cuales son los armónicos presentes pero no su intensidad; para esto se recurre actualmente a los analizadores armónicos, que muestran simultáneamente las intensidades de los armónicos componentes mediante diversos circuitos eléctricos. Los resultados de estos análisis son expuestos en lo que se llama espectros armónicos. Los espectros armónicos de los distintos instrumentos: las ordenadas son proporcionales a las intensidades (medida en decibeles) y las abscisas a las frecuencias de los armónicos.
        La síntesis de sonidos es también de gran utilidad, pues permite confirmar los resultados del análisis. Helmholtz y Koenig construyeron un aparato formado por diez diapasones y sus correspondientes resonadores mediante el cual sintetizaron con bastante éxito algunos sonidos. Actualmente se utiliza un aparato llamado "synthephone" que permite sintetizar la mayoría de los sonidos conocidos y crear timbres nuevos.
        El "phonodeik", inventado por el físico norteamericano Dayton C. Miller, permite obtener y fotografiar los oscilogramas correspondientes a los diversos sonidos.

NOTAS
1. Se dice que una variable "y" es función de otra variable "x" [simbolizado por y = F(x)], cuando a cada valor de "x" corresponden uno o varios valores de "y". Como a "x" se le asignan valores arbitrariamente, se la llama variable independiente, llamándose variable dependiente la variable "y". La palabra "función" designa igualmente a la variable dependiente como a la relación entre ésta y la variable independiente.
2. El autor remite al Apéndice II.
3. El número de colores discernibles en las sensaciones visuales considerando los umbrales diferenciales para brillo, saturación y matices, es de la misma magnitud.