328302424-percepcio-n-auditiva-g-basso-13mb.pdf

  • Uploaded by: Julián Campo
  • 0
  • 0
  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View 328302424-percepcio-n-auditiva-g-basso-13mb.pdf as PDF for free.

More details

  • Words: 115,769
  • Pages: 147
Gustavo Basso

Percepci6n auditiva

UNIVERSIDAD NACIONAL DE QUILMES Rector

Daniel Gomez

Vicerrector Jorge Flores

(f)

Universidad Nacional de Quilmes Editorial

Colecci6n MUsica y Ciencia Dirigida por OscarPablo Di Liscia

Basso, Gustavo Percepci6n audit iva - la cd. - Bernal: Universidad Nacional de Quilmes, 2006. 288 p. : it. ; 15x21.5 cm (Musica y ciencia dirigida por Pablo Di Liscia) ISBN 987-558-082-1

1. Pcrccpcion Auditiva. 2. Sonido. 3. Tono. - 1. TItulo CDD 152.\5

© Gustavo Basso. 2006

© Universidad Nacional de Quilmes. 2006

Roque Saenz Pefia 352

(BI876BXD) Bernal

Buenos Aires

http://www.unq.edu.ar

[email protected]

ISBN: 987-558-082-1 ISBN-13: 978-987-558-082-4 Queda hecho el deposito que rnarca la ley 11.723

Esta edici6n de 1.000 ejemplares se termino de imprimir en agosto de 2006, en los talleres graficos de Imprenta El Faro, Dorrego 1401, Mar del Plata, Provincia de Buenos Aires.

Iodice

Presentacion, por Oscar Pablo Di Liscia

15

Prologo

17

Capitulo I. Sistema auditivo periferico y fisiologia de la audici6n 1. Ofdo externo Audici6n con auriculares 2. Oido medio Tfrnpano Cadena de huesecillos Cavidad timpanica y trompa de Eustaquio Funci6n aciistica del otdo medio Alteraciones en el sistema de transmisi6n del ofdo medio 3. Oido interno Fisiologta de la c6clea Caracterfsticas del nervio auditivo 4. Teorta dellugar Exdtaci6n de la membrana basilar con un impulso 5. Comportamiento activo de la membrana basilar y emisiones

otoacusticas 6. Funciones de transferencia del sistema auditivo periferico 7. Respuestas neurales a altos niveles en el sistema auditivo

19

20

22

24

24

26

26

26

28

30

32

40

42

44

Capitulo II. Sonoridad 1. Relaci6n entre arnplitud e intensidad Decibeles Potencia e intensidad acustica 2. Percepci6n de la sonoridad Umbrales absolutos

53

54

54

55

57

58

46

47

48

Contomos de igual sonoridad Escala absoluta de sonoridad Sumario de unidades relacionadas con la sonoridad 3. Discrirninacion de la intensidad Limen de intensidad La Ley de Weber Ley de Fechner para la sonoridad 4. Otros factores que intervienen en la percepcion de la sonoridad Integracion temporal Factores espectrales Cambios en la sensibilidad auditiva pravocados por sobrestimulacion. Deteccion de sefiales sinusoidales en presencia de ruido Patologfas auditivas 5. Codificacion de la intensidad El problema del rango dinamico Limites a la discriminacion en intensidad Codificacion de rasgos y codificacion contextual 6. Modelos de percepcion de la sonoridad

Capitulo III. EI ofdo como analizador espectral. 1. Diferencia apenas perceptible (OAP) en frecuencia 2. Bandas criticas Experimento de Fletcher Refinamiento del modelo de Fletcher 3. Sonoridad ante espectros complejos Umbral para estfrnulos cornplejos Sensibilidad a la fase Discrirninacion de parciales en sonidos complejos Selectividad en frecuencia en ofdos dafiados 4. Enmascaramiento Relacion entre las bandas criticas y el mecanismo

de enmascaramiento Modelos de cobertura y supresion Modelos temporales de enmascaramiento " 5. Analisis espectro-ternporal combinado Reduccion del enmascaramiento por cornodulacion Enmascaramiento no simultaneo Enmascaramiento binaural 6. Distorsion alineal y sonidos de combinacion Sonidos de cornbinacion de segundo orden

60

62

65

66

66

68

70

70

70

71

73

77

77

81

81

84

85

86

89

89

91

91

94

98

99

99

100

100

101

103

104

104

104

105

106

109

110

111

, ';!~: ~,.

Sonidos de combinacion de tercer orden 7. Algoritmos psicoaciisticos de compresi6n

113

113

Capitulo IV. Procesamiento temporal de sefiales 1. Resolucion e integraci6n temporal. Efectos de la frecuencia central en la resolucion temporal 2. Resoluci6n temporal en sefiales de banda ancha 3. Resolucion temporal en seriales de banda angosta Deteccion de discontinuidades en ruido de banda angosta Detecci6n de discontinuidades en sinusoides 4. Modelos de resolucion temporal. Hip6tesis del banco de filtros de modulacion 5. Otros pracesos temporales Discriminacron en secuencias de Huffman Deteccion de asincronfas en el ataque y la extincion

de sefiales complejas Discriminacion de la duraci6n 6. ] uicios sobre el orden temporal. Desplazamiento aciistico temporal.

117

118

121

121

122

123

124

124

126

127

127

127

127

128

128

Capitulo V. Percepci6n de la altura tonal 1. Percepcion de la altura tonal en sinusoides Discriminacion en frecuencia Variacion de la altura tonal con la sonoridad 2. Percepcion de la altura tonal en estfrnulos arrnonicos complejos Modelos de reconocimiento de patrones Modelos temporales Evidencia experimental relevante a cada modelo : Modelo de Brian Moore del mecanismo para la percepcion

de la altura tonal en sonidos complejos 3. La altura tonal como un medio morfof6rico 4. Representacion grafica de la altura tonal Sonidos de Sheppard 5. Altura tonal e intervalos musicales Percepci6n de intervalos musicales lntervalos sincronicos y diacronicos Consonancia y disonancia

145

149

150

152

154

155

157

160

Capitulo VI. TImbre 1. Definiciones de timbre

163

164

133

135

136

137

139

140

142

143

2. Estudios y modelos explicativos sobre el timbre El modelo clasico Analisis multidimensional Modelos verb ales Modelos de analisis por sfntesis Estudios sobre el timbre en la voz humana Estudios sobre el "color" del sonido Eventos acusticos diferentes a la voz y a los sonidos musicales Resumen y conclusiones 3. Propiedades particulares del timbre Constancia del timbre [Timbres metamericos? El timbre como medio morfof6rico Timbre y atenci6n 4. Comentario final.

166

167

171

178

179

182

183

184

186

187

187

189

189

190

190

Capitulo VII. Percepcion auditiva del espacio 1. Localizaci6n de sinusoides Diferencia interaural de intensidad Diferencia interaural de tiempo Batidos binaurales 2. Localizaci6n de sefiales no sinusoidales Localizaci6n mono aural: el rol del pabellon auricular Empleo de datos espectrales en la localizaci6n binaural 3. Modelos de procesamiento espacial 4. El efecto de precedencia Refuerzo electroacustico en grandes espacios 5. Percepci6n de la distancia Perspectiva auditiva 6. Percepci6n del movimiento 7. Campos aciisticos virtuales 8. Resumen

191

192

192

192

197

197

197

198

201

202

204

206

206

211

212

214

Capitulo VIII. Percepcion de objetos auditivos 1. Ecologta acustica y analisis auditivo del entomo 2. Informaci6n utilizada para separar los objetos auditivos Armonicidad y frecuencia fundamental. Disparidades en el ataque Contraste con sonidos previos

215

215

216

217

219

219

Correlaci6n de los cambios en amplitud y frecuencia 220

Localizaci6n de la fuente 221

Periodicidad y fusi6n perceptual 223

Percepci6n de secuencias ritmicas 225

Percepci6n del orden temporal 226

Regularidad en los datos ffsicos 226

Redundancia de la informaci6n 227

3. Principios generales de organizaci6n perceptual y teorfa de la Gestalt .. 228

Leyes de la Gestalt 230

Isornorfismo 238

Capitulo IX. Percepci6n del habla 1. El aparato vocal y la fonaci6n El aparato vocal Producci6n del sonido Formantes Caracterfsticas generales de la emisi6n vocal 2. Representaci6n grafica de los sonidos del habla 3. Caracterfsticas particulares de la percepci6n del habla 4. Modelos de percepci6n del habla Teorfa motora Teorfa de los rasgos invariantes Modelo de red neuronal 5. La busqueda de indicadores acusticos invariantes Resistencia del habla frente al deterioro de la sefial 6. Inteligibllidad de la palabra Ensayos de articulaci6n Medici6n indirecta y predicci6n de la inteligibilidad Ayuda visual

239

239

240

241

244

247

248

250

255

255

255

256

256

257

257

258

260

265

Apendices I. Teorema de Fourier II. Principio acustico de indeterminaci6n

267

271

Referencias bibliograficas

275

Indice ternatico

285

--~--

-

-

-----:;::--~--

- -

--- ----=-- - - - - - - - -

-- ­

Presentaci6n

EI arte sonora, las modalidades y generos de comunicaci6n que involucran so­ nido, las tecnicas y tecnologfas de praceso de sonido y rmisica y la investiga­ ci6n sobre percepci6n auditiva, se vienen desarro\lando de manera interdependiente y significativa desde el siglo pasado. Cada una de las areas mencionadas ha impregnado de dud as y certezas a las otras, al participar de un formidable praceso interactive que continua acelerandose en la actualidad. Este libro presenta una exploraci6n de los avances en el campo de la per­ cepci6n auditiva. Su titulo tiene el grado de determinaci6n y de generalidad que requieren tanto el dinamismo como la variedad del campo de estudio involucra­ do. Por otra parte, no puede negarse que su autor ha sido fiel a su triple condi­ cion de rmisico, cientffico y docente, al generar un texto que expone de manera muy didactica y eficaz los resultados mas significativos de la investigaci6n en su area, en una constante realimentacion con la reflexi6n sobre el arte sonoro. Una de las cuestiones medulares de la investigaci6n actual en esta area es la determinaci6n del ambito (ffsico-fisiologico) en el que se \levan a cabo los pracesos de decodificaci6n de la sefial aciistica. En otras palabras: ies el fabu­ loso disefio de nuestro ofdo interno y externo, 0 son los procesos neurales de alto nivel los responsables de que percibamos determinados eventos sonoros de determinada manera? iY si son ambos, c6mo se reparte la tare a y como se explica y modeliza su funcionamiento? ASI es que, par ejemplo, algunos auto­ res (vease Bregman, 1994) hacen referencia a pracesos neurofisiol6gicos de "alto nivel" 0 de "bajo nivel" como responsables de determinadas tareas de de­ codificacion y otros (Malham, 2000), coincidentemente, denominan "comb i­ nacion ofdo-cerebro" al sistema auditive en general. Y por citar un solo ejemplo de este trabajo, Basso escribe en el capitulo VI: "[ ... ] la constancia del timbre s610 puede ser explicada en funci6n de complicados procesos en las etapas superiores del tratamiento neural". Los avances en esta direccion han sido tens ados par la necesidad de invo­ luerar dentro del estudio de la psicoacustica a secuencias sonaras complejas,

15

que van mas alla de los eventos individuales. Se involucran asf, procesos de eventos sonaros de muy variada naturaleza y complejidad, como la percepcion de secuencias de habla (capitulo IX), evaluacion de recintos y localizacion de fuentes sonaras en movimiento (capitulo v), segregacion y fusion de estratos sonoras simultaneos y sucesivos (capitulo VIII), 0, finalmente, los estudios sa­ bre el desplazamiento entre el tiempo ffsico y el fenomenico (capitulo IV). Una de las dificultades que hubo de enfrentar el autar de este libra es la secuenciacion de los contenidos, dada su interdependencia. Es asi que, par ejernplo, en el capitulo referido a la "sonoridad" (capitulo II) se pregunta: "Pe­ ro, zes legitime considerar a la sonoridad como un rasgo autonorno, que se puede estudiar de manera independiente, separada del resto de las caracteris­ ticas que definen un sonido real?" Y que decir del capitulo dedicado al "timbre" (capitulo VI), una de las no­ ciones mas interdependientes y cambiantes en toda la historia del sonido y la rmisica. En su tratamiento, el autor pone en evidencia, adernas, el rol de los aportes de las tecnicas y tecnologias de sonido prapias de la electroacustica: "Los modelos de analisis par sintesis han demostrado ser eficaces para generar conocimiento cientffico y tecnico, reducir la cantidad de informacion necesa­ ria para expresar una sefial aciistica, praducir variantes y modificaciones nun­ ca experimentadas y contralar la prasodia musical en tiempo real. [...] Una descripcion detallada de las tecnicas empleadas contendria la histaria de la electroaciistica durante los iiltimos 60 afios." Por todo 10 antedicho, este libra constituye un trabajo valioso para explo­ rar antes que para simplemente "leer", para que ellectar realice multiples reco­ rridos en los que puede y debe encontrar variados puntos de entrada-salida y de relacion, a despecho de la necesaria secuencia que impone el texto escrito.

Oscar Pablo Di Liscia

16

Prologo

Este libra fue concebido inicialmente como una publicacion interna para un seminario de posgrado que se dicto en el ana 2000 en la Universidad Nacional de Quilmes. Ese arigen explica, en parte, el contenido y la secuencia de los ca­ pitulos. Su objetivo principal es el de exponer los elementos, principios y pra­ cesos que intervienen en la percepcion del sonido. Nuestra intencion no es presentar los temas como si formasen parte de un conjunto de conocimientos definitivos, sino integrar las dificultades prapias de una disciplina en la que los mismos datos experimentales llevan muchas veces a la creacion de modelos ex­ plicativos totalmente diferentes. Quiza la confusion mas habitual en cualquier texto sabre acustica tiene origen en la ambiguedad de la definicion de sonido. Segun el autor a el texto que traternos, el termino son ida se puede referir a un fenomeno ffsico -como una vibracion a una onda en el espacio- a a un [enomeno psicologico, Aquf llamaremos son ida a la representacion mental asociada a la percepcion, y se­ fial acustica al estfrnulo ffsico que 10 origina. La psicoaciistica tradicional es­ tudia directamente la relacion entre las sefiales acusticas de entrada y los sonidos, colocando los pracesos intermedios en una especie de caja negra cu­ yo mecanismo no considera de su incumbencia. La fisiologfa de la percepcion y la neurobiologia, par su parte, se interesan especialmente par los pracesos de transduccion que operan entre la serial aciistica y la representacion mental asociada. En nuestro caso predomina la primera aproxirnacion, pera no evita­ remos mencionar los aspectos fisiologicos involucrados cuando 10 creamos ne­ cesario. El primer capitulo, par ejemplo, esta dedicado par completo a la fisiologfa de la audicion. Este texto esta concebido como parte de un pragrama completo de acus­ tica destinado a music as e investigadores en temas relacionados can el soni­ do. Aunque los aportes de la psicologia y de las ciencias medicas resultan esenciales, nuestra aproxirnacion al tema adopta decididamente la perspecti­ va especffica de la ciencia aciistica. Si bien se supone que ellector esta farni­

17

liarizado con los conceptos basicos de la acustica general, en la bibliografia al final del libro se mencionan algunas referencias para quien necesite refrescar alguno de ellos y en los apendices se describen brevemente dos temas que no siempre aparecen en los textos de acustica habiruales: el teorema de Fourier y el principio de indeterrninacion. Toda vez que fue posible se emplearon los terminos tecnicos en espafiol y en algunos casos las expresiones se presentan tambien en el idioma de origen para facilitar la consulta en la bibliogtafia es­ pecializada. Mi mas sincero agradecimiento al profesor Pablo Di Liscia -director de la coleccion Musica y Ciencia- por el apoyo que le brindo al proyecto desde su inicio, al profesor Juan Pampin y al profesor Emanuel Bonnier-responsable de la realizacion de los graficos. Mi gratitud a los integrantes del equipo de inves­ tigaci6n en acustica de la Facultad de Bellas Artes de la Universidad Nacional de La Plata. Y a los colegas y alumnos que, directa 0 indirectamente, partici­ paron en las charlas y en los innumerables intercambios de correo sobre per­ cepcion auditiva de los ultirnos afios. Sin su estfmulo este libro no hubiera sido posible.

Capitulo I Sistema auditivo periferico y fisiologia de la audici6n

El ofdo -0 sistema auditivo periferico- comienza en el pabellon auricular y Ile­ ga hasta la coclea. Su mision es convertir las vibraciones mecanicas en impul­ sos nerviosos para que sean procesados en el cerebro. Es muy pequefio y delicado y se halla protegido en el interior del hueso temporal. En la Figura 1 se 10 representa esquematicamente. Canales semicirculares Yunque

La Plata, mayo de 2006

Timpano Ventana redonda

~ ~ Conducto auditivo

Dido externo

Dido medio

Dido interno

Figura 1. Sistema auditivo periferico

Para su estudio se 10 divide en tres partes: ofdo externo, ofdo medio y 01­ do interno. Los canales semicirculares; que comparten algunas estructuras ana­ tomicas con el oido interno, pertenecen en realidad al sentido del equilibrio. En este capitulo nos detendremos extensamente en los procesos involu­ crados en la fisiologfa de la audicion, cuyo objeto de estudio incluye la totali­

18

19

dad de los eventos ffsicos y neurales involucrados en la percepci6n del sonido, desde el sistema auditivo periferico hasta la carteza cerebral.' En 10 que sigue analizaremos anat6mica y fisio16gicamente cada una de las partes del sistema auditivo periferico.

Helix

--------"1~

Fosa del helix

Antihelix

\

-----t-t--.­

Concha (plato)

----4-+---r:-+

Crus helias

1. Ofoo

EXTERNO

Concha (cavum) ------\----\,.----\""­ Trago

El ofdo externo, junto a la cabeza y la parte superior del torso, forma parte del sistema receptor de vibraciones que acopla el timpano con el campo aciistico externo. Ademas de protegerlo ante posibles agresiones mecanicas, filtra y modifies las sefiales que le llegan del exterior y contribuye decisivamente en la tare a de localizacion espacial de las fuentes acusticas. Una descripci6n anat6mica del ofdo externo, de adentro hacia afuera, in­ cluye el canal auditivo externo, la concha y el pabellon auricular El canal au­ ditivo extemo es una estructura tubular irregular de aproximadamente 26 mm de largo par 7 mm de ancho y un volumen de 1 crn-, con un eje central sinuo­ so, que conecta el pabellon con el tfrnpano. Su pared esta confonnada por una parci6n cartilaginosa (rnovil) y una 6sea. La parte cartilaginosa, continuaci6n de la estructura del pabellon auricular, es de mayor longitud que la 6sea y es­ ta cubierta par piel con folfculos pilosos, glandulas ceruminosas y sebaceas. En cambio, la piel que recubre la regi6n 6sea del canal auditivo externo, en la parte mas profunda adherida al tfrnpano, es muy delgada. La parte externa del canal auditivo externo se ensancha notablemente farmando una cavidad en forma de taza llamada concha, con un volumen in­ terno de aproximadamente 4 cm '. En la Figura 2 se pueden apreciar una vista lateral y un carte del ofdo externo. El pabell6n auricular (la oreja) es una estructura cartilaginosa que acnia como un filtro direccional de las sefiales que llegan del exterior. Es muy dife­ rente al de otros mamfferos, par ejemplo el de los felinos, que poseen pabello­ nes conicos que pueden enfocar hacia un punto del espacio de manera independiente por medio de musculos de control especfficos. Los efectos del pabell6n auricular (6 em), de la cabeza (22 cm entre of­ dos) y de los hombros (15 cm de ancho) se vuelven significativos cuando las longitudes de onda son comparables con la dimensi6n de las estructuras. El sis­ tema completo puede ser caracterizado comparando -0 midiendo- la presi6n acustica en el campo libre, a la entrada del pabellon auricular, con la presi6n acustica en la superficie del timpano. En la Figura 3 se aprecia la acci6n de fil­ 1

La parte de la acustica que estudia la fisiologfa de la audici6n se denomina fisioacUstica.

20

--------l.......,'r-~',,"\

Antilrago

------+-..>.,-~

Hendidura del trago ------\,.----'

L6bulo - - - - - - - - - T - - +

Figura 2. Vista lateral y corte esquerruitico superior del oido externo

20

iii'

~ 15 0

c: tll



~

10

a;

c: CD

5

SIII

CD

0III CD

"

0

0::

-5 0.2

0,5

0.7

1

2

5

7

1012

Frecuencia (kHz)

Figura 3. Funci6n de transferencia del ofdo externo ante un estfmulo difuso de ruido blanco

21

~------------

tro espectral que produce el ofdo extemo. La transferencia maxima, a una fre­ cuencia de aproximadamente 2.800 Hz, se debe a la resonancia del canal au­ ditivo externo. La compleja forma de la curva se debe ala concurrencia de los fenome­ nos de reflex ion, difraccion y resonancia en diferentes partes del ofdo exter­ no. Como curiosidad, en la figura 4 se reproduce el experimento de Goode, en el que se compara la transferencia de un ofdo normal con un modelo en el que el tfrnpano queda a ras de una esfera, como ocurre en el caso de algunos sau­ rios (Goode, R. L. et al., 1994): es evidente la compleja accion espectral del oido extemo sobre las sefiales que le llegan del exterior. En el capitulo sobre percepcion auditiva del espacio nos detendremos a estudiar con detalle este efecto y sus consecuencias.

te en calibrar los auriculares en su posicion de uso en un ofdo real. Primero se mide, con un microfono muy pequefio colocado dentro del canal auditive, la presion sonara provocada par una fuente acustica de espectro plano alejada de la cabeza del ovente (campo libre). La sefial en el microfono corresponde exactamente a la funci6n de transierencia -0 HRTF- de ese ofdo externo en par­ ticular.i La curva de transferencia obtenida se reproduce en el ofdo ecualizan­ do la salida del auricular en posicion de uso. De este modo se puede lograr la misma respuesta espectral que en el campo libre para cada pareja auricular-of­ do. Como el procedimiento es complicado, se ofrecen cientos de curvas HRTF ---que se pueden obtener, par ejemplo, en intemet- que cada usuario escoge de acuerdo a su tipologfa particular. Una de las caracterfsticas mas notables de la audicion a traves de auricu­ lares es la excelente respuesta en bajas frecuencias, imposible de conseguir con los mismos auriculares ubicados en el campo libre, lejos de la cabeza del oven­ teo Este efecto se explica par la diferencia en el acople acustico entre ambas situaciones. Con la fuente en el campo libre acnia el filtro del oido externo en toda su capacidad: la energfa de baja frecuencia llega atenuada al tfrnpano pues difracta alrededar de la cabeza. Cuando se coloca un auricular se cierra la cornunicacion con el campo libre y se crea una cavidad estanca compuesta por el volumen intemo del auricular mas el volumen intemo del ofdo externo. En la figura 5 se puede ver este caso. EI volumen es ahora constante y posee unicamente dos superficies mo­ viles, el altavoz del auricular y el tfrnpano. Cualquier desplazamiento neto del altavoz se va a transmitir Integramente al timpano amplificado por la re-

Audici6n con auriculares Cuando los estfrnulos se presentan a traves de auriculares las caracterfsticas del campo libre son reemplazadas por la interaccion entre el auricular y el of­ do externo del oyente. Esta interaccion incluye efectos propios de la mecani­ ca de ondas que son muy diffciles de controlar, especialmente a altas frecuencias. Un metodo que permite acoplar con precision el sistema consis­

""

10 ,...

E

Oldo completo

~ 0

"'

""

Limite teorico

""

I..2I4rc

""

1

.2

'0 0 c.

E ltl o c Cll c 0() .~

0

«"'

""

""

......

-l +10

0

"

o

-10

0,1

-E"' Cll Qi

.0

'0

TI mpano con esfera

Area del altavoz

Cll

Cl

- ----........

...

~

-20

0,01

I

~

Area del timpano

.0

0001

~ 0,2

Volumen constante

130 I

I

I

I

0,5

1

2

5

10

20

Figura 5. Acople entre un auricular y el otdo extemo

Frecuencia (kHz)

Figura 4. Cornparacion entre las funciones de transferencia de un otdo completo y de un timpano adosado a una esfera

2 Head

related transfer functions

22

(HRTF).

Este tema sera estudiado en detalle en el capitulo VII.

23

t'r

_

--laci 6 n entre sus a reas , 4: 1 a fa vo r de l a ltavoz en un caso pro rned io . Di ch a t ra n smi sio n es indepen d ien te de la frec ue nc ia, pue s ac nia co mo una pre nsa n e urna ti ca y ex p lica la no tabl e ef icienc ia en ba jas fre c uenci as de l siste ma. Larnentablernenr e, el d isposit ivo de ajuste estanco qu e perm ite tan bu en rendirnien ro e n gra ves es uno d e los factores q ue co nvie rte a los aur icula res en ca usa potenci a l de hipoacu sia por rui do , so bre re do si se los usa in co rr ec­

5,1

5,1 --­

/

rarnent e.'

3,5 4 ,4

2. 0[00 MEOIO El ofdo med io permi te aco plar las sefiales ac ustica s en tre el ca na l a udi tive y e l ofdo interno. Ocupa un a cav ida d en el hueso te mporal denomi nada ca ja tim ­ panica y esra co ns t it uido pa r el t frnpano, la cad ena de hu esec illos -rnartil lo , yunqu e y estr ibo- co n sus ligamen to s y museulos de co ntrol, la tro mpa de Eus­ taquio y las venta nas o va l y red onda, que 10 co m un ican co n e l a ida inter no ." S u pr inc ipa l fun c i6 n es la de perm itir qu e las vibrac iones ac iist icas llegue n a la c6 clea ca n sufic ien te energfa. S i las sefiales llegasen direct arnente al ofdo inte rn o a traves de la ven ta na oval, cas i toda la ene rgla se reflejaria a ca usa de la d iferen c ia entre las pro piedades mecanicas del rned io ae reo ex terior y de l medi o ltquido de la coc lea . En los vert ebrados terrestr es el oido medi o ac t ua co mo un siste ma de acople q ue adapra a mbos med ios, permiti en do una efec­ tiva transferenc ia de ene rgla. T ecni carnente, es un ada pta do r de impe da nc ias y co mo tal 10 ana lizaremos mas adela nte.

Figura 6 . Vibrac ion relat iva del rfrnpano ante una exc itacion de 52 5

Hz y 121 d B

Martillo Yunque

Timpano

Estribo

Figura 7. C aden a de h ueseci llos del old o med ia

T frnpan o El tfrnpan o es un a membran a se m itranspa rente co n for ma de co no co n un a su­ pe rfic ie prom ed io de 0, 6 c m/ . A causa de su geornetr fa irregu lar y al ancla je so lida rio de l manubri o de l rnart illo, e l tim pano vibra co mo una co mpleja membran a e las tica no horn oge nea. En la figur a 6 se aprec ia su respu est a an te un esnruulo sin uso ida l de 525 H z. Se destaca ni ti damente la forma del area de co n tacto co n e l manubri o de l rnarrillo.

3 A lgun os de los fac tores que aurnen tan el riesgo de hip oacusia son el usa de auric ulares en

arnbien tes can gran ni vel de ruido de fond a, par ejemp lo la vfa publica, y el emp leo de arn­

plificadore s de audio de baja ca lidad, can der iva estatica y alt a porcenraje de "ru mb le" (rui­

do de muy baja frecu enc ia) .

4 Esra estruc rura es sim ilar a la de casi rodos los verrebrados te rrest res. Las especie s que no

posee n memb rana rirnpanica, com o las salaman dras y las serpien tes , son la exce pcio n .

24

Figura 8 . Fotografla del estr ibo

25

Cadena de huesecillos

La impedancia es un a magnitud que permite evaluar la resisten cia al movi­ miento de un siste ma . En nuestro caso se verifica que la impedanci a ac ustica en el tim pano es mucho menor que en el oido interno . Veam os el proceso en der alle. Con la excepci6n de las frec ue n cias m as al­ tas, por en cima de 5 kHz, la dimension transversal del ca nal aud it ivo ex terno es pequefia fren te a las longitudes de onda y, por 10 tanto, la presion sonora re­ sulta aproximadarnente co ns ta n te sobre el are a del tim pano. En este caso la interaccion ac ust ica puede desc ribirse en terrninos de dos va riables: la presion sonora en el tfrnp ano Pr y su veloc ida d de volumen U T . EI mov irnien to del rfrnpan o se transrnir e a crav es de la cade na de huesecill os a la ventana oval. A quf tarnbien la interac cion ac ustica puede de scribirse a partir de la presion sonora en la ven ta na ova l Pva y su veloc idad de volurnen U va . En la Figur a 9 se ve un esq ue ma m uy simplificado del sistema de transrnision . En un a pr ime ra ap rox imacion , la cadena de hu esecillos ac t ua como un sis­ tema de pa lancas. Para vibrac iones de amplitud moderad a, el estr ibo ejerce un a fuerza 1,3 veces m ayor sobre la ventana oval que la qu e ejerce el timpan o sa bre el martillo. C om o el area de la ventana oval-amos 4 mrrr-- es mucho rnenor que la del tfrnpan o -de alrededor de 60 mrrr-- en ella puede aplicarse un a presi6n hasta treinta veces mayo r que en el tirnpano, Y como la intensidad es funci on del cuadrado de la presion, la diferencia de intensidad puede llegar a ser de mil

Las vibraciones del timpa no se tr ansmiten hacia el oido interno a tr av es de tres pequefios hu esecill os: el rnartillo, el yunque y el estribo. EI martillo posee una parte prominente, el manubrio, que se inserta entre las lami nas de la membrana timpanic a, A su vez, el m artillo y el yun q ue estan co ne c tados e n ­ tre sf y a la pared 6sea por med io de ligamentos. EI yunq ue se vincula co n el estribo a traves de otro ligam enro, y el pie del estribo se conecta po r me di o de un ligarnento an ula r a la ve n ta na oval. Dos miiscu los co n t ribuyen a soste n er los huesecillos y permiten co nt ro lar la rigid ez de la cad ena osicular. EI tensor del tfmpano es ra ligad o al martillo y el estapedial al estribo . Ta l co mo ve re mos , estos museu los funcionan co mo un co n tro l de gana nc ia va riab le del o fdo medi o. Cavidad tirnpanica y trompa de Eustaquio La trompa de Eustaquio, que co n ec ra el otdo medio con la cavidad n asofarfn­ gea, es un conducto de paredes blandas q ue esta cerrado la mayor parte del tiempo y que se abre al tragar, masti car 0 bostezar. Su funci6n es la de perrni­ tir la ecualizacion de la presion est atica a ambos lados del tirnpano . Gracias a este mecanisme el ai re en el interio r eje rce la misma presion que la atmosfera desde el exterior. Se resuelve asf la parad oj a que inquiere por que la presion atmosterica, de un valor supe rior a los 100 kP a, n o se oye mientras q ue un a se­ fial aciistica de s610 20 Pa nos resulta de una in te ns idad in to lerable . La res­ pues ta es sen cilla: la presio n atrnosferica , prac ticamente estatica, no mueve al tfmpano pue s se ej erc e Con igual valor en sus dos ca ras gracias a la ace ion de la t rompa de Eust aquio. La presion dinami ca, qu e vibra a frecuenci as supe rio­ res a 16 H z, se aplica con facilidad so bre la ca ra ex te rna del tfmpano pero lle ­ ga co n dificulrad a la ca ra interna, aun co n la trompa de Eustaquio a bierta. La diferenci a de presiones d ina rnicas se trad uce en un mo vimiento efec tivo de l tfmpano y de la cad ena de h ueseci llos .

-

Musculo del estribo (stapedius) Estribo . Ventana oval

Pared del

canal(6 se~ Membrana basilar

Membrana de la ventana redonda

Canal audi tivo

Funcion aciistica del aida media

.,.

Membran a tirnpani ca

La funci6n principal del oido me di o es tr ansmitir Ia mayor cantidad de ener­ gfa desde el canal auditivo ex ter no h ast a la coclea, Para lograr este fin la ca­ dena de huesecillos debe ada ptar la imp ed anci a del sistema timpano-aire con la del sistema ventana oval-perilinfa. C om o ya sefialamos, si las ondas acusticas pasasen del tfmpano a la ventana ova l, casi toda la energfa se refle jar fa por la gra n diferencia de impedancia ex iste n te e nt re los dos medios de propagacion.

.--' -::::as

Trompa de Eustaquio

Pared del canal

(cartilagi nosa)

Figura 9. Esquema del sistema de transm isi6n del a Ida media

26

27

...............

-veces, equivalente a una ganancia de unos 30 dB. En realidad, el movimiento es mas complicado que el de una simple rotacion y el manubrio del martillo no se mueve como un cuerpo rigido a altas frecuencias. En la Figura 10 se puede apre­ ciar la curva real de transferencia de presion entre el timpano y la ventana oval. En la tuncion de transferencia se ve que se obtiene una ganancia de 20-30 dB en el rango medio. La variacion espectral de la curva demuestra que la cadena de huesecillos no actua como una palanca lineal. En cuanto a la transferencia nera de potencia, se considera que en el of­ do medio se pierde alrededor del 50% de la energfa: al menos la mitad de la potencia recibida por el timpano no llega al ofdo interno.

10

co

"0

~

'6

0

OJ

E

a

"0

'0

-10

CD

"0

<1l

> ~ ~

-c- 500 Hz -20

.

<1l

:<2 if)

Alteraciones en el sistema de transmision del aida media

40

30

iO ~

20

Q ~

a

a:

10

0

~ 0,1

0,5

5

10

Freeueneia (kHz)

Figura 10. Funcion de transferencia de presion entre la venrana oval y el timpano

28

Hz Hz

-30 -20

Una alteracion frecuente en la ganancia del sistema de transmision se da cuan­ do la trompa de Eustaquio permanece cerrada y la presion atmosferica varfa rapidarnente, por ejernplo en el interior de un avion mientras se presuriza la cabina, 0 al sumergirse a varios metros de profundidad en el agua. La diferen­ cia neta de presion estatica curva al tirnpano, aumenta la tension mecanica de la membrana y modifica la capacidad de transferencia de energfa del ofdo me­ dio. Por ejemplo, una diferencia de 1 kPa -que equivale a una columna de 10 ern de agua 0 a 0,01 atm- produce cambios detectables en la sensibilidad au­ ditiva. Como se puede apreciar en la Figura 11, la profundidad del efecto de­

1000 Hz

-A- 2000 -0- 3000

Cii

I -10

I

I 0

10

20

Presion en el aida media (em H 20)

Figura 11. Variacion de la transferencia de energia del oido medio en funcion de la presion estatica

pende de la frecuencia y genera la sensacion de sordina que experimentamos al tener los oidos "tapados". Otra Fuente de variacion en la ganancia del sistema la aporta la accion de los musculos de ofdo medio. Estos musculos se contraen, en una accion deno­ minada reflejo aciistico, ante estfrnulos acusticos de gran intensidad, antes y durante la fonacion y, en general, durante los movimientos corporales de me­ diana y gran amplitud. El estapedial es de accion rapida -el reflejo acustico aparece entre 10 y 20 ms despues del estfmulo- mientras que el tensor del tim­ pano responde mas lentarnente -rarda unos 100 ms en activarse. El retardo del sistema de proteccion 10 vuelve ineficaz cuando el estirnulo es de tipo impul­ sivo, por ejemplo el estallido de un petardo. Los dos musculos combinados 10­ gran atenuar la sefial alrededor de 20 dB. Como se puede ver en la Figura 12, el reflejo aciistico no posee respuesta plana y su efecto es mayor a bajas fre­ cuencias. La supresiori patologica del reflejo aciistico tiene, entre otras, las siguien­ tes consecuencias: 1) disminuye la discriminacion del habla a altas intensida­ des, 2) incrementa la perdida de audicion ante estimulos prolongados de alta intensidad y 3) aumenta el enmascaramiento simultaneo. El dane audiologi­ co provocado por el uso inadecuado de auriculares es similar al inducido por la supresion patologica del reflejo acustico, Es interesante marcar que la funcion de transferencia desde el pabellon auricular hasta la ventaria oval define casi completamente la inversa de la cur­

29

..

m~~

I

, "

I

m

:2- -2 c '00

,),,,,, ,

,

~~:~ : 're, l

Superior

Posterior

Lateral

-0

'E

-4

(fJ

c

jg

-6

~

c Q)

0

Ventana oval -8

<3

_\~

Vestibula

:.0 E

Ventana redonda

-10 -12

~ 40 0 500

800 1000

2000

Figura 13. Esquema dellaberinco oseo

Frecuencia (Hz)

Figur a 12. Reflejo actistico en funci6n de la int ensidad del estfmulo

va de sensibilidad audi ti va en el ser hu mane (en la figura 30 de este capitulo se puede ver la curva de transferencia comp leta) . A partir de este pun to el pro­ ceso completo parece cornpo rta rse de manera lin eal. Los est trnulos que llegan por la ven tana oval produ cen los mismos patrones cocleares que los que lle­ gan por via osea, aunque arnbas fun ciones de transferen cia difieran n otable­ mente en tre sf.

3. Otto

lNT ERNO

El oido interne es parte de un a ca vidad irregular del hue so temporal que reci ­ be el n ombre de laberi n to oseo y comp rende el vest ibule , el caracol y los ca­ nal es semicirculares. Sus paredes estan forrnadas por hue so recub ierto de epi teli o y cont iene un lfquido acuoso parecido al liquido amn iot ico. G ran par­ te del espac io in terior esta ocupado por un siste ma de finos cond ucto s y sacos que const itu yen una segunda capa, de paredes tapizadas por tej ido conecti vo blando, llarnado laberinto mernbranoso. La porc i6n del laberin to 6seo que si­ gue a la ven ta n a oval se denom ina vestibule , que a su vez esta dividido en dos partes, elutrfcu lo y el saculo. Mientras la base del est ribo cubr e casi comple­ ta rnent e la ven tana oval, la venta na redonda se halla recubierta por una del­ gada membr an a de te jido conectivo. Un estrecho can al cond uce del saculo al conducto coc lear, situ ado en el interior del caraco l. El conducto coclear, tam­ 30

bien conocido como caraco l mernbran oso, forma un a espira l de dos vueltas y media de tejid o conect ivo que sigue el desarrollo de la espi ral osea del caracol. Ellaberinto esta inervado por el nervio audit ive -octavo par crane al- que en su interior se divide en dos ramas: el ne rvio coclear, que es el nervio vinc u­ lado a la audicion, y el nervio vestibular, que perte nece al sent ido del equilibrio. En la porcion centra l del laberint o estan los canales semicirculares, q ue poseen celulas recept oras y cr istales de calcic que responden a la gravedad y a la aceleracion, informando al ce rebro sobre la posicion y el movirnien to de la cabe za. Son tres conductos semicirculares orien tados en cuadratura segun las tres dirnensiones espaciales. A l mover la cabeza se prod ucen mov imientos re­ lativos ent re el lfqui do y los crista les de ca lcic en suspension que est imulan a las ce lulas sen sibles q ue tapizan el tejido int erior de los cana les. As \, ade rnas de las estru cturas pro pias del sentido de la aud icion , el labe rinto oseo con tie­ ne tam bien los organos del sen tido del equ ilibr io. El tarnafio de los elemen tos del ofdo int em o es ext raordinariamen te peque ­ no. La base de l caraco l mide men os de 9 mm y el diamet ro del cond ucto que for­ ma la c6clea es de alrededor de 1 mm en su part e media, estrechand ose a medida que se acerca al vert ice. En su interior, el con ducto coclear -t-O scala media- es aun mas pequefio, ya que la coclea esta dividida en tres part es 0 scalas como se puede ver en la figura 14. La membrana basilar (MB) sigue la forma en espiral de la c6clea y forma el piso del conducto coclear, En su desarrollo describe dos vue 1­ tas y media y, totalmen te extend ida, mide alrededor de 35 mm de largo. En la mem bran a basilar se enc uen tra el organo de Cort i, qu e cont iene las cel ulas ciliadas responsables de con vert ir las vibraciones mecani cas en impu l­ sos ner viosos. Duran te much o tiempo se crey6 que la coclea era unicamen te

31

I

fl '"

Scala Vestibull (perdinfa)

Hueso

'-t": ,I'

~S~~(~:~d O ~

:.

\'\1" .'l '~\ ,I r'""..: .

I ,.

I ' I •. '

I

}

Capsula de una celula ganglionar

. ... '," , I •• ,

r;r.n' · · \ · ·I · \·\.\'r,: \ j)' - ,

~""

Figura 14. Cone transversal de la c6clea en su parte med ia

un 6rgano receptor que procesab a las sefiales acust icas pa ra tran sforrnarlas en pot en ciales electricos e impulsos nerviosos. Hoy sabe mos, grac ias a numerosos estu dios, como los de Kem p y Zwicker, que tarnbien posee prapiedades rnot o­ ras que Ie ot organ la cap acid ad de act uar sobre las seriales que Ilegan desde el ex te rio r. Fisiologia de la coclea El movimien to de la cadena de hu esecillos del o ldo me dio se ap lica a tra ves del estribo a la ventana ov al. C omo el laberi nt o esta Ileno de llquido y sus pared es son oseas, el conjunto resul ta pr act icarnente inc ompresible. El mo­ vimi ento del estribo seria poc o menos que nulo de no existir la ventana re ­ don da, que permite que el volumen de llquid o en la coclea se mantenga co ns ta n te y que, por 0 tanto, se compensen exacta me n te los movimientos net os de la ventana oval y de la ventan a redonda. La energia acustica Ilega en to nc es a la c6clea que, como se puede ver en el co rte de la Figura 15, esta di vidida en tres compartimientos. La scala tympani co m ienza en la ventana ova l y esta Ilena de perilinfa, un llquido rico en sod io. La scala vestibula na­ ce en la ven ta na redonda y se comunica con scala tympani a trav es de una ab ertura , el helic otrema, que permi te el paso de l liqu ido perilinfa t ico en el extre me superior 0 apex del caracol. Entre ambos co nd uc tos se enc ue n tra la scala media 0 co nd ucto coclear, qu e esta ais lado de los an te riores par la mem­ bran a basilar y por la membran a de Reissner y qu e co n tiene endo linfa -un llquido viscoso rico en potasio . Como la membran a de Reissner es mu y li­ 32

t .:" .

. ·. 1 ~ . . ~ •• ,rl,. I, . ~ .. I

I

"'f ~

I'J "'

M b to :-";' :::s-.; Fibras nerviosas • em lana basilar , - '~ " ." " : ': Ganglios " , -, \ ~' " ; . espiralados Tt' nel de Corti lIgamento : ' ,, '" . Neuronas coclea res esp iralado \ ';, Sca la Tympanr " ,: (perilinfa)

~'"

v. : -.':

Figur a 15. Deta lle del co nducto coclea r

vian a y delga da n o acnia mecan icamente sobre el movi miento de los fluidos cocleares. Su funci6n principal es la de sep arar la endo linfa de la perilinfa para ma n ten er una diferencia de potencial e lectrico de un os 80 mV en tre am bos medios. La membrana basilar es un a membrana elastic a en la que se ubica el or­ gano de Corti, Posee alrededor de 3.500 celulas ciliadas intemas dispuestas en una fila y de tres a cinco filas con apro xim adamente 25 .000 celulas ciliadas ex­ ternas en cada oido. Tal como ver em os, las celul as internas son aferentes -en­ vlan informa ci6n al cerebra a trav es del nervio aud itivo- y las celulas externas son efere n tes -reciben impulsos nerviosos desd e el ce rebra. La membrana tee­ t6rea cubre las estereoc ilias de las ce lulas c iliadas ayudando a su excitacion rnecanica. En la Figura 16 se puede ve r una image n del organo de C orti torna­ da co n un microscopic elec tr6nico de barri do ,

6 rgano de Corti El ogano de Cort i es una co mpleja estruc tura co rnpuesta, en tre o tros elem en­ tos, por ce lulas nervi osas tran sductoras, ce lulas de sopo rte y fibras ner viosas. 33

pi

m

II

I~

Hendidura de Hensen

Zo na limbica

Figu ra 16. Im agen del 6 rgan o de Co rti tornad a ca n un mi croscop ic elcc t ron ico de barrido. I , Z y 3: ce lulas ciliadas exre rn as; eel: celulas c iliadas intern as; TC: run el de Cort i; ~ 1I1 : mem bran a basilar

Las celulas ciliadas son ne uro nas alta rnente especi a lizadas y se d isponen en dos arcos separ ados po r el t un e] de C orti. En el arco exterio r se agrupa n un as 25.000 ce lulas ci liadas externas , ca da un a con ce rca de 140 est ereocili as in terconectad as En el otro arco h ay ce rca de 3.500 celulas c iliada s in te rrias, cada un a con alrededo r de 40 estereo cilias in te rco nectadas. La membran a tee­ tor ea c ubre las celulas de Cort i )' se sabe q ue en tra en co n rac to co n las este ­ reoc ilias de las ce lulas exte rn as, pero ac t ualmen te se d iscute si tambien lo h ace co n las de las ce lulas in ter n as. Las celulas de sopo rte proveen apo yo estructural y me tab oli co a las celu­ las ciliadas, Se pueden d ividir en dos grupos : el de las ce lulas con filarne n tos y rn icr o nibu los q ue co n t ro lan la rigide z de la me mbran a basilar y q ue son en parte respon sables de la d istr ibuc ion espacial de la frecu enc ia de reson anc ia a 10 largo de la membrana; y el de las ce lu las q ue poseen o rgan ulos ca paces de sin tetizar las prot ein as y de t rans po rtar los ion es n ecesa rios para el me tabolis­ mo del organa de C o rt i. El o rgan a de Cort i se vinc ula con el sist ema nervioso ce nt ral por med io de dos t ipos de fibr as nerv iosas: las aferentes lle van informacion desde el o ldo inte rn o h aci a el ce re bra y las eferentes 10 h acen en el sen t ido co n tra rio, desd e el ce re bra h aci a el o ido inte rne. Exi st en dos tipos de fibr as afere n tes . Las del t ipo I co ns t ituye n el 95% del to ta l y contac tan uni carnente a las ce lu­ las ciliadas interri as, mientras qu e las del ti po II - el 5% rest ante- se co nec tan

34

Zona media

Zona marginal

Fi gur a 17 . Celulas senso riales y de sopo rte e n el 6 rgano de Cort i. A: pilares internes; E: pil ares ext ern os

con las celulas ciliadas externa s. Cada celula intern a se co m unica co n alrede ­ dor de 20 n eu ronas afe ren tes de tip o I y cada ne urona aferen te de tip o II sc re­ parte entre va rias ce lulas ciliadas cxte rnas, En ca rnb io, las fibras eferen tes qlll par ten del ce reb ra se co ne ct an solo co n las celulas ci liadas ex ternas , aun qu e algunos in vest igador es supo n en q ue plied en turnbien ac tua r, aunque inclirec ­ tarnen te, sobre las ce lulas internas. El punto de co n tac to a tr aves del cual la informacio n pasa de un a n eur o­ n a a o tra se denom in a sina psis, La sinapsis ent re un a ce lula ciliada y un a fibr a afe ren te se ca rac te riza por un ade lgazarn ie n to de la mem brana celular Y la pre­ sencia de pequefias vesicu las en la celula c iliada q ue co n tiene n las susta nc ias q ufm icas ne cesari as para tran smitir la serial. Por el co n t ra rio , en la sinap sis en ­ tr e un a fib ra eferen te y un a ce lula ciliada las ves iculas se en cuen t ran en la fi­ bra tr ansm isor a.

Celulas ciliadas Existe n dos clases pri ncipales de ce lulas c iliadas , las in te mas y las externas, q ue difieren notablernente e n tre sf. Las ce lulas c iliadas internas ticn en forma globular ca n el nu cleo ubi cado en el centra y es tan sopo rt adas lateralmen te por ce lulas de soste n , La parte in fe rio r de cada celula interna esta en co n tac­ to directo ca n las fibras ne rv iosas q ue se proyect an hacia el sistema n er vioso

35

Endolin fa

Fibras eferentes

\

Perilinfa

Ficura J8 . C elulas ctliadas m ternas y externas

ce ntral. C o mo las fibras aferentes q ue parten de las celulas in tc rnus fo rman el 95 % de las fibras afere ntes del ne rvio a ud irivo , se supo ne que est as acui a n co­ mo los recep tores pr imarios de la c6 clea al converti r los mo vim ien tos mcc ri­ nicos e n impul sos n eurales. Las fibras eferen res, q ue llevan informacion desde el ce reb ro hac ia el organo de C o rt i, esta n en co n ta c to con las fibras nfere n rcs pe ro n o co n las ce lulas ciliadas int ern as. Las ce lulas c iliada s ex te rn as son largas V de fo rma cilfndrica, con el rni ­ cl eo situ ad o en su parte infer ior. Mas de cu at ro veces mas n urner osa s 4 11 C las celu las in ternas, fo rman de tres a c inc o filas a 10 largo de la mem bra na basilar. Se hallan en con tac ro d irecto tan to co n fibras aferen res como eferen tcs. Du­ rante la esti mu lac ion co n tension elec trica , las ce lulas ex te rn as se ac o rtan y alargan a un a frec uencia esrable. A ra iz de esta capac ida d motora sc h a sugc­ rido qu e so n las responsab les de los procesos co clea res ac t ive s, qu e inc luycn la ca pacidad de sint onia de ban da angos ra V la generac i6n de cmis iones otoac iis­ t icas. C omo exis te n ce rca de 1.800 fibras n erviosas eferente s qu e lle vun in for­ mac i6 n hacia la coc lea desde el co mp lejo o livar superior, se suponc q ue e n las primeras e tapas del ana lisis audit ivo perifer ico ac t uan centros elevad os de pro ­ cesam ien ro V cont ro l.

Proceso de transducci6n en las celulas ciliadas intemas

Figura 19 . Trcs mas de ce lulas c iliadas ex ternas tornadas con un microscopio clectron ico

d<: barrido

36

La peri linfa, rica e n sod io, es similar a los fluid os q ue oc upan c l espac io exte­ rior a las cel ulas del orga n isrno , rnientras q ue la endolinfa, con un a gra n co n ­ centrac i6n de potasio, se ase meja al medio llquido interior de las celulas, Dada su ubicaci6 n en la membra na basila r, las ce lulas del 6 rgano de C urt i esnin ex ­ pues tas a la en dolin fa en su parte supe rior V a la peril infa e n la in fe rio r, co n un a difer enc ia de po ten cial de alred edo r de 80 mVe nt re a mb os ext re mos. Du­ rante la esrim ulac ion ac ust ica el mov irniento de la membrana basila r se t ran s­ m ite a traves de diferente s clases de ce lulas de sopo rte, en uni o n solida ria co n las celulas sen soriales. Las este reoc ilias de estas ultim as se mueve n cn t re la membran a bas ilar V la masa gelat inosa de la membrana tec tore a, cxc itando mecanicarnente las ce lulas ci liadas e inic ian do el proceso de rran sd ucc io n en­ tre vibrac i6 n e impu lso nervioso. Todas las este reoc ilias d e un a ce lula estrin uni das e n tre sf. Se supon c q ue . co mo est as son n gid as V pivo ta n sobre SLl base, el rno vim ien to ell una d irec­ ci6n abr e canales se lec tivos de ion es a traves de los qu e fluyen iones de pour­ sio hacia el in teri or V la celula se despolariza. La corr iente ioni ca, qu e fluve de sde la escoui media hacia e l in te rior de las cel ulas ciliadas in rernas, esr;i 111 0 ­ du lad a por la deflexi6n de l haz de este reoc ilias en rel ac i6 n co n un cje de ma­ xi ma sensib ilid ad.

37

I

Excitacion

lnhibicion

Figur a 20. Deflexion de la estc rcocilias en una ccl ula ciliada int ern a

Los rnov imie nt os en d irecci6n de la fila mas alta pro vocan un aume n to en la conductancia del sistema y los qu e van en sen t ido co ntrario la dismi n u­ yen, mientras q ue los movi mient os or togo na les al eje no la alte ran . La eo ­ rricnte ionica esta constituida pr inc ipa lmente por iones positiv os de pot asio (K +) pues su concentracion en la endo linfa de la scala media es mu y alta. La transd ucci on en las ce lulas c iliadas es no lineal. Los desp lazarnien tos sirnetri­ cos del h az de este reocilias desde la posicion de rep oso , de la misma rnagn itud pcro en sentidos opuestos , gen eran cambios de oonduc ta nc ia asirnetricos . Inrned iat aruente despues de un disparo la celula c iliada inte rna en tra en un estado refractario, en el eua l se rea justa quimicamente, de una durac ion apr ox irnada de 1 rns. N o podra disparar nuevamente h asra h aberlo supera do . En la figur a 21 se pued e ap reciar el co rnpo rtamiento temporal de un a celula de Cort i durante un disp aro .

El pe rfodo refracrario de una celula es muy grande en relaci on co n los pe­ riodos caractertst icos de las seria les ac usticas: un a sola ce lula es incapaz de eap turar la variacion temporal, pu es no puede seguir con suficiente velo cid ad sus ascensos y caldas, S in embargo, las celulas c iliadas in ternas pu eden respon­ der ante ciertos va lores de la forma de ond a de l est frnulo. S i varias ce lulas d is­ paran ante la misrna sefial a d iferen tes niveles 0 fases, el con jun to de la infor macion pe rrni te reconstruir la for ma de onda origina l aunque esta posea un a frec uencia mu y elevad a. La infor macion de fase del estimulo rarnbi en es codificada en el pa tron te mpor al de di sparo de las ce lulas c iliadas in tern as, Los in tervalos entre dispa­ ros son, apr oxirnadamente, mu ltip los enrerosdel periodo del estimulo. U na celula aislada no d ispara ne cesar iarnen re en cada ciel o del estf mulo pero, cu an do oc urre, 10 h ace siemp re a la misma fase de la forma de onda. El patron temporal de d ispa ro de un grupo de ne uronas con tie ne in for maci on cla ra so­ bre el perfodo de l esti mu lo porque ex iste siempre algun d isparo en cada cic lo del mismo. En la figura 22 se ve que el interva lo entre disparos es siempre un multiple entero de l perf od o de la serial de en trada . La sen sib ilidad a la fase desapare ce por enci ma de 5 kHz. El lfrnite supe­ rior no est a de te rm inado por la rasa maxim a de d isparo de las neuronas, sino po r la prec ision co n que el imp ulso ne rv ioso "enga nc h a" una fase part icul ar del esnrn ulo . A 5 kH z la vari abilidad estocas tica de eng anche es comparable co n el perfodo de la onda.

120

j

50

o

.z

--,----

A

-

-----,

120

B 850 Hz 178/5

f 20

60

60

60

C 1.000 Hz 182/5

11

.----- . • . •••-. -- - Nivel del pica

••. . .• ••


o

oI

II

~

I

iii ~

ro

c:

10

15

20

0 0

Q)

5

10

15

20

0

0

5

10

15

20

-~ Q)

u

ro

'13 -50 cQ)

e 120

Potencial postsin apfic o excitatorio

Q)

120

o

E

'J

o a.

1.500 Hz 234/5

z

-40 -30

E K+

-20

-10

0

1

2

3

4

6

Tlernpo (ms)

Figu ra 2 1. Diferenc ia relati va de pot en cial entre el int erior y el exterior de una neuron a especializada ante un pot en cia l de accion variable

o

o

10

E

60 ~

60

·100

38

-

40 6 Hz 72/5

E NA++ •• . •... •.

> -S

r'- --

15

20

120

2 .000 Hz 178 /5

F 2 .300 Hz 83 /5

60

o~ 0

I

5

10

01. ... 0

I t . . . . . . ,,Ia

5

. 10

Duracion del interva le (ms)

Figura 22. Int ervalos int erdisparo para una neurona aud itiva ant e estfrnulos de diferent es frecuen cias

39

Mu chos in vest igador es ace p ta n q ue n uest ra habilidad par a localizar sorii ­ d os dep ende en pa rte de la co m pa rac ion d e la info rm aci on te mpo ra l de lo s dos oidos: pero la rel evanci a de la informaci on tempor al en e l enrn ascaramien to y e n la pe rcepci o n de la a lt ura to n a l es tod avia de batida aca lo rada mente , tal co ­ mo verernos mas adelanto.

Sinapsis dendrita-dend rita

Proceso de transducci6n en ws celuws ciuoaos extemas En L98 3 Bro wn e ll d escubrio q ue las ce lulas c ilia das exte rn as a islad as p ued en ca rnb iar de lon gi tud ante un ca m bia en el potencial e lec trico d e po la rizac ion (Brow ne ll, W . E., L985 ). A pes ar de que e l mecan isme n o se con oce en de ta ­ lle , se supone qu e e l est imulo efectivo 10 provee una va riaci on en e l po tenc ia l en la mem brana ce lular y no , co mo en el caso de las ce lu las c iliadas in ternas, un a corriente io riica. El ca rnb io de longitud to ta l se logra sumando los ca m­ bios geomet ric os d e gran cantidad de estructuras senso rno ro ras ind epend ien ­ tes a lojada s e n e l p lasma de la membrana celu lar. La mem brana de las celulas c iliada s ext ern as posee gra n cant ida d de mitocondrias adyace n tes q ue le per ­ m iten transfor ma r las mo lec ules orga n icas par a o btener la en e rgfa necesa ria de acuc rdo a l c iclo de Krebs. Las ce lulas ciliadas externa s ac tuan como pequefios mu scul os q ue agrega n e ne rg fa rnecani ca a la o nda progresiva en la membrana basila r. S e cree q ue la (race ion de ene rg fa agrega da p uede ser controlada por los ce ntros elevados de procesam ienro a t roves de la informaci on qu e v iaja por las fibras efe re n tes de l n er vio auditive . Acnian co mo un a "resistenc ia negati va" qu e co rnpensa la ene rz fa pcrdida e n e l proceso de vib rac io n , Este co ntro l de gan an cia tam bien pu cd e redu cir la respu cst a ante est irnu los muy interisos, y ac tua co n mu cha ma yor velocidad qu e e l reflej o del mus cu lo estap edia l. La reali mc n tac ion po ­ sit iva q ue tiene lugar per m ite so rrea r las limirac iones prop ias de un siste ma pa ­ sivo irnpuestas pa r e l principio de ind et er rninacion acustico? Las ce lulas c iliadas ex ternas afectan la t ransdu cc i6n de las celulas c iliadas in ­ tern as prin cip a lrnente a traves de la vibracion inducida de la membrana basilar.

C aracteristicus del nervi o audit ivo El ner vio a ud it ive se d ivid e en dos rarnas ana to rn ica y fisiol ogicamen te di fer en­ res, la rarn a ve st ib ular -0 ner vio de l eq uili brio- y la rarna coc lear. Esta forma­ do principa lrnente por los axo n es de las neu ronas conectada s co n las ce lulas del 6rga no de Cort i. C omo la resistencia e lec tri ca a 10 la rgo de l eje es m uv grande ; !\ Igo similar oc urre cuando un percusion isra "apaua" e l son ido de un rimbal.

40

... ... ...

Sodio (Na++L..........· .

.~ .'

+++ +"+"+ + + + ­ - - - - + + + + + + - - - - - - - - - + ++++ -- - -_ "': ~~l~~~~~

I I

Direcci6n del impulsa

r--- Interior de l ax6n

_-_-+-+_-_-_..L- _ -+++T :!:.f+ + ­ - ':t--:--=-L-- Me mbrana celular +++++++++ - - - - - ++++++

_

Media externa

Pasajes de iones par co ncentracion y par gradiente etectrico

Fi gur a 23 . Neurona tfpica y rran smision de un poten cial de accion en e l axon de una neu rona

y la resistenci a elec trica de la membrana ce lula r muy peque fia, resu lt a un co n­ du ctor electrico ineficiente. En consec uenc ia, la ca rga positiva in yectada en el ax on se d isipa tras un o 0 dos m ilfrnetros de reco rr ido . Par a qu e la sefial recorra distan cias rnayores es necesario rege ner ar frecue n rerne n te el pot encial de ac­ cio n a 10 largo de l ca m ino a pa rt i. r del int ercambio ionico. Asi, la inform acion via ja a 10 largo de los axo nes en forma de breves irn p ulsos elect ricos q ue son el resu ltado del desplazarnien to a t ra ves de la membrana cel ular de iones de sod io dotad os de carga positiva. En la figura 23 se puede observa r un esquema del pro ­ ces o de transmision . Un pulso nervioso qu e v iaja por un axon es po te nciado cada tanto a traves de d iscontin uidades en las vaina s mie lin icas llarnados nodules de Ranv ier. La ne­ cesidad de reforzar repetidam ente la corrien te elec tr ica lirnita la velocida d max i­ ma de v iaje de los impu lses. Pa ra ax ones de 2 rnrn de d iarnetro la veloe idad de co nducc ion es de 10 mis, mientras qu e pa ra ax ones de 20 m m llega a los 120 m/s.6

Le to rna ce rca de un qui nt o de segund o a un men saje llegar desde La cabeza de un orga­ nism hasta sus pies -en un pasaje rapido este debe corn pensar este retardo md icandole a sus pies que ha cer ant es qu e suen e la nota .

6

41

4. TEORfA DEL LUGAR

cia mecanica de 10. membrana basilar. Recordemos que, para un sistema discre­ to, 10. frecuencia de resonancia fR depende directamente de dichos parametres a partir de 10. relacion i« =1/jJr;;, en 10. que k representa 10. rigidez y m 10. mas a del sistema. La variacion de 10. elasticidad en funcion de 10. posicion, en una razon de 1: 100 entre ambos extremos, es 10. principal caracterfstica ffsica que expli­ co. el mapeo frecuencia-espacio que tiene lugar en 10. coclea. La estructura del organa de Corti, a su vez, cambia continuarnente a 10 largo de su desarrollo. Cerca del apex, en 10. zona sensible a las bajas frecuencias, las celulas son mas grandes y las estereocilias mas largas que en 10. region cercana a 10. base, sensi­ ble a las altas frecuencias. Si el estribo empuja muy lentarnente a 10. ventana oval, to. perilinfa paso. a traves del helicotrema y el volumen total de lfquido permanece constante 0.1 desplazarse hacia fuera 10. ventana redonda. Pero si empuja rapidamente a 10. ventana oval, la deflexion en 10. membrana basilar compensa el cambio de vo­ lumen y no existe flujo a traves del helicotrema. En esencia, una onda de una frecuencia definida no puede viajar mas alia de un determinado "punto de cor­ te" en 10. coclea. A medida que se aproxima a ese punto, 10. onda progresi va se hace mas lenta, 10. amplitud aumenta y su energfa es absorb ida por el movi­ miento de 10. membrana basilar. En 10. Figura 24 se aprecia una onda progresi­ va en 10. membrana basilar generada por un estfmulo sinusoidal de 200 Hz. EI gradiente espacial que define el comportamiento tonotopico de 10. mem­ brana basilar se manifiesta tarnbien en 10. pendiente de 10. onda progresiva. Se puede pensar en 10. membrana basilar como un filtro en el cual la res­ puesta maxima ante una serial sinusoidal se mu cve hacia el extrema apical a

Como los pulsos nerviosos que nacen en las celulas ciliadas internas no son 10 suficientemente rapidos como para seguir 10. forma de onda exacta de una se­ fial acustica (las ventanas que definen poseen anchos de banda limitados), de­ ben existir necesariamente otros mecanismos que permitan codificar dichas sefiales. De todos los propuestos se destacan 10. teorfa del lugar y las teorfas temporales. Desarrollaremos aquf la primera de elias y estudiaremos las teorias temporales en el capftulo dedicado a la altura tonal. El descubrimiento de la mecanica de la membrana basilar, fundamento de 10. teorfa dellugar -0 teorfa tonotopica-, se debe a Georg Von Bekesy (Bekesy, G. Von, 1960). Su magntfico trabajo, que le valio el Premio Nobel de Fisiolo­ gfa y Medicina en el afio 1961, es el fundamento de casi todas las investiga­ ciones posteriores sobre la fisiologfa de la audicion. La teorfa dellugar postula que cada punto de la membrana basilar vibra a una frecuencia particular, las mas agudas en la zona cercana a 10. base de la coclea y las mas graves en 10. re­ gion proxima al apex, en una especie de mapeo frecuencia-espacio." Cuando vibra el estribo, la onda generada en 10. ventana oval se propago. rapidamente por el fluido coclear y liego. al apex en apenas unos microsegun­ dos, Pero tarnbien se propaga transversalmente a 10 largo de la membrana ba­ silar con una velocidad mucho menor, recorriendo su extension en algunos milisegundos. La velocidad de propagacion en 10. membrana basilar no es uni­ forme y varfa en funcion de la distancia a la base de la coclea. Cerca de 10. ven­ tana oval la velocidad es rapida y la longitud de onda comparativarnente grande. En el apex, por el contrario, la velocidad y 10. longitud de onda son mucho menores. La velocidad finita de la onda progresiva implica un retardo acumulado en funcion de la distancia desde el estribo que produce un corri­ miento de fase, tambien acumulativo, de gran importancia en algunos proce­ sos de transduccion coclear. Esta caracterfstica mecanica de la membrana basilar se debe a que funcio­ no. como una estructura de soporte con parametres que se modifican gradual­ mente a lo largo de su extension. Es mas angosta, gruesa y rfgida en su base y deviene progresivamente mas ancha, delgada y elastica a medida que se acer­ co. a su extrema apical. La rigidez aumenta progresivamente hacia la base de 10. coclea, mientras que su masa decrece en 10. misma direccion. Este gradien­ te de rigidez y masa permite la variacion gradual de la frecuencia de resonan­

+

....

................

LJ

:::J

~ Q.

~

0

I

~

"

'"

'

I , I"

I

/ 20

22

24

26

28

.....

....

30

32

Distancia desde el estribo (mm)

En el teclado de un piano se realiza un mapeo espacio-frecuencia. cada punto del espacio -eada tecla- corresponde a una frecuencia diferente. En esta analogfa la membrana basilar vendna a ser una especie de anti-piano. 7

Figura 24. Dos instantes diferentes de una onda progresiva generada por una excitacion sinusoidal de 200 Hz

42

43 liiio......­

11 kHz

medida que la frecuencia disminuye. En otras palabras, existe una conversion frecuencia-espacio, tal como se aprecia en la figura 25. Al margen de la frecuencia del estimulo, la forma de la envoivente tem­ poral de la vibracion en cada punto de la membrana basilar sigue isomorfica­ mente la de la vibracion en la ventana oval. Ante estimulos sinusoidales toda la membrana basilar vibra de manera aproximadarnente sinusoidal, a la fre­ cuencia de la serial de entrada. Por ejernplo, si se aplica una sinusoide de 1.000 Hz, cada punta de la membrana que se mueve 10 hace a esa frecuencia, con un desplazamiento maximo en el punto de resonancia correspondiente a 1.000 Hz. EI patron de vibracion de la membrana basilar no depende del punto so­ bre el cual se localiza la excitacion: vibraciones que llegan a la coclea desde los huesos de la cabeza gene ran respuestas similares a las que provienen de la ventana oval.

2 kHz

Base

200 Hz

500 Hz

10

20

30

Apex

Distancia a la base (mm)

Figura 25. Resonancia de la membrana basilar en funci6n de la frecuencia y de la distancia a la base de la c6dea

Retardo acustico

Excitaci6n de la membrana basilar can un impulso

j

~

o

Cuando se aplica un impulso al estribo aparece una perturbacion cerca de la ventana oval que se propaga la 10 largo de toda la membrana basilar. Cada punto de la membrana se cornporta como un filtro de banda pasante cuya tre­ cuencia central corresponde a la frecuencia de resonancia caracteristica en ese punta. La forma de onda y el espectro varian continuamente con la posici6n, hecho que afecta nuestra habilidad para discrirninar sonidos de caracter tran­ sitorio.f En la figura 26 se puede ver la respuesta al impulso en un punto par­ ticular de la membrana basilar. A su vez, la respuesta ante un clic de las celulas internas en un punto de­ terminado de la membrana basilar se puede ver en la figura 27. Los picos multiples aparecen debido a las oscilaciones atenuadas del filtro basilar correspondiente: el intervale temporal entre picos es el inverso de la frecuencia caracteristica de la zona de la membrana basilar. Si la polaridad del clic se invierte, el patron se desplaza en el tiempo de modo que los picos apa­ recen donde antes se localizaban los valles, efecto muy importante a la hora de localizar espacialmente una fuente acustica. Estos hechos tarnbien se relacionan con la percepci6n de seriales periodi­ cas. Javel mostr6 que una porci6n de la actividad de las celulas ciliadas inter­ nas que responde a los arrnonicos de una sefial periodica es sensible a la fase de repeticion de la onda cornpleta, que coincide con la fundamental de Fou­ rier de la serial (Javel, E., 1980).

C

OJ

E ~

C1l

a

IS.
OJ

o

a

1\

A" VVVV

0,1 0,2 0,3

0,4 0,5

0,6 0,7 0,8 0,9 1,0

Tiempo (ms)

Figura 26. Respuesta mecanica ante un impulse del punto de ta membrana basilar correspondiente a una frecuencia de resonancia de lO.OCO Hz 256

C1l

>

~

192

Q)

~ 128 C1l

u "OJ

c

2 c

64

a

a

1

2

3

4

5

6

7

8

Tiernpo de respuesta (ms)

8 El cornportarnienro de la membrana basilar en este caso es similar al definido por la tram­ fomw.da wavelet (Basso, G., 2001a).

Figura 27. Histograma posesnrnulo en un punta de la MB ante un clic

44

45 .........

5. COMPORTAMIENTO A CTIVO DE LA

alinea lidad co clear se ve rifica al excitar un otdo co n dos sin uso ides de frecuen­ c ias fl y fz. El eco coclear qu e apa rece co inc ide en frecuencia co n e l soni do de combinac i6n princ ipal 2fl - fz. Este resultado pru eba la d istorsi6n arm6 n ica 0 alineal q ue ac nia durante e l proc eso de tran sducci6n (Basso, G., 2001 a) . La alinealidad oc urre princ ipa lmente en los lugar es de la membrana basi­ lar pr 6x imos a la frecu enci a de resonanc ia co rrespo nd iente. En un cadaver la respuest a es siempre lin eal, ta l co mo consrato Von Bekesv en sus experirne n ­ tos, ya que desapa recen los proce sos ce lula res ac t ivos apo rtados fun dame ntal­ me nte par la motricid ad de las ce lulas c iliadas ex rern as. La a lin eal ida d se pierde co n el dana fisiologico y co n la rnuerte: los ecos cocleares solo se o b­ ser van en suje tos en bue na co n dicio n fisiologica, Estan relac ionad os con pro­ ce sos vu lnerab les y las h ipoacu sias te rnporarias 0 perrnan en tes, c iertas d rogas y otros tr astornos fisio logicos los in hibe n . En aprox imad am ente e130 0/0 de las personas apa rece n em isione s otoac us­ ti cas espo n taneas , que suce den en ause nc ia de est irnulos ac ust icos ex te m os. Los tinnitus 0 acasieros so n, e n ese nc ia, em isio nes o to ac iist icas espontaneas.

MEMBRANA BASILAR

Y EMISIONES OTOACUSTICAS

D e ac ue rdo co n la teor ia dellugar clasica, tal como la enunc i6 Von Bek esy, la membra na bas ilar ac nia co mo un an a lizado r lineal de Fourier co n un poder de resoluci6n in sufic ien te par a exp licar la reso luci6 n en frecu en cia del o ido hu ­ rnano. En o tras palab ras, e l anc ho de banda de la resonanc ia de la membrana es muc ho mayor q ue el que se rnide en los expe rime ntos psicoacu st icos. Pa r ejemplo, de ac ue rdo can la teorf a delluga r clasica , a l exci tar la mem brana ba­ sila r a un a frecu enci a ce ntra l de 1.000 H z ap arece una banda de 100 H z de ex­ ten sion, cie n veces mas gra nde q ue la reso luc ion re al, q ue es del o rden de 1 H z pa ra d icha frecuencia centra l. La causa de es ta enorme discrep anci a es, 10 sa be mos aha ra, la existenc ia de un me canismo ac tivo e n e l o rgana de Co rt i q ue Von Bekesy, a l tr ab aja r exc lusivam en te can ca daveres , no pudo descubr ir, En 197 8 Kemp enconrro que al estimular el timpano de un ind ivid uo vi­ vo can un impul so de baja intensidad se dete ct a un eco ge ne rado en e l inte­ rior del ofdo (Kemp, D . T., 197 8 ). C omo esras se riales poseen un re rardo comprend ido entre 5 y 60 ms se sugiri6 que tenian un o rigen co clea r. Ac tual­ me nte se las co noce co mo ecos co cl eares, ecos de Kem p a em isio nes oroaciis­ t icas evocada s. El nivel re la tive de la reflex ion es mayor a menores n ivel es de excitaci6n, 10 q ue revela una o peraci6n n o lineal. En ocas iones, la energia re­ flejada supe ra a la en ergfa in c idente eviden ciando un proceso activo de am ­ plificac ion biologica. Las e m isio nes otoacu sti cas provienen de la ac t iv ida d morora de las ce lulas c iliadas ex te m as. El descu brimi ento de Ke mp mo d ifico profundarnente el co noc imie nto qu e ten em os sobre la fisio logfa del o fdo. Los proce sos cocl eares ac tivos posibi­ lit an la sin to n ia de banda angos ta que se ob ser van en las ex pe rienc ias psicoa­ custicas y q ue las teorias an terio res basa das en el ofdo como un receptor pas ivo -corno la teo ria c lasica de l lugar-, no pod ian explicar. El co mpo rta m ien to ac­ tiv o de l oido interno permite su aso mbrosa resolu c ion e n frecu enci a, su gran se nsibilida d ante es timulos debiles y explica el efec to de supres i6n de un to no po r otro, temas que desa rro llaremos ma s ade la nte. La ac rividad co clear pued e e n te nderse tarnbien co mo un a relacion alineal entre las sefia les mccan icas de en tr ada y salid a. Numerosos trabajos en indi vi­ du os vivos han demostrado que la resp uesta de la membrana basi lar es a lin ea l, es decir que la salida no responde proparc ionalmente a la entrad a. A ni vc lcs de serial de e n trada po r debajo de 60 dB, un mecanismo bio logico ac t ivo a m­ plifica la respuesta coclea r. A med ida q ue el n ivel crece la arnplificacion d ismi ­ nuy e y, para altos n ive les en la sefial de ent rada, ce rca nos a 90 dB, e l mecanismo ac tivo deja de o pe rar y e l sistema deviene linea l. U na pru eb a de la

6. FUN CIONES DE T RANSFERENCI A

DEL SISTEMA AUD lTlVO PERIFERICO

Es posible re un ir to da la informaci6n descripta has ta ahora para ana lizar co ­ mo el siste ma aud itive periferico rnodifica las sefiales ac usticas que llegan a ca­ da o ido . El resultad o fin al es la funci6n de transieiencia del sistema auditioo periferico, q ue rela c iona la pr esi6 n ac ust ica de la fuente ex terio r p(t) con la vi­ br acion que llega h asra la membran a basilar S(t) . S i hd Y ~ son las se fialcs ac usticas a la en trada de los pa be llo nes aud itivos derecho e izq uierdo y &1(t) y gj( t) las respu estas a l impulse del espac io ac usti­ co entre la fuente y las dos entradas aud it ivas, hd y hi se pue den ob tener de las expresiones que siguen (el sfrnbolo * de nota co nvo luc ion ):

hd(t ) = p(t) * gd( t) p(t) * g;(t)

~ (t) =

U na parte de las respu est as gd (t) Ygi ( r) esta dad a por las ca racterist icas del am ­ biente ac ust ico ext er ior y o t ra part e po r las fun ciones de transfere n c ia defini ­ das por los hombros, la forma y tam an o de la ca beza y e l pabellon auric ular. Los efectos de esras piezas ana rornicas se v ue lve n sign ifica rivos c ua ndo las lon ­ gitudes de on da so n co mpa rab les con sus di mensiones a causa del fenomen o de difraccio n , tal co mo ve remos e n c l ca p itulo VII. Pa ra sirnplificar la ex pos i­ c ion, obv iare mos d esde aq ui las diferenc ias en tre los o fdos derecho e izquier - .

47

46

........

20

do y uti lizare rnos la tra nsfo rmada de Fourier H (w) para sirnbo lizar la respues­ ta espec tra l de la entrada aud itiva h(t) . En el trayecto del estimu lo interv ierie a con tinuacion la funci 6n de trans­ ferencia de l canal audi tivo extemo E(w ), que al cornbin arse co n H(w) modi­ fica la serial de entrada de la manera que se ve en la Figura 28 . En seguid a aparece la acci6n del sistema de pal an cas y filtros del o fdo me­ d io, cuya funci6n de tran sferen cia promedio, C(w ), se aprecia en la Figura 29. Si se co rnbin an las tres funciones de transferen cia an teriores se obtien e la func i6n de transferenc ia total entre la Fuente ac ust ica y la entrad a de la coclea S(W) :9 S(w) = H(w ) £ (W ) C( W)

til

:s.

'S'

I A mplitud

10

O r.

W "3 ~ -10

-20 0,2

2

0,5

5

10

15

Frecuencia (kHz)

Figura 28. Fun cion de tran sferen c ia co mbinada H (c.o ) E(c.o )

En la Figura 30 se co m para a S(w) con la sensib il idad pro me di o d el ofdo

30

I

I

I

I

I

I

humane . EI notable ajuste entre la func i6n S( w) co n la curva de sensibilidad de l o fdo permite afirma r que el proceso q ue sigue luego de la llegada de la sefia l a la membran a basilar es, al men os para in ten sidad es med ias, esencialment e li­ neal. Risset afirma: "En un articulo te6ri co , Yang, Wa n g y S hamma ( 1992 ) de ­ mostr aron q ue un modelo fisiologico pla usible de la periferia a ud itiva pu ede ser in vertido y usado para regener ar I.a entrada or igin al cornpl et amente . Este resultado sugiere que el siste ma aud itivo n o pierde informacion acu st ica en las eta pas ternpra n as de l proceso" (en Deutsch, D., 1999) .

20 f·.._....·_ ·······..j

'S'

g: ~ _·· · ··· _ ·_···j ..

10

·_·_···········j- - - -

·f--··.. ..· ···············..·1 ·····················..··1

o 0,2

0.5

10

5

2 Frecuencia (kHz)

Figura 29. Fun cion de tran sferen c ia del oido medic C(c.o)

7. R ESPLJ ESTAS NEURALES A ALTOS NIVELES EN ELSiSTEMA AUDlTIVO Existe eviden ci a de que co nc urre n grupos de detectores neurales alta rnen te es­ pe ci.alizados en los niveles supe riores del sistema aud itivo. Aparentem ente , en la corteza cere bra l se an aliza algo mas que la frecuen cia 0 la intensidad de las sefial es que le llegan . A lgun as ne uro nas corti cales parecen responder d irec ta­ mente a los tr an sitori os de la seria l de entrada; ot ras reaccion an ante cambio s uni d irecc ionales de frecuenc ia (se las denornina "freque nc y sweep detectors" en la literat ura especializada): ot ras son sensi bles a la tasa de mod ulaci 6n (irn­ portan te qu iza para la in teli gib ilidad del h abl a ): ot ras a los da tos necesarios para la localizacion espac ial, et ce te ra. La mayor fa de los invest igadores op ina que la tonotopia de la mem brana basilar llega hasta el cerebro , pero no cree qu e la relaci 6n isornorfi ca se co nserve plena rnente y prop one un mapeo rnul­

o

'0

'0

(jj '0

o

is E

o-.•. ;=::3 I~I "' -'"

1[

I:..~:.:.:~ . .__.. . . . ._

2

Q.

..•.

,.10 dB

L'0,2

_.--/

-

.-

_

'0

ro ~ :0

'in

..

c



:

0,5

:

en I

;

I

2

5

10

Frecuencia (kHz)

Figura 30. Fun ci6n de tran sferencia ent re el campo externo y la coclea S(c.o) (puntas) co mparada con la sens ib ilida d prornedi o de l oido h urnano ([(nea)

9 La relacion expuesta es val ida solo para Fuentes acusticas loca lizadas frent e al oyen re. En el ca pitulo VII sc analizara el caso general.

48

49

..........

°

Hemisferio izquierdo

dB o

0....

2°1

-40

<:

'.

'~.?

...~..... '.,

, -60

~

'0 "

-80

9

6 6

9 9

<1..

4......

'Q,

6

.

'q .••••• ~.\'

9

6 6

? 9

·.·dJ

~ ,

'\

~

r-»,

~

"'f

~

6

Hemisferio derecho

I:,

-100 0,1

0,2

0,5

2

5

10

20

50

Frecuencia (kHz)

~

... :

. . ( .0­ .. . . . : ·····0 0..-.... ::

Figura 31. Umbrales de respuesta de diferentes fibras simples ante diferentes esttrnulos sinusoidales. La segunda pendiente es del orden de 1.000 dB/oceava

-,

tiple entre ambos sistemas. En todos los casos, el mapeo ocurre entre un siste­ ma unidimensional, la coclea, y otro bidimensional, la corteza cerebral. Aun­ que nos representamos al cerebro como una estructura tridimensional, quiza sea mas cercano a la realidad pens arlo como una estructura bidimensional -la materia gris- plegada en numerosas convoluciones. Lo que sf se puede afirrnar es que la informacion acustica llega al sistema auditivo central con un grado de detalle extremadamente fino. Por ejemplo, dis­ tinguimos diferencias de apenas 10 IlS entre las sefiales que nos llegan a los dos oidos; tornando en cuenta que la duracion de los pulsos mismos es de 100 us, diez veces mas largos, la precision del sistema resulta poco menos que increible. Las propiedades de respuesta en frecuencia de las celulas ciliadas internas, asistidas por la realimentacion positiva provista por las celulas ciliadas exter­ nas, se muestran en la Figura 31 para cuatro frecuencias centrales distintas. La segunda pendiente es del orden de 1.000 dB/octava, valor consistente con nuestra capacidad de discriminacion diferencial de aproximadamente el 0,3% de la frecuencia central correspondiente. Se define asi el maximo nivel de detalle espectral posible a la entrada del sistema de transduccion, De acuerdo con las experiencias psicoacusticas en la­ boratorio, este nivel de detalle se conserva intacto a 10 largo de toda la cade­ na sensoneural. El recorrido esquematizado de la informacion auditiva, desde que abando­ na el ofdo hasta que llega a la corteza cerebral, se puede ver en la Figura 32. Aunque el recorrido y la naturaleza de la informacion acustica distan de ser

Oido izquierdo

Nucleos cocleares venlrales

:

Nucleos cocleares dorsales

Oido derecho

Figura 32. Recorrido esquernatico del flujo de informacion entre el oido extemo y la corteza cerebral

comprendidos en profundidad, algunos autores han aplicado esquemas similares al anterior para crear modelos completos de percepcion auditiva. Por ejemplo, Yoichi Ando postula un modelo en el que aparece un mecanismo precortical de extraccion de la autocorrelacion de las sefiales, una posterior correlacion cruza­ da interaural entre las vias derecha e izquierda y la especializacion de los hem is­ ferios cerebrales para el proceso de factores espaciales 0 temporales. En la Figura 33 se puede ver un grafico del modelo de Yoichi Ando (Ando, Y, 1985, 1998). Para ciertas tareas complejas, como las involucradas en el "efecto de ca­ feterfa",l0 es necesaria la interaccion de ambos hemisferios: el izquierdo -rern­ poral- tiene a su cargo el procesamiento de la palabra, mientras que el derecho -espacial- procesa la localizacion de las Fuentes. El modelo de Ando se ha em­ pleado con exito en el disefio de salas para musica no amplificada.!' 10 Efecto que describe la capacidad de cornprender el habla en ambientes de gran contarni­

nacion por ruido. Donald Hall 10 denornino "~ocktail party effect".

11 Por ejemplo, en el Auditorio de Kirishirna, en [apon, disenado par Yoichi Ando.

50

51

~

-~ ro VI

Q)

>

:;:;

5.. .~

Capitulo II

Sonorida

~ -§

a:

x

VI

I ~ ~

o

>

W :.;::;

:5~

~I

o ~

oro

'C

OJ

U '"

:~ ~

U

'u

';:: 0 OJ C.

ro Q..

'C E

VI

U2

OJ

o

c c '"

:g § ~ro ~ ~

'0 ~ OJ ~

c. OJ

VI U w Qj

"0

(;

o

't:

0"0

~ ~ ~

~-5 ~ <3 '~~ ~


?



ro

~

U

Co >

VI

o 0

0

VIC

oQ

=,-~­

.~ '~.~

ro

:§:

2

~ §- E ~

.J

EfJ)~

b' ~

o

U

2~
co C

~

E

::J

EU VI ro

.~ ~ U

0

~

OJ "0

OJ U

2

'" :J

<{

co ro

- _.

-"0

~ co ,w :.=

~B co . ~

U '(3

15~

"OC

C ' ro 0;=


~

C

g 'O"J

"i:i

f- U

s

-0

OJ '" c. C '"

r:!

.S: ~.~ _

.0

0

o

"'C C '" OJ UX OJ ~

-0

c:

r5

;::;­ 00

'tJ~

g

ro 0

U

VI

«

...c u

-;::;­

. ",

"'­

"0

-0

o

-9

._0

c.~

E

.~

.c-

U

ro ro c

;2 v v

-0

~

c ·~ OJ '"

OJ

VI

:J .:J

U- U

'"

52

'" '"ro

~

i.I:

Es razonab le relac ionar la sono ridad - un a mag nitud perceptu al- co n la inten­ sida d de la serial ffsica que la origin a. El me cani smo parece claro: un a on da acu stica produce cierta presion d ina rnica en el aire a la entrad a del ofdo ex ­ terno y gene ra mov im ientos de amplit ud proporcional en el timpan o, en los huesos del ofdo rnedi o , en la ven ta na ova l y en la membrana basilar. El movi ­ miento de la membran a basilar, a su vez, implica la est imulac i6n de las ce lu­ las cili adas y la apa rici6n de un a cant idad de impu lsos nerviosos v iaja ndo por el n er vio auditivo . La relaci6n ca usal intensidad [fsica ~ sonoridad se insiruia co n apa ren te clarid ad. Pero , ies legfti mo considerar a la sonoridad com o un rasgo autonorno, que se puede estud iar de maner a indepe n diente, sepa rada del resto de las ca racterfsticas que definen un son ido real? Es pract icarnen te un a pe rogrullada dec ir que todos los sonidos q ue n os resultan relevan tes esta n ca ­ racterizados par diferencias en la int en sidad del espec tro a 10 largo del tiern ­ po, pues la percepc i6n de la intensidad del est fmulo ac iistico esta presente en todos los aspectos de la func i6n audit iva. Pero la in te nsi dad en sf misma , aun­ que resulte vita l pa ra la funci6 n supe rior de extraer informac i6n de los son i­ dos de l amb iente, n o es un rasgo de in ter es primar io para la aud icion. A clarado 10 anterio r, debema s recon ocer que el est udio auto n orno de la pe rcep ci6n de la intensidad es uno de los ternas tradi cion ales de la inv est iga­ ci6n acustica y h a ge nerado gran ca n t idad de informaci6n relevante . Durante los ultimos di ez afios se h a increme n tado notabl ernenre nuestro co noc im ien­ to sobre un a de sus princ ipales carac te rfsticas, q ue es la forma en q ue el siste ­ ma auditivo repr esenta a cod ifica la in tensidad de las seftales ac usti cas , En 10 qu e sigue describ iremos el esta do actua l de los est ud ios sa bre el te­ ma, tr at ando de n o perder de vista nu estro objet ivo ce ntra l - a curnplirse un os capftulos mas ade lan te : int egrar cada un o de los rasgos en un a imagen globa l y cornpleta del so n ido tal como efectivame n telo perci bimos. Par el memento, podem os adopt ar la siguien te defini cion de sono rida d , que nos va a serv ir para co menzar su estudio . "La so no rida d es el rasgo de la

53

sensac ion aud itiva e n terrninos del c ual los soni dos puede n se r o rde na dos en un a escala q ue se ex tiende de l silenc io a 10 muy sonoro".' En esta defi n ic io n , la sono rida d apa rec e como un a tributo gen era l del so­ n ido y se refiere , a nte tod o , a la sonoridad global de un o bje to acustico. Mas ade lan te la arn pliaremos pa ra an alizar la sono ridad de los difer entes eleme n­ tos que co mpo ne n dich os obje tos,

rftrni ca, el decibel, mucho mas adec uada para descr ib ir la relac i6n entre la energfa de l est imulo ffsico y la sono rida d resulta nte." De aq uf se obt iene un a de las magni tudes mas usadas en ac ust ica , el nivel de presion sonora (N PS),5 cu­ ya un idad es el decibel (d ls) :

N PS = 20 loglO _P- [dB]; can Pre! = 20 J-lPa Pre!

1. R ELACION ENTRE AM PLITUD E INTENSIDA D En e l caso de un a onda sin uso idal, la a rnplitud no es mas q ue un a manifesta­ cion de la ca n tidad de ene rgfa presente en el sistema. Como esta e ne rgfa no se pued e med ir dir ec tarne n te y es mu y d iftcil deterrninar la a rnplitud del mov i­ rniento de las molecul as, se acos tu mbra medir algun par arnetro mas acces ible. De todos los parame tres relaciona do s con la energfa de la o nda, el mas senc i­ 110 de evalua r es la presion diruimica (p), que puede ser medid a e mp leando di ­ rect amente los m ic rofonos de presi6n clasicos, La presi6 n es un a magn itu d q ue vincula un a fuerza con la superficie sobr e la qu e se aplica , y la un idad q ue le co­ rresponde es el pascal-que eq uivale a un a fuer za de un newton aplicada sobre un a supe rfic ie de un metro cuad rado. U n a onda acust ica q ue se propaga en el air e esta for mada por una suces i6 n de zo nas de presion por enc ima (p posit iva) y por debajo (p negat iva) de la presi6n atmosfe rica med ia. La presion atmos fe­ rica normal, a n ivel de l mar, es de aprox imadamente 101. 300 Pa y se man t le­ ne relar ivarnen te co nstan te durante intervalos de t iempo breve s. 2 D ecib eles Se sabe q ue par a obte ne r incre mentos de sono rida d en pasos per ceptu alme n ­ te iguales los increme n tos en la presi6n del est imulo deben ser cad a vez rna­ yores. 0, co n mayor preci si6n , para pe rcibi r un aume n to de so nor idad co ns ta n te h ay q ue aurnen ta r el esti m ulo un po rce n ta je tam bien co nstante. A mediad os del siglo XIX W eb er y Fec hner' condensaron marernaticam ente este compor tam iento en dos leyes q ue pe rmi t iero n la c reac ion de un a unidad loga­ ) A lgunos aurores Haman "in rensidad subje tiva" a la sono ridad. Por ejernplo, vease el arti­

culo de Plack y Ca rlyon en el que emplean los termi nos loudness y subjecriveintensity ( Moo­

re, B., 1995).

2 Son los l.0 l3 h Pa (hecro pasca les) que informa el servicio meteorologico como presion

arrnosferica normal.

3 Ernst Heinr ich Weber (1795 -1878) y G ustav Theodor Fechner (180 1-1887), fisiologos

alemanes pioneros de la psicologia ex perime nt al y creado res de la psicofisica.

54

En esta relaci6n P es la presi6 n ac ustica en un pun to del espacio y Pre[ es una re­ ferencia co n ven ciona l estandar izad a, Ha y va ries eleme ntos a destacar en esta ec uac ion: en prime r terrn ino , el niv el compa ra dos presio nes d inarnicas entre sf, ind icando cual de ellas es mayor y en que prop orci on . En segundo lugar, para po­ der compa rar dos n iveles de presi6n en dB estes deben h aber sido to mados se­ gun un a m isma presi6n de referencia (Pre!)' El estan dar in temacional estip ula qu e la referen cia debe co inc id ir co n el umbral de aud ibilidad a 1.000 Hz, q ue corresponde a un a presion de 20 )..l.Pa. A sf se consigue v inc ular de manera d irec­ ta un a un idad ffsica, el decib el, co n un a de las principales carac ter fst icas de la audici 6n h umana, Por ultimo, el eno rrne rango ffsico presen te en los esn mu los aciisticos, en el que la mayor presion aud ible supera un m ille n de vece s a la me­ nor, se redu ce considerablemente al ser ex presado en de cibeles. En la figura 1 se aprec ia la relac i6n ent re la presion dinamica de la serial, expresada en pascales, y el ni ve l de presio n so no ra en decib eles. Para q ue el lecto r pueda vincular es­ tos valor es con los son idos co tid ianos, e n la c uarta co lumna se h ace referen cia a los co n textos ac iist icos co n los q ue h ab itu alm enre se asoci an . Se o bserva qu e el valor de 0 dB correspo nde a una presion de 20 IlPa, el umbral de aud ibilidad , y no a presi6n cero. Por su part e el umbral de dolor ro nda los 120 dB, aunq ue este limit e var ia aprec iablemente segiin la sens ibilidad de cada individuo. Potencia e intensidad aciistica Tod a onda ac ustica nace en una fuente cuya funci6n es t ransferir ene rgfa al me­ dio. La cantidad de ene rgfa (E) que en trega por unid ad de tiempo se denornina poteneia (P) y constituye una de sus ca rac terfst icas mas importantes. La pot encia se mide en watts (W) y se v incula co n la ene rgla a traves de la siguiente relacion:

P = !:iE /!:it 4

[W] = [loulej/[s]

U n poco mas ade lan re vamos a volver sobre este pun ro. Ing les se 10 denomina sound pressure level (SPL).

S En

55

Presi6n dinarnica

lntensldad

20 Pa

+

1wlm '

-I-

120 dB

-----7 Umbral de dolor

2 Pa

+

lO-'wl m'

-I-

100 dB

-----7 Martillo neurnatico

200 mPa

+

10'" wl m'

.L

80 dB

-----7 Calle muy transitada

20 mPa

+

1 0~ wlm'

-I-

60 dB

-----7 Conversaci6n normal

2 mF:a

+

1 0~ wlm'

+

40 dB

-----7 Ruido de fonda

200 ~Pa

t

1O- 1ow !m'

t

20 uPa

+

1O-1'w!m'

-I-

[W/m 2]

1 = P I A

Situaciones tlpicas

Nivei de presi6n sonora

Es posible de most rar qu e la in ten sidad ac ust ica de una onda progresiva pla na es propo rcional al cuad rado de su presion d inarnica:

p2 I = - [W/m 2J p~.c

en una sala de eslar 20dB

-----7 Dormilo rio lranquil o

0 dB

-----7 Umbral de audibilidad

Figura 1. Relaci6n ent re presion d inarnica y ni vel de presi6n sonora en decibeles

Es dec ir que la po tenc ia de scribe la variac ic n de ene rgfa .'lE que ocurre en e l tiemp o .'It.6 En ot ros te rrninos, es e l traba jo Fis ico ejercido por la Fue n te duran­ te e l t iempo .'lL La po te nc ia aciist ica max ima qu e en trega n algunos instru ­ mentos musicales se puede aprec iar en la siguien te tab la (los va lores son un prom edi o ent re varias mediciones):

en la qu e Po es la densidad medi a del aire y c es la veloc idad de propagaci6n del sonido en ese rned io. En la Figura 1 se pueden obscrvar los valores que to­ rna la intens idad ac ust ica anre algunas Fuentes acu sticas co t id ianas . A partir de la inten sidad I es posible defin ir el nivel de intensiMd aCUs tica (Nl) . 7

N l = 10 loglO _I- [dB]; con Ilel = 10 - 12 WI m2 Irel Para el caso de ondas plan as 0 esfericas progresivas el va lor del nivel de in ten­ sidad N I coincide apr oximadarnen te co n el de l n ivel de presion sono ra N PS. Cualq uiera de las magnit udes an te riores (ampli tud , presi6n, NPS, in te n­ sidad y N I) puede ded ucirse de las dernas: todas se refieren, en ultima instan ­ c ia , a la cantidad de energta asociada a un a onda acust ica.

Z. PERCEPCION Fuente acll.snCa C an tan ie (teno r)

Flaura Trornpera Tromb 6n O rquesra sinfo n ica (fff)

Potencia aCll.s nCa maxima 0,04 0,05 0,2 6 60

W W W W W

La ene rgia tot al que rad ia la fuente se pro paga en mu chas d ireccio nes. En par­ ticu lar, a nosot ros nos va a in teresar la que atrav iesa determinada area (por ejernplo, el tfrnpano de un a per son a) . O tra magn itu d , la intensidad acustica (I), da cuen ta de la po te ncia que atrav iesa un area A: La pot en cia insranta ne a se calcula a partir de la derivada de la ene rgia co n respecto a l tiernpo: Pi = JE/Jt.

DE LA SONO RIDA D

La sonoridad es una magnitud percep tual y como tal no pued e medi rse d irec­ ram en te a partir de sensores fisicos. Pu C ~LO que todas las te cni cas indi rect as de rned ic ion apor ta n sus propi os presupue stos y lirnitac iones, nu estra discusi6n in clui ra necesariamen te un a descrincion de la metod ologla aplicada en cada uno de los casos ex puestos . Quiza la me nos cont roverrida de las tecni cas de medici6n sea la de comparaci6n de sonoridades, en la que un oyen te debe variar la intensidad de un estimu lo hasra con segu ir igua larlo en sonoridad can ot ro esta ndar de intensidad fija. En este rnetod o el oldo se usa como un detector de cero y es capaz de revelar como otros parametre s de la serial, tales como la fre­ cuencia 0 el anc ho de banda , afec ta n la sonorida d. Tarnb ien sirve para detec­ tar la manera en que alguna carac terfst ica parti cul ar del oye nte , como un a perdida de sens ibilidad aud it iva , influye sobre su per cepcio n de la sonorid ad .

6

56

7 Sound intensity level (IL) en ingles.

57

1IM~

1'

~

- - - - - - - - - - - - - - -.........._ ­

1

90

Umbrales absolutos

80

EI umbral abso lute de in ten sidad -Ia in tensid ad a part ir de la cua l cornenz a­ mos a perc ibir so n ido- fue de te rm in ad o por pr imera vez en la segunda mitad del siglo XIX. S e 10 m idi6 a una fre cuencia centr al de 1.000 H z y se supuso que e l o ido hu m ane manten ia un comport amiento parejo a 10 lar go de todo el ran ­ go audibl e. H oy sabemos q ue, para un a sefia l sin uso idal de 1.000 Hz , la mayo­ ria de las personas con o ido sano co m ienza a o fr c ua ndo la intensidad alcanza unos 10- 12 W/ m 2 . Est a in rensida d eq uiva le a un a presion so nora de 20 millo ­ nesirnas de pasca l (20 flPa ), 0 a una arnplit ud de mov im iento de 10-11 m ( 0 0 ,1 A iun dec imo del d iarnetro del ato rno de hidr6gen o!). EI o ido humano es in crefble rnente sensible a la intensid ad ac iistica, pues si pud iese rnos perci bi r in te nsidades aiin menores o irlarnos e l rui do provocado par la agitac io n terrni­ ca de las mo lecu las del a ire . C uan do comparamo s n ues tros old os co n los de al­ gun os animales nocturnes, co mo los ga to s 0 las lechuzas, no de be mos buscar en una m ayo r se nsib ilida d abso luta la razon de sus exc elentes ca pac idades au­ di tivas (n o a l me nos a 1.000 H z). La vari aci 6n del umbral de aud ici6n en fun ci6n de la frecue ncia del est i­ m ulo se obtien e habitual mente a pa rt ir de dos met odos: el de la presion mfni­ ma audible (MAP), q ue se e valua con auriculares, y el de l mtrurno campo audible (MAF), q ue se mid e con a lta voc es y q ue incluye los efec tos de filtro del ca n a l aud itivo extern o y del pab e llon a uricu lar (de gran importancia para defin ir los filtros HRTF). 8 La Figura 2 perrn ite apreciar, junto a est os umbrales, el corres­ pond ien te al minima campo audible binaural (MAF bin aural), q ue es a lrededor de 2 d B me n o r q ue el monoaur al. Se co nsideran sujetos co n aud ic io n nor ma l aq uellos q ue presentan urn ­ brales de h asta 20 dB por enc ima de la curva anterio r. Pa ra frec uenc ias sup e­ rior es a los 1.000 Hz las d ifere n c ias interindividuales so n apreciabl es. Es n otabl e la sernejanz a de for ma que existe entre la sens ibili dad del ofdo de riv ada de los filtros del siste ma aud itive pe rife rico (figura 30 del ca pitulo I) y la in versa de la c urva umb ral que acabarnos de presentar. Ademas de proporcio­ n ar la identificac ion puntu al de la causa de cada resonancia y de cada factor de ponderac ion espectral, la sernejanza alud ida permi te supo n er un a cod ificac ion espectral "pl an a" en los ni veles superiores de procesamiento neur al, a part ir del flujo de informacion q ue asc iende por el ne rvio a ud it ive . A si, pode mos inferir q ue tan to la sens ibilidad max ima del o ido alrededor de los 3.000 Hz, como la ca rac teristica de Fittro pasa altos que pre sen ta h asta los 5.000 H z, se originan prin c ipalmen te en la resonanc ia ac ustica del co nd uc to aud itivo exte rno . 8

Fun cion es de trans feren cia relativas a la cabeza (Head Related Transfer FLmcrions) .

58

70

ill

60

0

50

a

40

~

"5 U)

..0

co

30

\\ \'

- - - MAF (monoaural) - - MAF (binaural)

\ \

1§ ..0

20

::J

10

E

.••••• MAP (monoau ral)

~

~ -c

~ ..

•. .... " < , ; ~ .... . . .., .... ..

·10 [ . , ", "I " , , " "I 0.02 0 .05 0.1 0.2 0.5 1

,~~ II

' '-' " ,,1I 5 10

I 20

Frecuencia (kHz)

F igura 2. Mfnimas inr ens idades ac usticas audi bles (umbrales MA P y MAF)

En cuan to a los lim ites de audi bilidad pa ra bajas frecuenc ias, pode mos apuntar que W h it tle m idio en 1972 los umbrales entre 3 ,5 y 50 H z y conclu­ y6 que forman un continuum co n las curvas a frecuenci as medias (a 3 ,5 Hz se n ecesitan 120 dB pa ra lle gar al umbral) (W hi t tle , L. S. et at., 1972 ). En 1974 Jo nson sugiri6, n o ob sta nte , qu e pa ra so n idos de men os de 16 H z 10 que se oye es el prod uc to de la d istorsion arm6 n ica de l o ido (Johnson y Gierke, 19 74) . EI lim ite para siru acio n es norm ales parece ser de alrededor de 16 H z, frec uen c ia cercana a la m as baja que prod uce una sens ac i6n clara de alt ura ton al. En la practica c hn ica los urnb ra les se to rnan co n rel ac i6n a los co ns idera­ dos "estad fs t icamente norrnales" y se mid en e n niveles de umbral (HL) : un urn ­ br al de 40 dB HL a 100 H z sign ifies q ue es ta 40 dB por enc irna del um bral normal a dicha frecuen c ia. En el aud iograrn a de la Figur a 3 se pu eden ver los ni veles de um br al HL para ambos o tdos. La sensib ilida d del o ido humano a la intensidad es desraca ble ta nto en ter ­ minos absolutos como en term ln os del ran go de valor es al que responde (del orden del billon de veces entre la maxima y la minima in ten sidad perceptible, o del rnillon si 10 medimos en pres iones ac usticas)." EI mo tivo de se mejan te range hay que buscarl o en el con jun to de son idos h abit uales en los ti empos en los q ue estas ca pac idades se fijaron biologicamente La gran sensibilidad ante esti mu los minuscul es, del orden del decibel , n os permitia o ir por ejernplo el an­ dar d istan te de un de predador 0 de una peq uefia presa. En aquellos tiernpos tarn bien existian est imulos de gran ene rgia, co mo el so n ido de un t rueno 0 de 9

En n ume ros, un a relaci6n de 10 11/1 en inten sidad, 0 de 10 6/1 en pr esi6n acu stica.

59

120

110

100

90

80

:s. 70 e0 60

c 0 50

en 40 Qj > Z 30 20 10 0

-10 0

CO

.s. ~ E

10

rJ :J OJ 0

Qj

>

Z

30

co

. .....r -' - " ~ '·:·' r: ·\

20

a

a ido derecho

X

Oido izquierdo

.......

. . \; \

Oido normal

..

1\

40 50

Deterioro causado por exposici6n al ruido

~"'\4 ";" \, \

",: ....

... ..

60 0.02 70 125

250

500

1000

2000

4000

8000

Frecuencia (Hz)

Figura 3. Audiogram a de un sujeto con o fdo sano y de otro can h ipoacusia pro vocada por ruid o

un grito a co rta distancia. La est rategia q ue nos perrnitio co nse rvar una sensibi ­ lidad auditiva ex tre ma sin qu e po r e llo aurnen te exce siva rne n te la fragilidad de l siste ma es co mp \eja y au n no se co no ce corn plet arnente. Ent re los facto res de impo rtancia qu e int ervienen esta, sin du da, el efec to de lupa pro pio de la co m­ presion logarftmica q ue opera entre el est fmu lo y la respuesta: n uest ra sensib ili­ dad es maxim a a pequefias int en sidades y se va red ucie nd o a rnedida q ue la in tensid ad aumenta. As!, para estimulos ce rcanos al um bral de do lor, e l co njun ­ to de mecan isrnos perifericos y cen t rales qu e se descr ibieron en el cap itulo I at e­ mi an co ns ide rableme n te la serial que nos llega de l exteri or.

Co nrornos de igual sonoridad Ex ist en dos tecnicas q ue pe rm ite n me d ir la so noridad: un a es la estimaci6n de magninui, qu e inr enta dete rmi na r valo res ab solutes d e so no rida d: la o tra co n ­ siste en medir el nivel de 50noridad en relac ion co n un a sin usoi d e de 1.00 0 H z. Las c urvas de contorno.s de igual sonoridad de la Figu ra 4 se obt ienen a partir de es te ultimo rnet odo y resultan a lgo d iferentes segiin e l la boratorio en el cu al fueron determ inadas (la forma ex ac ta n o deb e tomarse liter al rne n te ). Puede n se r reprodu cid as co n senci llez a l ped irle a uri ove nte q ue igua le la so no rida d de una serial s in uso ida l, de frecuenc ia e intensidad variable, co n la de un to ­ no esta nda r de 1.000 H z a N decib e les. Obvia decir q ue so n un p ro med io ela­ bo rad o so bre la base de las respu est as de c ien tos 0 mil es de sujetos.

60

0.05 0.01 0.2

0.5

2

5

10

Frecuencia (Hz)

Figu ra 4 . Curvas is6fonas (Fletch er-Muns on)

Las Clavas de igual sonoridad -0 is6fonas- so n una descri pc ion de la va ria ­ c ion de la sonoridad en fun ci on de la frec uencia del estfrnulo (Fletc her y M unso n , 1933 ). EI nivel de sonoridad (rn edido en fones) d el so n ido de p rueba es n umericarn en te igua l a la intensid ad N I (rnedida en dB ) del tone de refe­ renci a de 1.000 H z. A si , por ej e mp lo, to do so n ido q ue po sea la mis ma sono ri ­ dad q ue un a sin uso ide de 40 dB a 1.000 H z, rendra un ni vel de sonoridad de 40 fones. U n co n to rn o de igu al so noridad es una linea q ue un e los ni veles de los esnrn ulos - de diferent es frecuen cias- qu e presentan el m ism o nivel de so ­ nori dad en Iones. La ca ntid ad de in formaci on util q ue apo rta n est as c urv as es mu y gra nde . Men c ionernos algunos ejernpl os: • La forma de las c urvas es, par a bajos ni veles de sonoridad, parec ida a la del umbra I de la Figura 2: la sensibilida d decrece a med ida q ue nos alejarn os de la zona ce nt ra l de l espec t ro haci a las a lta s y bajas frec ue nc ias. Es necesar io aplicar mas ener gfa en la region grave q ue en la med i~ pa ra o btene r el m ism o resultado auditi vo . • Para sonorid ad es intermed ias, en tre 60 y 70 fon es, es rnenor la difere n ­ cia d e sens ib ilid ad aud it iva en fun ci on de la frecu encia. • Las curvas d e n ivel, par a altas sonorida des, son pr ac ricarnen te planas: nuestro o ido resp o nde d e mane ra sim ila r en todo e l rango a ud ible a co nse ­ c ue ncia de la atenuac ion pro vist a por los mecanismos de pror eccio n auditiva. • Exist e un a zona de maxima sensibil idad entre los 2.500 y los 3.500 H z. T iene una gran irnpo rta ncia p ues el esrfrnulo qu e oc up e esa banda va a ser pe r­ ci bido con mayo r fac ilida d q ue los que oc upen o t ras regiones de l espe ctro. Co­

61

11:111 :

I

I

I

mo ya sabe rnos, este maximo de scns ib ilidad se o rigin a e n la resonan cia del co nd uc to aud itivo ex te rno . • S i se gene ra un a serial sinuso idal qu e recorra co mpleta me n te una de las curvas de igual son oridad se a ye un glissand o perfecto , de sono ridad co ns ta n te. Una co nsec ue nc ia de las curvas isofonas, muy cornun en el ca mpo de la mu sica, es el co n tro l de sono rida d --0 loudness- qu e posee n algunos prearn pli­ flcad or es de aud io. Las grabac iones de piezas de rruisica se realizan por 10 ge­ nera l a ni veles altos , do nd e la sensibilidad del otdo es plana . S i se re produ cen a ni vel es meno res ca mb ia el balance espe c tral al ca mb iar nu estra sensiblltdad a ud itiva: ol mos debil itadas las regio nes mas grave s y agudas de l espectro . Para corregir este efeeto algunos eq uipos de aud io v iene n eq uipados co n un co nt rol de sono ridad q ue refuerza los ex tre mos del espec tro a bajos n ivcles de arnp li­ ficacion. La salida del prea rnplifica do r can el control de sono rida d ac tiva do si­ gue de modo mas a rne nos feli z la c urva um bral de aud ibilida d .

Escala absol u ta de so nori dad EI ni vel de sono ridad en tones tod avia se refiere, sin e mba rgo, a la serial fisi­ ca . So lo propo rc io na un a esca la co mpa ra t iva y no perm ite desc rib ir la sono ri­ dad prop iame nte dicha. iCua nto mas sonoro es un so n ido de 70 fo nes que uno de 50 fones? Con los ele me ntos hasta aqu i ev aluad os no se puede dar resp ues­ ta a esta pregu n ta. H ace falta defin ir una un idad a ute ntica rnen te pe rce pt ual , qu e per rnit a rned ir la mag n itud de las pe rcepciones en si m ismas y no co n re­ lac ion a referen cias ex te rnas .

La ley psicoflsica Este problema se encaro in icialmente en la segu nda mitad del siglo XIX. Los fi­ siologos aleman es Weber y Fech n er propusieron un a ley psicoftsica q ue pre­ tendla vinc ular los est imulos can las per cepciones a cra ves de una rela c i6 n co rmi n a todos los sen tidos . Esta ley fue co ns iderada adec uada y se la reprodu ­ jo e n la mayorf a de los te xtos espec ializados h asta no hace muc ho t iern po . Au nque dio lugar a un a variedad de tecn icas y unidad es de medici6n en tre las qu e se enc ue n tra el decibel , en la mayoria de los ca sas no es n i aprox irnada­ mente co rrec ta . La definicion mas d ifundida de la ley psicofisica estab lece q ue la magn it ud psicol6gica pe rcibida es proporc io nal al logaritmo del estimu lo fi­ sica . Es dec ir, qu e mul tiplicaciones sim ilares en la magnirud del estfrn ulo ge­ neran adiciones prop orcion ales en la respuesta pe rceptual, t ransforrnan do un a esca la geornetrica en un a esca la aritrnet ica. En el caso del sonido , 10 anterior sign ifica simplemente que n uest ros ju icios sob re la sono ridad deben seguir

62

exactame n te un a escala logan trnica sim ilar a la pa urada en la esca la de decib e­ les: un esrfrnulo de 80 dB deberta ten er un a sono ridad dob le qu e un o de 40 dB. q ue a ca da ad icion de 10 dB le deb erfa co rresponde r un paso siemp re igual en son orida d. Como verernos a co n tin uac ion , nu ev as med iciones psicoac usti ­ cas refutaron estas afirrnaciones.

o

La sonoridad A pesar de qu e las recn icas q ue e mplea n al aida co mo un det ec to r de ce ro -eo ­ mo la de co rnpa racion de sonorida dcs- ha n probado ser utiles en la de te rmi­ nacion de los fac to res q ue afec tan la sono ridad , no proveen un a medid a direct a de la sensac ion percib ida. U no de los proced im ien tos emplead os pa ra resolver el pro ble ma fue aplica r la tecni ca de es timaci6n de magnitudes, en la qu e el oyente debe simplernen te as igna rle un ruim e ro a cada sonido de d ife­ ren te in te nsidad . Una a lterna tiva co ns iste en emp lea r la tecn ica de producci6n de magnitudes e n la qu e, a la in versa, el oyen te deb e ajusta r la intensidad de un estfrnulo de ac ue rdo a un num ero dado de an te rnano. Duran te la decada de 195 0 S te ve ns e rnpleo a mbos rnet od os para desa rro llar sus esca las de sonoridad, qu e descri ben la relaci6 n e nt re sonoridad -percep tual- e intens idad -ffsica­ (Stev ens, S . S ., 1959 ). Los pro blemas me tod o l6gicos q ue enco n tro fueron mu y grandes pues resu lta d iffcil cuantificar la sono ridad q ue es, como ya sabe­ mos, una mag n it ud enterarnente pe rceptual. S tevens tuvo q ue defini r un a n uev a un idad, el son, para c uan t ifica r d irecta rnen te la so no ridad . EI son es, fi­ na lmen te , un a un idad lin eal: un son ido de 2 sones posee el dobl e de sono ri­ dad qu e un o de 1 son, y un o de 3 sones el tr iple. A l igual que la altura, la sonoridad es un a magn itu d perceptual y deberta definirse a part ir de un a un i­ dad de referen d a estable. Pero co mo la estabilidad en el ca mpo de las sens a­ ciones es mu y poco confia ble, se to ma un a refe rencia ffsica ex terria: un a serial 1.000 H z y 40 dB (40 fones) pro duce par defin icion un son ida que posee un a sono rida d de 1 son (pa ra la altura ra rnbien se to ma un a refe rencia ffsica ex ter­ na: 440 H z definen e l La en mu sica j.l? A pa rtir de los trabajos de S teve ns se enco n t r6 qu e la relaci6n esn rnulo­ respu esta sigue aproximadamente una ley de potenc ia, diferen te a la ley loga­ rltrn ica de los psicoffsicos. Prop uso la siguien te relacion en t re la sonori dad (S ) y la intensidad ( I):

S = k [ 0,3 [son es] 10 El contex ro es aquf de gran imp orta ncia. 40 fones or igin an un son ido de 1 son s610 si en los ins tan tes prev ios el oyente se encuentra e n un ambie n te ex tre mada me nte silenc ioso_

63

EI valor de la co nsta n te I< depend e de las co nd iciones experimen rales y de las un idades empleadas. EI grafico de la figura 5 muestra la relaci6 n de Stev ens (no hay que olvidar qu e es consecuencia de exp erirnen tos realizados co n ondas si­ nusoidales y no co n estfmulos co rnplejos). Se puede obse rva r que a un aurnen­ to de 10 d B en el est fmulo Ie correspo nde un a dupl icacion de la sono ridad. A unque la relacion an terior ha sido rat ificada para sefiales mayores a 40 dB, se Ie hacen varias criticas: existen diferencias individuales rnuy grandes, y el re­ sultado se obtuvo a par tir de medias de pob lac iones muy grandes y d ispersas. Wa n'en enco ntro que la duplicac ion de la sonoridad correspo nde a un aumen to de la in ten sidad de 6 dB, en vez de los 10 d B de Steven s (Warren, R. M., 1970). Ad emas, aunque las tecnicas de estimaci6n y de producci6n de magnitudes tie­ nen la ven taja de permitir la obtenc ion de una relacion di recta ent re un pararne­ tro ffsico y un rasgo perceptual, a diferencia de la tecnica de comparaci6n de magn itud es, am bas asumen que los oyentes pueden usar los mimeros para califi­ car sus percepciones de un modo consisten te. Existen varias razones que perm i­ ten supo ne r que esto ultimo no siempre es asi, que los oyentes polarizan y sesgan sus ju icios de estimac ion acerca de la sono ridad que perciben . Sin embargo, asu­ miend o que el riesgo ex iste y extrernan do los cuidados metodol6gicos, la tecnica de estimacion de magn itudes es usada ampliamen te para medir la son oridad. Existe una objeci6n aun mas irnportan te: algunos autores desaprueban el heche de pregun tar por la sono ridad en sf misma. De ordina rio, eva luarnos ciertas caracte rfsticas de las fue n tes acust icas co mo un todo qu e in volucr a al con texte, a la perspect iva y a muchos otros factores circunstanc iales. La esti­ maci6n aislada de la sono ridad pa rece un a abs tracci6n muy diffcil de realizar. Helm holtz esc ribi6: "[...] estarnos mu y bien en trena dos pa ra evaluar los obje­ tos que nos rod ean , pero fallamos cornplet ame nte cu and o inten tarnos obser­ var las sensacion es per se [.'OJ" (H el mholtz , H. von, 1885).1l

Medidores de nivel sonora Los instrumentos de medi cion mas tradicionales en acustica son los medic10res de nivel sonora ,12 que perrniten determina r el ni vel de pres ion son ora. Por 10 ge­ n eral, tien en un banco de filtros en la eta pa de ent rada que per mit e medi r la sefial ac ustica tal como !lega al micr6fono -respuesta plana 0 lineal- 0 com­ pensada segun cie rto pat ron espectral. A s!, un med idor de n ivel sonoro en

Traducci6n de GB. Hermann Ludwig Ferdinand von Helmholtz (1821 -1894 ) fue un cien­

nfico aleman de destaca da actuacion en el campo de la fisiologta, la opti ca, la acustica y la

electr odinamica.

12 C onoc idos popu larmente como "dec ibelimeuos".

II

64

20 10

5 2

Ul ~

o

~

0.5 02

'0

'

~

0,1

g o

(f)

0,05 0.02 0,01

0,005 0,0 02 0001 11...L._ I

'

0

I

~_~_~_-:,.. 20 40 60 80

_

Intensidad (dB)

Figur a 5. Relaci6n de Stevens entre in tensidad y sono ridad

com pen saci6n "A" sigue de rnanera aprox imada la curva de respuesta del ofdo para un nivcl de sonoridad de 30 fones, en co rnpensacion "B" la de 70 fones, y en cornp ensacion "C" es practi carnente lineal. Cas i toda la norrnativa relacio­ nada co n acustica ambien ta l esta espec ificada en decibeles A. Por ejernplo, el n ivel equivalente de ruido acep table en zonas residen c iales no deberfa superar los 65 dBA en horarios de aetiv idad diu rn a ni los 50 d BA duran te la noche. S i se tornan dos lec turas de un a misma serial, una en dB lineales y o tra en d BA , por 10 gene ral la ultima dara un valor in ferior pues se filtran las band as graves del espectro de ruido. Los medidores de niv el sonoro, sin embargo, s610 son confiables cuando se los emplea para med ir sefiales continu as de larga duraci6n. Las respuestas percep tuales an te seriales imp ulsivas 0 muy co rtas no co rrespo nde n a la mag­ n itud que indi can . Los med idores ta mp oco proveen lecturas satisfactorias de la sono ridad de estfmulos compuestos muy separados en frecuencia. Y, por su­ puesto, no estan ca librados en sones, la un idad que debe ernplearse para eva­ luar la sonoridad prop iamente d icha. Sumario de unidades relacionadas con la sonor idad EI camino que nos !lev6 de la arnplitud de las ondas en el aire a los sones es co m­ plejo y se podrta supo ner de una dificu ltad innecesaria. Sin embargo, la auten­ tica co mplejidad esta dad a por la multiplicidad de mecan ismos que actuan en la cod ificaci6n aud itiva de la in tensidad. Para ilustrar esta situaci6n volvamos a las

65

I,

curvas isofonas de la figura 4: se las esquematiz6 en dos di mensiones - riotese qu e n o apa rece la dimension so no rida d-, pew en rea lidad deberfan haber sido repr e­ sentadas en tres d imensiones. En la figura 7 se puede ver un a porci6n de la re­ presenracion trid ime ns iona l, mas adec uada pew mucho mas d iflcil de leer. Para sin te t izar eI ca mino qu e llevamos reco rrido , la siguien te tabl a enu­ mera las difer entes unidad es relac ionadas con la sono rida d , co n sus un idade s y ca racte risticas par ticu lates.

Tab la 1. Magn itud es relacion ad as ca n la sono ridad (pa ra ondas ac ust icas plan as)

Magnitud

Naturaleza

Unidad

Rango audible

Amplitud Presion Nivel de presion sonora (NPS ) Inte nsidad N ivel de in tensidad (N I) N ive l de sono ridad So noridad

Fisica Fisica Fisica Fisica Fisica

Metro Pascal dB W/m 2 dB Fan Son

10 - II m - 10 ­ 5 m 20 ~ P a - 20 Pa Od B - 120d B 10- 12 W/ m2 -I W/ m2 Od B - 12Od B fa n - 120 fanes so n - 250 so nes

Hjbrida Psicol6gica

o o

3. D ISCRIMINACI6 N DE LA INT ENSIDAD La discrimin aci6n en intensid ad se refiere a la h abilidad de l sistema aud itivo par a detect ar di fere nc ias en t re la inten sidad de dos 0 mas est lmulos. Du rante eI siglo xx se rea lizaron numero sos ex pe rimen tos co n el fin de med ir los lfrni­ tes de este signi fica tive aspecto de la aud ic ion , qu e adquiri6 especia l impor­ tanc ia can la lIegada del aud io d igital.

Figura 6 . Medidor de nive l sonora

Sonon dad (sones)

Limen de in tens idad Va rias definici ones de la diferencia abenas perceptible (D AP 0 ]ND13 ) en in ten ­ sida d , tambien lIam ada limen de intensidad (t.L), fueron e mplea das en eI pasa­ do. En el prese nte las mas usuales so n :

an

1) L1L = 2) L1L = 10 log (& /1) 3) L1L = 10 log {(l +

an / l}

conocida com o fracc ion de We ber

NI

(dB)

la fracci6n de Weber definida en d B en dB. 70

I3

JND, de l Ingles just noticeable difference.

66

Figu ra 7 . Rep resentacion trid imensional de las curvas isofon as

67

-En todas ellas I es la intensidad de la seria l de base (el pedest al) y 61 la inten­ sidad del menor incremento de tectabl e par el ovente. Para medir ellimen de in ten sidad se emplea co n frecuencia el metodo de elecci6n for zada entre dos ouemaiioas (2 A FC ), en la que cada suje to de be op­ tar obligatariamen te po r alguno de los son idos qu e oye, aiin cuando le parez­ ca n ind istinguibles. El umbr al de discrirninacion se o bt iene cuando la d iferenc ia 6 1 e n el est fmul o prod uce el 75% de respu estas co rrectas. Esta tee ­ n ica se ap lica a part ir de tre s rnetodos pr in cipales: m etod o de det eccio n de rnodulacion, de deteccion de increm en tos y de discriminacion de estimulos pul santes. En la detecci6n de modulaci6n los oyentes deben n ota r la presencia de un a pequefia rnodulacion en a mp litud en una sefial dada. En ladetecci6n de incrementos y en la oiscrunuiacion de estimuios pulsaiues deb en perc ib ir un cam ­ bio en la inte ns idad de un est fmu lo esta nda r (el pedestal ).

8 kHz <,

1.5 t- .......

iii" "0 ;;:- 1.G1-c

o

200 Hz

1 kHz

40

60

80

Nivel de intensidad sonora

Figura 8. DAP en inr ensidad a)

b)

100 r

La L ey de W eb er

68

<,

0.5

, . - - - - - --

Para ruido de banda an cha se co rnprobo que el min imo ca m bio de in tensidad de tect able es una fraccion co nsta n te de la inte nsidad del est frnu lo . En otras pa­ lab ras, la razon 6 1/1 se rnan tien e co nsta n te. Este es un buen ejemp lo parti c ular de la conoc ida Ley de Weber, que estab lece que nuestro sistem a perceptiv o dis­ crimina carnbios porcentuales constan tes. La relacion 61/1 se llam a fracci6n de Weber y es h abitualmente expresada en dB co mo & = 10 log (61/0 . En el ran­ go de 20 a 100 d B el valor de & permanece entre 0,5 y 1 d B. C erca de l urn­ bra1de aud ibilidad la fraccio n de Weber au men ta dr asti cam en te, en parti cular a frecu enc ias par debajo de los 200 H z. En co n traste con los resultados an teriores pa ra ruid o de banda ancha, la fraccion de Webe r sufre un desvfo cuan do el esti mulo se constru ye co n sinusoi­ des: la discriminac ion mejora al aume nta r el nivel del estimulo. A 80 dB 6 L llega a ser de 0,3 dB, par deb ajo de la Ley de Weber. En la figura 9a se puede ver qu e el grafico de la relacion 10 log (6 0 en funcion de 10 log (I ) presen ta un a pe ndiente de 0,9 en vez de 1, tal co mo co rresponderia a la fraccion de W e­ ber exac ta, De ac uerdo con McGill y G oldbe rg, la diferencia q uiza se deba al ensanch arniento de la zona afect ad a de la membran a basilar a ca usa del in cre­ men to en la intensida d del estfmu lo sin usoidal ( McG ill y G oldb erg, 1968 ). El des vlo - aume n to en la di scriminacion- q ue sufre la Ley de Webe r pa ­ ra estimulos si nusoida les pur os parece relacionarse co n el patro n de e n rnasca ­ rarni ento: al aumen tar e l ni vel sono ro se act iva n otros ca na les espe c tral es que con tribuyen a la sonoridad genera l. Este ensan ch arn ien to de la zon a de in ­ fluencia en la mem brana basilar se p uede aprec iar en la figur a 10.

<,

-

-

----,

- Ley de Weber .... Desvio

'"

-4

.'

.'

~ 60

-6

0:::

~- 8

.' .'

OJ

.Q 040 20 f- /

OJ

0

0. 10

"

·12

·14 20

40

60

60

I

100

I

!

I

20

40

60

10 Iog(l)

80

100

10Iog(l)

Figura 9 , Ley de We ber y desvfo de la Ley de Webe r para esn mulos sin usoida les 100 90

iii" ao

:2­ 70 c

-0

u .cg

'u x

60

50

Q) Q)

40

"0

a;

30

Z

20

>

10 1000

2000

5000

Frec uenci a central (Hz )

Figura 10. Ensancharnien ro de la zona de la membrana basilar q ue explicaria el desvlo de la Ley de Weber para esrlrnulos sin usoidales

69

([- [J

Ley de Fech ne r para la sonoridad Co mo ya sabernos, la sonoridad es el correlato perceptual de la in tensidad ffs i­ ca, al men os en una primera aprox irnacion . Podemos supo ner, por 10 tanto, la ex istencia de alguna relacion ent re la d iscrim inacion de la sono ridad y la habi­ lidad de los oyentes para detectar diferencias de intensidad. La Ley de Fechner va un paso mas alia proponi endo que la fracci on de Weber, i'll/I, esta asociada a un incremen to constan re de la sono ridad i'lS (Fechne r, G., 1860):

LlS = k LlI/I en la que k es una consta nte . A unque esta relaci6n fue defendida durante mas de un siglo, se ha co rnprobado que es in correct a, tal como adve rti rnos antes , en este mismo capitulo (Zwislocki y Jorda n, 1986) .

4. OTROS FA CT ORES QUE INTERVIENEN

EN LA PERCEPCI 6 N DE LA SONORIDAD

In tegraci6n tempo ra l Ga rner y Miller enc ontraron que el umbral de aud ici6n de la sono ridad co rres­ ponde mas a una can tidad co nsran re de energ fa que a un a canridad co ns ta n ­ te de pot enci a -0 de in tensidad-, al rneno s sobre cierto tan go de duraciones (Ga rne r y Miller, 1947). Tiernpo despues, Hen n ing descubrio que para estirnu­ los de corta duraci6n la ene rgfa de l menor increment o detec table (i'lE) se mantiene co ns tan te , contra la creencia generalizada de la co nsta nc ia de la in­ rensidad.!" En 1995 Moore comprobo que para d uracion es menor es a 200 ms la in­ tensidad necesaria para la dereccion del esrirnulo se incrementa a medid a que la duraci6n disminu ye (Moore, B., 1995). Pareci era que el ofdo integrar a la energia de la serial: [ X

t

= ete.

En la que [ es el umbral de inrensidad para un pulso de duraci6n t. En la prac­ tic a la siguien te exp resion da mejores resultados : 14 G . B. Henning (1970) . Esre hech o ya h abra sido norado par Exner en 1876: "Tanto los umbr a les abso luros en sono ridad como la sono ridad en sf misma de pend en de la duraci6n del esrfrn ulo."

70

X t

=It x '! = ere.

donde IL es el umbr al para un pulso de larga duracion y 1: es una con stante que represen ra el "t iernpo de in tegraci on" del sistema aud it ive . La relac ion anterior es valida solo para intensidades ce rcanas al umbral. Lejos de l mismo no se puede asegurar la forma que ado pra la inr egracion de la ene rgia . Sola­ ment e se puede decir que, para un a in tensidad dada, la sono ridad crece h as­ ta los 200 ms de dur acion. Para men os de 80 ms de dur acion se pue de afirma r que , aprox imada mente, energ(a constance = sonoridad constante. Aquf la frac­ cion de Webe r disminuye 3 d B cada vez que se du plica la du raci6n del estf­ mulo. Mas alia de una c ierta durac i6n cr ftica i'lt la fracc i6n de Weber devi en e constante. Para dur acion es mayo res a 500 rns los umbrales son in de pend ien ­ tes de la d urac ion , EI valor crftico i'lt es func i6n de la frecue nc ia: decrece al aumen tar esta ulti ma y to rna valores que van desde 100 ms a 250 Hz hasra 10 ms a 4 kHz . Al parecer, integramas mejor los impulsos de alta frecuencia. En el organa de tubos no se puede mod ificar la int ensidad de cada soni ­ do porqu e las teclas s610 abren 0 cie rran las va lvulas que distribuyen el flujo de aire. Sin embargo, la integrac i6n temporal a energia co nsta n te le pe rrnite al organ ista modu lar agogicarnen te la sono ridad, act uan do un icarnent e sobre la durac ion -a l menos en los pasajes veloces. Fac tor es espectrales En un experime n to desarro llado en la decada de 1950, Zwicker, Flottorp y Steven s le pidieron a un grupo de oyentes que igualasen la sono ridad de una banda de ruido con la de un tone sin usoida l estandar (Zwicker, Flot torp y St e­ vens, 1957). Los autores co nc luye ron que si la so no ridad en cada banda crlti­ ca sigue la ley de la po te nc ia S = k [0.3, al distribuir la misma intensidad de la sefia] en n ban das crfticas se debe obte ne r un incremento en la sonor idad to­ tal sirnplernen te porque: k [ 0,3 < nk (Ifn )o.3 , para n > 1 En la actualidad se realiza el siguien te ana lisis para calcular la sono ridad total de un conjunto de esrfrnulos sin usoidales cornbinados. 1. Nunca se suman los niveles de presion sonora 0 los niveles de int ensi­ dad di rec tarnente: dos esn rnulos de 80 dB jarnas gene ran juntos 160 dB. 2. Si se desea n sumar seriales de frecuenc ias cercanas - ambas den tro de la misma band a crftica- se deben sumar en pr imer termino las in rensidades efi­

71

~---~p

:I

cace s, pues la in formacion de fase n o es rele vanre.J ? C an este resultado se pue­ de obtener el n ivel de in tensidad en dB . A co n t in uac ion se ext rae de las cur­ vas isofonas (figura 4) e l n ive l de son o ridad en fone s y, par fin, de la relacion de Stevens (Figura 5) se obtiene la sono ridad total. Par ejemp lo, si se su man dos sefiales de 100 y 120 Hz co n el m ismo niv el de in tensidad de 80 dB, el re­ sulta do da un Nl de 83 dB , equivalentes a 77 fones qu e co rresponden ap rox i­ madam ente a un a sonoridad de 12 sones. 3. S i se de sea sumar sefiales de la m isma frecuen cia el pro cedimiento es similar, pero en primer lugar de be n sumarse las a mplitudes porqu e aq ui la in ­ fo rma cion de fase resulta dec isiva al aparecer el fenorn eno de interferencia de ondas: dos seriales de 80 dB de la misma frecuen cia pued en dar lugar a un a cornbin ac ion cuy o n ivel te n ga entre 0 y 86 dB (Basso, G., 200 1a). 4. S i la diferencia de frec uen cia entre los estimulos supera un a banda Crt­ t ica, e n la pr actica es usual surnar d irect ame n te las sono rida des en sones. Sin emb argo, el escena rio es a lgo mas complicado, y sigue la curva de la figura 11. 5. Si los esti m ulos esta n mu y sepa rad os en frec uencia, en mas de tre s oc ­ tavas, se compo rtan in dependienternente uno del o tro y no puede h ablar se con prop iedad de un a ve rdadera sum a de son oridades, U n ejemplo n os perrniti ra comprender co mo se estructura la so nor idad total e n un son ida peri od ico co mp lejo . C on side re mos una o nda d ien te de sierra con un n ivel de intensidad de 100 d B y un a pe riodic idad de 200 Hz. Las fre­ cucn cias, niv eles de intens idad y son oridad es de los primeros oc h o arrn onicos seran ento n ces:

it = 200 Hz fz = 400 Hz h=600 Hz f4 = 80 0 Hz fs = 1.000 Hz f6 = 1.200 H z h = 1400 Hz fs = 1 600 Hz

NI

98 dB 92 dB :·)1 = 88,5 dB NI = 86 dB NI = 84 dB NI = 82,5 dB NI = 81 dB NI = 80 dB =

:~I =

Sonaridad = 70 sones Sonaridad = 45 sones Sonaridad = 40 sones Sonoridad = 35 sones Sonaridad = 30 sones Sonoridad = 20 sones Sonoridad = 18 sones Sonoridad = 15 sones

La son oridad total se obt ien e al sum ar las sono ridades de los primero s cinco ar­ m6n icos de acuerdo co n la figura 11 -la d istanc ia entre ellos supe ra el ancho de ban da crftico-, agregan do luego la ocasionada por los de mayor orden q ue cae n 15 Las bandas criticas se van a analizar en deralle en el capitulo Ill. Por aho ra, nos alcanza can saber que cor responden aproximadamente al 15% de la frec uencia central cons iderada.

n

30

I

I

25

~

20

c

a

<Jl

:;;

15

ro

:g a

s

10

(fJ

- - _ . Sonoridad de eada seria l (13 sones)

5

oI o

- - - Sonoridad eombina da

I

2

4

6

8

10 12 14

I

I

16 18 20

I

I

22 24 26

Sepa raei6n de alturas en 1/12 de oetava

Figura 11 . Son oridad cornbi nada de dos sinusoid es de 13 sones cada una. La freeuencia de la serial base es de 300 Hz

de ntro de bandas crft icas solapadas. En el eje mp lo se suma n las int ensidades de los arm6nicos 6, 7 y 8 que con tribuyen can 21 so nes al co nj unt o. La suma co m­ ple ta alc anza unos 200 son es. En comparacion , una sin usoide de 200 Hz ca n un nivel de in ten sidad de 100 dB determ in a un a sonoridad de apenas 80 son es. Se entiende clarame n te aq ui la causa del mayor ren dim iento sonoro asociado a un a serial pe riod ica cornp leja. Este es un o de los mot ives que exp lica el escaso em­ ple a de sefiales sin uso ida les en c ualq uier siste ma de co mun icac ion acustica,

Cambios en la sensibilidad au dit iva provocados po r so brcstim u lac i6n

Adaptaci6n auditiva U na propiedad co rruin a tod os los sen tidos co nsiste en q ue la respuesta neural ante estfmulos estab les de larga d uraci6n decae rapi da rnen te , luego de su apa­ ricion, h asta alca n zar un cierto "estado de equilibria" . Esta adaptaci6n awiitiva resulta de la in te raccion entre la en ergia de respues ta del oyente frente a un estimulo estac ion ario y la en ergia necesaria para mantenerlo en act iv idad . La co n trapar te psico logica es un a declinaci6n en la son o ridad aparente has ta q ue esta alcanz a un valor co nsta n te , So rp rende, sin e mba rgo , q ue la so norida d an te estirnulos de med ia a alta intens idad n o parezc a decrecer en el tiempo, Solo los esti m ulos de nrro de los

73

primeros 40 dB por encirn a del um bral presentan un a apreciable adaptacion auditiva. En la Figura 12 se rnuestra de manera esq ue rnat ica esta propiedad de la pe rce pcion auditiva. Las seriales de alta frecuencia se adap ta n mas profundamente que las de baja frecuencia, y los sonidos est ables en el tiem po 10 hacen mejor que los so­ nidos modulados, Si cumplen arnb as condicion es, es decir, estimulos agud os y esta bles, los sonidos pueden llegar a desaparecer cornple ta men te luego de un a expos icion prol ongada. Este efec to n o ocurre co n estfrnulos de baja frec uen cia . Las medi ciones tipicas de carnbio de urnbral po r adaptacion se re ali zan co mpa ran do las son orida des en el a taq ue y tres minu tos mas ta rde . En co n di ­ cio nes favora bles, la ada ptac ion puede alca nza r un a d ism inucion de sono rida d correspo n d ien te a un cambio de -20 dB en el esnm ulo. En la adLzpt.aei6n pawl6gica la sens ac ion a ud itiva desapa rece co mp leta me n ­ te an te un estirnulo co n tin uo a l cabo de un os segundos.

I[ I)~

II

I

I

I , ,

i

I

i

I ,

b: ~

Tiempo (s)

,

, I,

i

Tiempo (s)

, ~

Figura 12. Ad aptac ion auditiva (graficos esquernaricos)

74

.1

Tiempo (s)

i[ t:= , c7l

.1

Tiempo (s)

Fatiga awlitiva La fatiga auditiva es la perdid a tem po ra l de sensibilidad que aparece cuando nos exponemos a un son ido mu y intenso y se la mide luego de remover el es­ tfmul o q ue la ca usa. Ge ne ralme nte es ra ca rac terizada por el desplazamienw

temporario del umbral (TIS) 16. La fatiga aud it iva es mas ac usada a altas frec ue nci as. El maximo TIS ocu­ rre ent re 4 y 6 kH z y esta rel acionado co n el n ivel de pres io n aciist ica del rui ­ do - a mayor ni vel en dB ma yor incr em ento del um bra l-, co n la frec ue nc ia y el espec tro del m ismo - cu anto mayo r sea la frecuenc ia, has ta llega r a 6.00 0 H z, mayor sera el in crem en to de l um bral- y co n el patro n tempor al del ru i­ do -los ru idos intermitentes producen men os pe rdidas ternpor ar ias que los conti n uos. C om o ejemplo, podemos o bserv ar en las figuras 13 y 14 el deterioro y la posteri or recuperacion de la sensibilidad audi tiva ca usada por un ruido de un ancho de banda de una octava, centrad o en 4.000 Hz y co n nivel de presion sono ra de 85 dB. Observa mos que la sensibilidad aud it iva se recu per a totalmente solo 48 hor as despues de la supresion de la Fuente de ruido . S i un a persona, por ejern­ plo, reacti va la Fuente a las ocho h or as de h aberl a supr imido , su umbral desde el reinicio sera 10 dB mayor que el n ormal a ca usa de la fat iga aud itiva, obli­ gan do la a aumen tar 10 dB la pot en cia de la Fuente ac ustica pa ra alcanzar el ni vel deseado : su otdo vera m ult iplicada por d iez Ia ene rgfa recibida . Este pro ­ ceso pued e real ime n ta rse va rias v eces h asta alcan zar ni veles ca paces de provo­ car dart os no re versibl es, Algunos de los mecanismos fisiologicos in volu crados en la perd ida te rnporari a de la audi ci on son los m ismos q ue produ cen la per ­ dida perrn anente de la ca pac idad aud itiva . La diferenc ia es solo un a cuestion de grade . En la ac tualidad (no rmas ISO ) se co ns ide ran seguros n iveles de hasta 85 dBA, oc ho horas por di a. A partir de este va lor a ca da inc remen to de +3 d B en la inten sida d del estimulo le co rrespo nde una d isrnin uc ion a la mitad del tie mp o de expo sicion perrnitido.l? Por ejemplo, si se ap lica esta regia una per­ sona podr a exp one rse sin riesgo au di t ive h asta dos h or as por dia a un nivel co ntin uo de 91 dB. En algunas norrnas se est ipula un ni vel maximo, por ejern­ plo 115 dBA, q ue no debe superarse en ningun a circ uns ta nc ia.

.1 16 Del

ingles Temporary Threshold Shift.

17 Ya no se e rnplea la "regia de

los 5 dB" propiciada par cierras in du strias.

75

20

CD ~

ro

aume n tar el intervalo temporal en tre ambas sena les y desaparece luego de unos pocos cientos de milisegund os. El efecto es mayor si los dos estfrnulos tienen la misma frecuen cia y si son expuestos al mismo ofdo (0 a los mismos ofdos).

15

.0

Detecci6n de sefiales sin usoi dales en presen cia de ruido

E ::l

Q;

u

10

0

C ~ E ::l

«

5

o I 1

I 2

4

8

12

16

20

24

Tiempo de exposici6n (horas)

Figura 13. Desarro llo de las perdidas t ran sit o rias de aud icion

20

CD 15 ~

~

.D E .:: 10 ~

u

.8 c; ~

E ::l

«

5

~

0 \ 2

4

8

12

24

Para anali zar sefiales sin usoidales a las que se le agrega una banda de ruido se emplea una metodologfa simi lar a la que se usa para est udiar la discriminaci6n en intens idad entre sinusoides. Un efecto temporal relacion ado es el de des borde (overs hoot).18 El umbral necesario para deteetar un a serial breve es mayor si se la presenta cerc a del ata ­ que 0 la extinci6n del ruido en rnascaran re. EI efecto aurnen ta entre 10 a 15 dB cuando el ruido en masca ran te cubre un gran anc ho de band a y la serial es de alta frecuencia. Las compone ntes en frecuencia del ruido por encima de la serial son importantes para producir el efecro. El efecto de overshoot muestra que el umbr al para un breve estfmulo sinu­ soidal iniciado luego de l ataque de un ruido puede ser 10 dB mayor que si se 10 coloca , par ejemplo, 200 ms despues del inicio del ruido enmascarante (Zwicke r, E., 1965) . A lgunos expe rimentos poster iores sefialaron que , para que ocurra un gran efecto de overshoot, el ruido enmasca rante debe contener ene rgfa a frecuen cias alejadas de la frecuencia de la serial, y q ue esta energfa debe aparecer un breve instan te antes del ataque de la serial (McFadden, D., 1989). La figura 15 sintetiza los trabajos de McFadd en . Los mecanismos que da n lugar a estos result ados no se cornpren den toda­ via ca n clarid ad , aunque sin dud a esta n vincu lados con el principio de inde ­ terminaci6n acustico (vease el A pendice n) .

I

48

Patologias auditivas

Tiernpo de posexposici6n (horas)

Figura 14 . Rec upe rac i6n de l um bral una vez in terrumpid a la fue n te acustica

Incremento de Ia sonoridad En contraste con la reducci6n de la sono ridad producid a por son idos presentes sirnultanea rnente con el son ido de prueba (enrnascaramien ro), los son idos que aparecen antes del de prueba pueden a veces producir un incremen to en su so­ noridad. Si el primer est frnulo es, por ejemplo, 20 dB mas in tense que el segun­ do , los expe rirnentos muestran que este ultim o puede incrementar su sonor idad hasra la equiva lente a un aumento en intensidad de IS dB. El efecto decrece al

76

Los efect os del ruido sobre el siste ma aud itive human o se pueden dividir en desplazamientos temp orarios del umbr al de aud ibilidad (pe rdidas te mporarias o rever sibles, TIS) ye n desplazami entos perm an entes de dicho umbral (pe rdi­ das perrnanentes 0 irreversibles, PTS) .19 Estos ultim os pued en ser causados por la destrucci6n inm ediat a de las estruct uras ffsicas del ofdo, en cuyo caso esta­ mos en presen cia de un trauma acustico, 0 por el efecto ac umulativo de suce­ sivas exposicion es d urante un perfodo relativamen te pro longado . 18 La pa lab ra "desborde" no es un a rrad ucci6n lireral d e "overshoo t" (exceder, rebasa r, so­

bre pasar ), pero c reemos que describe mejor el fen ornen o alud ido .

19 De l ingles Pennanent Threshold Shift.

77

Candici6n

a)

L' -

co

co

~

Alto

-

---'­

_ 40

:s. 20 E co :2 "0 .Qj 10

Baja

o,

-- - --

e) _

durante 10 arias

Baja

b) l-

d)

~

I

40 haras semanales

j

c)!-

~

Umbral

Baja

- I

o

r

I

I

80

90

10 0

Nivel sonora en dBA

Alto

Fi gura 16. Perdi da perman ence de aud ici6n para f = 4.000 Hz Fi gura 15 . So nog rarnas esque rnat icos del efecco de overshoot. a ) y b): situac ion basica; c) a e) : efeccos del anch o de banda del ruido y del retardo en el a raq ue

oI co 10

Perdida permanence de sensibilidad Las perd idas aud itivas perrnanentes pueden di vidirse en d os gra ndes gru pos: las co nd uc t ivas y las sensoneurales (0 pe rcept ua les) . Las conductivas lIevan a un aume n to e n el umbral mas 0 menos pa rejo e n funci6n de la frecu enci a, mi entras qu e las se nso ne ura les son mas co mp lejas . El co noc im iento q ue poseemos del de splazam iento perrnan ente de l urn­ br al de aud ibilida d 0 PTS se basa en estu d ios realizados en industrias y en ex ­ per imentos co n ani ma les. De e llos se desprende q ue existe un a rel ac i6n aprox ima da men te lin eal en t re las pe rd idas de sens ibi lid ad y e l n ive l son ora de la expos ici6n por encima de los 85 d BA, ta l como se observa en la figur a 16. Se co ns ide ra q ue los ni vele s inferiares a 80 dBA n o producen efec tos n oci vos. La rel ac ion entre el tiempo de exposici6n y la variacio n espectral de las perdidas es mas co mpleja. Es co rruin q ue apa re zca d urante los primeros afios un a d isminuc i6n de la se ns ib ilidad a lrededo r de los 4.000 H z, a rnpliandose co n e l co rre r del tiempo h ast a oc upa r la banda comprendida entre los 3.000 y los 6.000 Hz. Este praceso se muestra en la figura 17 . Vemos q ue las frecuencias mas altas (entre 3.000 y 4.000 H z) son afec ra­ das en los pr imeros afios de exposic i6n , mientras que las men ores (entre 1.000 y 2.000 H z) son alca nzadas con perd ida s significati vas al cabo de 20 afios 0 mas. En los grafico s de las figuras 16 y 17 se ve con cl aridad qu e e l o fdo es m as sens ible , y par 10 tan to mas fragil , en la regi6n de alta s frecu enc ias que en la de bajas. Este hecho es e l ca usan te de la detecci6n ta rd la de la h ipoacu sia pro ­ vocada por ru ido, dado que la inteligibilidad de la palabra h ab lad a depende de

78

I

-- -

:s.co

20

~ "0

40

__ 5 arios

U .Qj

50

- - - 35 aiia s

n,

60

\

~ 30

70

\

\

,~..

I

I

I

I

I

125

250

500

1000

2000

.. -- ­ I

....

,," '" I

3000 4000

I

I

6000

8000

Frecuencia (HZ)

Figura 17. Perdida perrn an ente de aud icion en funci 6n de l perfodo de exposi cion

la energfa en frecuencias rel ati vam ente bajas: las personas ac uden al medico s610 cuando tienen d ificu ltades en la co mun ica c i6n oral, etapa en la que el praceso ya manifiesta un gran ava nce. En las figuras 18 y 19 se pued en ver microfotograffas de la membrana basilar en las que se aprecia el deterioro que sufren las ce lulas de Corti a causa del ru ido.

Recluwmiento auditivo El veciutamieiao auditivo oc urre c uan do el umbraI de aud ibilidad de un a perso­ na est a par enc im a de l n ormal, pero su audic i6n es normal a altos ni vel es de sonor idad . En e l suje to co n reclutamiento , la sonoridad aum en ta mas rapida­ mente con la intensid ad de 10 q ue oc urre en un oven te con o fdo pro med io -al me n os en las frecu enci as afecta das. Se podrfa asim ilar a un a suerte de cornpre ­ si6 n del rango de sonoridad .

79

Moore re lac iona e l recl utam ie n to aud it ive co n un dafio en las celulas c i­ liadas exte rnas de la membran a basilar, que imp ide la co rrec ta cod ificacion del ran ge d in arn ico del es tirnulo ac ust ico (M oor e, B., 199 7).

5. C ODIF1CACI6 N

DE LA INTENSIDA D

EI estud io de la codifica c ion d e la in tensid ad t ien e po r ob jet ivo exp licar la for ma que tiene el ofdo de info rrnarle a l ce reb ro sobre c ua n in ten se es un es ­ timulo . 0, mas es pecfficarnen te , po r la man e ra en q ue se configura la re pre­ sentac ion me n tal de la intensidad fisica de una seria l a pa rt ir de la ac tividad de las ce lulas ne rviosas de l siste ma a ud itive. Se h a ve rifica do q ue la cod ifica­ c ion de la in tensidad esta vinc ulada d irectarnente co n n uestr a habil idad pa­ ra d iscrim ina r en tr e estfrnulos de d iferente in tensidad . S i pode mos di stingui r en t re dos son idos, la d ife renc ia d eb e estar represe n ta da en todos los n iveles de la ca dena a ud it iva, desde la coc lea h ast a los ce n tros super ior es de de c ision . Los expe rime n tos de d iscrim in aci o n de la in te nsidad so n , por 10 tan to , la he­ rram ienta base pa ra c rear mcd elos de codi fica cio n de la inten sidad , Un primer mo de lo, mu y si mplificado , estab lec e q ue la intensidad de un estfrn ulo sin usoida l es cod ificada sirnple me n te po r la tasa de d ispa ro de las fi­ bras de Cort i sin to n izada s a la frecu en c ia del est frnulo : a mayo r in te nsidad , mayo r ca n t idad de d isparos por un idad de t iem po. Est e modelo , sin embargo, presenta varios in con ve n ient es. El pr obl ema del rango dinamico

Figura 18. Celulu« de Cort i en un aida sana

Figura 19. Ce lulas de Cort i en lin otdo dan ado par ruido

80

C omo hemos vista, e l sistema aud itiv e human e es capaz de de tectar d iferen­ cia s en la in te nsidad de los est frnulos so bre un gran ran ge d in arni co, tan gra n­ de co mo 120 dB en o yen tes co n o ido sano . La mayo ria de las ce lulas ne rviosas aud itivas, aque llas q ue presen tan un a rasa de d isparo re lati varnente alta, tie­ n en bajos umbrales de exc itac io n y rangos di n am icos co mparat ivarnen te pe­ quefios. C asi todas se sa turan a l llega r a un a inte nsidad de ap ro xima darnen te 60 d B cuan do son es ti muladas a sus frec ue n ci as carac terist icas. La pro po rc io n de fibr as en el ner vio aud itive q ue prese n ta n un arnplio rang o dinarn ico (60 dB 0 mas) es muy baja, de a lrededo r de l 10% de l tota l. Por 10 ta nto , se supo ­ ne qu e inte rviene mas de un mecanism o dife rente e n la d iscrirninaci on de la intensidad. Los ca mbios en int ensidad pod rian se r cod ifica dos po r cambios de la tasa de de scarga de las n euronas q ue ocupa n el ce ntro del pa tron de exc ira ­ c io n , po r un a exten sio n de l patro n de exc itac i6n (mas ne uro n as en t ran en operac ion), 0 por una corn bin acio n ent re ambos mecan ismos. La sensibi lid ad a la fase tarnbien parece in terve n ir en e l proceso. La impo rtan te Ley de Weber para ruido de band a a ncha, qu e co n tin ua ac ­ tu ando para a ltas intensidad es, deb e prov en ir de la ope rac i6n del siste ma a udi ­ t ivo, no de prop ied ades estadisticas de l esn mulo. Pero no se puede ex plicar a pa rt ir de la in formacio n cod ificada por un a sola n eu rona por los motives antes

81

apuntados. Es necesario encontrar un modelo que combine la tasa de disp aro de un n iimer o pequefio de neuronas, cuyos umbrales y cambios dinamicos es­ ten escalon ados de manera tal que permitan cubrir el rango dinarnico total del sistema aud it ive . La informacion de las neu ron as que responden a frecuencias caracter fsticas similares podria combinarse y op e rar en un "canal" indepen­ d iente . La ley de Weber parece responder a cada un o de estos canales, sin to n i­ zado a un ran go de frecuen cias dado y en paralel o con los demas. Buscando un a respue sta a este pro b lem a, C arlyo n y M oore sugirieron qu e e n la co d ificac ion periferica intervienen neuronas de d iferente umbral de d is ­ paro : a inte ns ida des moderadas inter vienen las n eu ron as de bajo umbral, lue­ go esras se sa tura n y son reemplazad as paul atinam ente por las de alto umb ral de di sparo (Carlyo n y Moore, 198 4). En la misma direccion, Delgute indica que son poc as las neuronas necesari as para dar cuenta de la discriminacion en inten sidad (D elgute, B., 1987). Segun este auto r, el numero requerido es de aprox irnada rnen te 100 neuronas. Si se ex tien de esta con cl usion a la totalidad de las celulas que ocupan la coclea, la dis criminacion deberfa ser mucho ma­ yor que la q ue tenemos (podrla ser de menos de 0,1 dB a 1.000 Hz). De ser cierta esta h ipot esis, la lirnitacion no depe nder fa de la infor m ac ion que trans­ porta el n er vio aud itivo sino de los n iveles centrales de procesa m ien to.

Codificaci6n por extensi6n del patr6n de excitaci6n Una ex plicac ion posible para la apa ren te paradoj a es qu e, al men os para esti­ mul os de banda a ngosta, la informaci on sobre la intensidad se obtiene tarnbien de las celulas a udi t ivas sin to n izadas a frecu en cias por en cima y por debajo de la frecu encia del estim ulo. A pesar de q ue las ce lu las correspondientes a la fre­ cuencia del esnrnulo se saturen, las que tienen frecuencias centrales diferentes reciben men os ex cit acion y contimian dentro del rang o de funcionamiento. Se ha sugerido que esta s celulas "fuera de frecuencia" son las responsables de la co­ dificacion a altas intensidades (Zwicker y Fastl , 1990). Sin embargo, los resul­ tad os de los experimentos sobre enmascaram iento demos traron que, a pesar de que la ex tens ion lat eral de la zona de excitaci on puede ayuda r a discriminar a altas in tensidad es, el sistema auditive puede cod ifica r la in tens idad sobre un gran ran go dinami co empleando s610 la infor macion prove n ien te de un a pe­ qu efia banda de frecuencias centrales en la membran a basilar.

las siempre en la zona de ac tiv idad , lejos de la saturacion, Est am os familiari­ zados con algo similar, el control autornatico de gan ancia en la vista , que nos permite ver bien tanto a plen e sol como en la rel ati va oscuridad de un cine. En el ca so de la vista la rec uperac i6n es bastante lenta y ne ce sit amos un buen tiempo para adap tar nu estr a sensi b ilidad al pas ar de un a sit uaci6n lum lnica a o tra diferente. En el caso de la aud icion , sin embargo, te nernos q ue ser capa­ ces de procesar son idos q ue va ria n dr am aticamente en in rensi dad sobre un in­ tervalo de tiempo mu y breve: n ecesitamos disponer de l rango d ina mico completo "al instante't" La supresi6n es un proceso no line al en el cu al un a in tensa excitaci on en una region de la membrana basilar reduce la excitacion en las reg iones veci ­ nas. Al tener un a co ns ta n te de tie mpo muy pequefia oc urre solarnente cuan­ do se presentan sim ulta n earn en te el estfmulo supr esor y el sup rim ido. Es posible que el mecanismo q ue produce la supresion ac tue tarnbien co mo un control automatico de ganancia para estimulos de banda anc ha, y ayude a dar cuenta del gran rango d in arnico del sistema auditivo.

Codificaci6n por sincronizaci6n neural C arl yon y M oore sugirieron qu e, en ciertas circunstanci as, la in te ns idad pue­ de ser codificad a por la estruc tura de segu im ien to de fase en las celulas audi­ tivas: un incremento en la int ensidad de un est imul o sin uso ida l en presen cia de ruid o puede ge ne rar un a ume n to de la can tida d de ce lulas sincron izadas con la estructura fin a del estfrnulo, diferente de la del ruid o (Carlyo n y M oo­ re, 1984). Los exper imentos rnostraro n, sin embargo , qu e este meca ni smo por sf solo no puede ser responsable del gran rango dinamico presen te en el siste­ ma auditivo.

Modelos basados en funciones intensidad-tasa de disparo Una hipotesis diferente establ ec e q ue las celulas de Corti co n altas tasas de d isparo son responsabl es de la cod ificac ion a bajas intensidad es, mie n t ras q ue las celulas de Cort i co n bajas tasas de disparo se destinan a co d ifica r los est i­ mul os a altas intensidade s, po r enc ima de la saturacion de las ante riores. Los modelos basad os e n esta hi p6tesis se denominan modelos de doble poblaci6n. La principal dificulrad q ue encuentran es la de explicar la co ns ta nc ia de la frac-

El papel de lasupresi6n y de laadaptaei6n Plac k y C arl yo n dan un muy buen ejernp lo.ipodemos orr el gri to : "[El psi copa ta em! bajando al corredor!", y a cori rin uacion los debiles sonidos de sus pasos en la esca lera (Moore, B., 1995) .

ZO

Una posible soluc i6n serfa que el sistema aud itivo pudiera ajustar el rango de ope racion de las celulas de acuerdo al ni vel de entrad a, de mo do de mantener­

82

83

]

.

_J ci6n de W e ber a 10 largo de cas i todo el rango dinarnico . Esta dificu ltad se in ­ cre me nta al constatarse q ue h ay much as mas celulas co n altas q ue co n bajas tasas de disparo . En uno de estos modelos de doble poblaci6n se sirnularo n las codifi cacio­ n es basandose en el nu mero de celul as necesa rias para c ubrir el rango din am i­ co comp lete a un a frecu encia dada: con s610 die z celulas comb in ad as es posib le irnitar al sistema aud it ive (Vie rneist er, N. E , 1988). S in em ba rgo, po­ see rnos mas de 50 para la m isrna funci6n. Es deci r, ten emos a la salida del n er­ via aud itive infor mac ion mas que suficie n te pa ra codi ficar los estimu los sobre un gra n rango de inte nsida des . Q uiza la pregunta no deba ser, en to nces , por q ue es tan buena la cod ificac ion a altas in te ns idades, sino po r qu e no es me­ jor de 10 q ue es a bajas in ten sidades.

Limites a la discri min aci6n en intensidad H ernos tr azado los ca rninos q ue pueden servi r pa ra represen tar la intensidad en el sistema a udi t ive pe riferico , A h or a co n side raremos el caso de los lImites impuestos por las tra nsforrnac iones q ue oc urre n en los ce n tros de proc esa­ m iento neural. En esta e rapa debe in co rpor arse un a de scripcion del rnec anis­ rno q ue perrnire q ue las in tensidade s pued en ser a lmacena das en la me mori a y de co mo las limitaciones de la mem oria afecran los resul tad os en las tareas de discriminacion.

Limitaciones perifericas )' centrales Los ex pe rirne n tos rea lizados par a determina r las ca rac te rfst icas de la di s­ c rim inac i6 n de la inrensid ad, par a ex c itac io n es qu e aba rca n un a so la fre­ c ue nci a ce nt ra l e n la mem bra na basi lar, a rrojan resultados co n t radic to ries . Mi entras los mod e los de doble poblaci 6n sugie re n q ue la d iscri m in ac i6 n esta ca rac te rizada por la frac ci6n d e W eber, los mo delos fisio logicos pre di ­ cen mej o r di scr imi n ac i6n a baj as y m edias intens ida des q ue a gra n des in ­ tens idades . La riqu eza de la in forma c ion presence en el n ervio audi tiv o y la falla de los mod elos de cod ificacio n basad os en las propied ad es de las fibras a uditivas, en su in ten to por ex plica r el ex ito de la Ley de W eber, imp lican qu e en a lgun pun to del pro ceso neural ce n tral no se h ace un uso co mple to de la informa ­ c ion q ue c ircula a ni veles per iferi cos (Carlyo n y Moore, 1984). Presurnible­ mente, esta lirnitacion ce ntra l de term ina el de sernperio de los oyen tes en las tar eas de discrim in ac ion de la in tens idad, y ev ita q ue el sistem a auditivo ten­ ga un ren di rnien to supe rior a bajas in ten sidades.

84

Memoria de la intensidad Muchos exp erimentos de d iscrim ina c ion de la intensidad emplean secu enc ias en las q ue dos intervalos de observac io n estan sepa rado s por un intervalo inter estfmulo (nt) . La a usenc ia de un efec to susta nc ial de este intervalo en las ta­ reas de di scr iminacion cita das suste n ta la h ipotesis de que los oyen tes emplean la memor ia de largo te rrn in o par a hacer las co mpa rac io n es entre el pri mero y el segundo de los esn rnulos. U n a lmacena m iento en la memo ria de co rto te r­ m in o deber la decaer en el t iernpo, ge ne rando una gran dependencia con la d u­ raci6n del inter vale inter estfrnulo. Como un ejernplo ex trerno, Poll ack ernpleo un llE de 24 h o ras y prac tic arnente no encontro de te rioro en la tarea de discriminaci 6n de la inten sidad (Po llack , 1.,1953). La memori a de la rgo ter rnino pu ede ser an ulada va rian do al azar, entre pruebas, la intensidad de los estimulos en los intervalos de obs ervaci6n. Cuan­ do est o ocurre , el ex ito en las tareas de d iscriminaci on de la intensidad baja notab lernente al a ume ntar el us. Por ejemplo , la fracci6n de W eber aumenta de 2 a 5 dB w ando el UE crece de 250 ms a 8 s. Esre ca rnbio se debe, presurni ­ blernente, al det eri or o del a lmace na rn ien to e n la memori a de co rto ter m in o.

Codif icacion de rasgos y codificac ion contextual Durlac h y Braid a di stin guieron dos modos d ifer en tes de operaci6n de la me ­ mor ia relac ionad a con la d iscri rninacion de la inrensidad : la codificaci6n de re s­ gos y la codificaci6n contextual (D urlach y Braid a, 1969). En la primera so n alm acenad as las sensac iones dircctas - in med iatas- producidas par el estimu­ 10 , que ti end en a dccaer en cl tiernp o (son afec radas por la d uraci6n del ut) . En el modo de cod ificacion co ntext ua l, por o rra pa rte , la in tensidad es cod i­ ficad a en relac io n co n un a in tensidad de refe re ncia externa 0 con relaci6 n a un a referenc ia interna "fuerte", como el umbral de aud ibi lida d 0 el umbral de molest ia, En circu n stan cias no rrna les la memoria de rasgos es suficien ternen te rica como para ser relati varnente in mune a la degrad ac ion con el tiempo . Pero si la informacion en la me moria de rasgos es redu cida grad ua lmen te, el sistema se ap oya cad a vez mas e n la cod ificacion contextu al - aunque esta no es efec­ tiva a intensidad es medi as debido a la di stancia qu e sepa ra a l est irnulo de los limites pe rceptuales de refe renc ia, Es ev iden te q ue el sistema aud it ivo necesita cod ifica r la in tensidad de mod o rela tive en muc has oc asione s, simple rnente po rq ue los objeto s aud itivos (como los fon emas en el h abla) se definen po r su in tensidad rela tiva, ya sea entre co mpo ne n tes espectrales 0 ent re eventos sucesivos, La intens ida d abso­

85

lura n o afec ra la identidad de los objetos a ud itivos en la ma yo rfa de los casos - juzgam os que es eI mismo per ro el que lad ra a 2 0 a 50 m de dist an cia. Es 10­ gico pensar, por 10 ta n to , que eI siste ma aud itivo deb a ex trema r su eficie nc ia para las co mparac iones en t re estfrnulos cercanos en el tiempo an tes q ue pa ra los separados po r mas de un os c ien tos de mili segundos.

_ •

)~~

Estimul o

¢

FiurO fiiadodea¢ la funci6n transferencia del oido externo/medio

Calcular el area bajo el patron especifico de sonoridad

Transformar la excitaci6n en sonoridad especifica

Transformer el espectro en patrones de excitaci6n

Figu ra 20 . Modele de Moore en bloques para calcular la sono ridad

6. M ODELOS DE PERCEPC16 N DE LA SONORIDAD Se h an elabo rado varios mode los fo rm ales qu e inten ta n descr ib ir cuan tirati­ vamen te la percepci6 n de la so no ridad . Zwicker desar ro llo un model o de so­ n or ida d basa do en la distribuci6n del patr on de exc itac ion en la me mbrana basilar (Zwicke r y Fastl, 1999 ). En su mo delo el estimulo es conve rt ido en una sonoridad espedfica POT banda ctitica (N -) a t raves de un a ley de potenc ia:

N - = C Ea En la qu e N - es la sono rida d po r banda c rltica , E es la in tensidad de la e xci ­ tacion, y C y ex so n co ns ta n te s co n ex < 1. Este mod e lo fue modi ficado por Moor e y Glasbe rg, qu ienes asume n qu e, por deb ajo de 1 kH z, la fo rma del filtro aud it ive es igual al co nto rno isofo ni ­ co co rrespo nd ien te a 100 ton es, y qu e por encima de 1 kH z la fo rma del filt ro esta de ter m in ad a por la inversion de la c urva um bral de audib ilida d (M oore y G lasberg, 1986 ).21 La exc itac i6n es co n vert ida en son oridad espec ifica por ba n da c rft ica a pa rt ir de la siguien te expres ion :

En la figu ra 20 se puede ve r el model o en bloqu es de Brian M oo re en su version de 1997 (M oo re, B., 1997). La sono ridad to ta l es pr op or cio nal al area baio un pa tron de sono ridad espe cifico . Este esque ma se ha incorpor ado a cie r­ tos medidor es de so no rida d - no de in tensidad 0 presion ac ustica-, y de ac ue r­ do con los info rm es parece q ue funciona razo nablem ente bien . A lgunos paqu e tes de softwa re para ac ust ica de sa las e mplean mod elos si­ milar es para brindar info rmac i6 n so bre pred icc io n de so no rida d y co n ellos es posible caleular los ecogramas e n un a escala de sones. En la figura 2 1 se apr e­ cia un ejemplo de esos ec ogra mas.

San a

I AO 0 1 lK

s

1~~-

_

~

I

-

---. --1 ----­

-1i-.-.---.-.LI .-

I

j

I -

-





,

-­ _ -

-





00

N - = C [(I senal)CL - (I umbral)CL ] Aquf I senal e I umbral son las inten sidades co rrespond ien tes a la excitaci6n y al umbral defin ido en el pa rrafo an te rior. N ot ese q ue si I senal = I umbrall a sono ri­ dad especffica es nul a, y qu e ce rca del umbral un peq uefio ca mbio e n la exci­ tacion provoca un ca mbio proporcion alrnente grande e n la so norida d. La sono rida d globa l se caleula in tegrando las so nor idade s espec fficas posit ivas a 10 largo del patron to tal de exc itacion . EI ex ito de este modelo al predecir la variacion de la sono rida d e n fun cio n de ca mbios en frecuenci a, in tensidad y anc ho de band a apoya la hipot esis q ue establec e q ue la sono rida d esta relac io­ n ad a co n la se lec t ivida d en frec uenc ia del sistem a aud itive periferi co, y n o d i­ rec tarne n te co n la in te ns ida d ffsica del estf rnulo aciist ico . 11 En

86

Figura 2 1. Ecograma e n so nes simulado para una butaca en la platea del Teatro Argentino de La Plata. La Fuente acustica ernitio un impulse de Dirac v irtual" " En este caso se utilizo el paq uet e C ATT- Acoust ic v7.Z.

Moore, B. (1995).

87

Capitulo III El oido como analizador espectral

En los capitulos precedentes mencionamos muchas veces las nociones de ban ­ da crfrica, ana lisis en frecuencia, discriminaci6n espectral V enrna scaramien ­ to. Ha llegado el memento de an alizar estos conceptos con det alle. La habilid ad para separar 0 resolver los cornponentes espectrales de un a serial compleja es consec uencia de la capacidad de analisis en frecuencia del sistema auditive . Por ejemplo, si dos flaut as afin adas a diferentes frec uenc ias se sopIan sirnultanea rnen te, es posible o fr al mismo t iempo dos sonidos dife­ rentes, Se sabe q ue el ana lisis en frec uencia dep ende en gran medid a de la ex­ ploraci6n espectr al q ue oc urre direc tam en te en la cocl ea. Toda sefia] cornpleja, como la que genera la voz hu mana 0 un instrumento de musica, es procesada en esta tempran a e tapa de la cadena auditiva. Los compone n tes si­ nusoidales 0 de banda angosta son separados, codificados V transmitidos de modo indep endiente por el nervio auditivo. Mas aiin , esta etapa temprana del ana lisis no puede obviarse: todas las sen ales sufren necesariamente dich o pro­ ceso. Por esto, la percepci6n de un son ido como un todo cohe ren te depend e del rearrnado que tiene lugar en algiin punto superior del sistema nervioso.

1. DI FERENCIA APENAS PERCEPTIBLE ( OAP) EN FRECUENCIA

Una de las pregun tas elernen tales relacionada con el terna es la que inqui ere sobre nue stra habilidad para discrimin ar ent re dos sefiales cuyas frecuencias son ligerame n te diferent es. La respuesta, obten ida a parti r de un procedimi en to psi­ coffsico clasico, int roduce el conc epto de diferencia apenas perceptible (OAP 0 JNO) t en frec uenci a, 0 limen de frec uenc ia. Para medirla se realiza un experi ­ men to en el cua l los sujetos oven alte rnativam ente dos sinusoides de igual so­ n orid ad : rnienr ras un a de ellas mantiene con stante su frecuenci a la otra la 1

En mgles, just noticeable difference.

89

Detectable

modi fica leve rnente. El o bje to es de te rmi nar la m in irna dife renci a en frec ue n­ cia necesaria para d isr ingui r e ntre a mbas seria les. En las figur as 1 y 2 se pue­ den ve r los va lores de la DAP en frecuencia en fun ci6n de la frccu enc ia de base. El resultado pued e sin tet izarse di c iendo que la DAP en frecuencia se man­ tiene ce rcan a a 1 H z par a frecuencias por debajo de 1 kHz y que crec e paula­

I 18 16

I

Sin cambio

~lL I' j ~LL ~ lli I - : ~

~

I

Frecuen cia

I

14

Mas dificil de detectar

~

~

I

~

~

~

Frecuencia

Ruid o enm ascaranle de ancho de banda variable

I

Frecuencia •

Sena l sinusoidal de prueba

Figura 3. Esquema del expe riment o de Fletch er

12

N 10 ;S

8

tin arnente a parti r de esta Irecuencia. Por encima de 5 kH z la DAP aurnenta mas rapidarnen te , y mas alla de los 10kHz, nuestr a h abi lidad pa ra disc rim ina r en tre d iferentes frec ue nc ias practicamente de sap arece . La cuestion camb ia si e n lugar de sinuso ides empleamos seriales per iodi­ cas comp lejas. Tal como ve rernos en e l ca p frulo v, e n est os ca sos la DAP pu e­ de llegar a se r tan pequefia como 0 ,1 H z.

'<j

6

4

2

64

125

250

500

1000

2000

4000

8000

Frecuencia (Hz)

2.

Figura 1. DAP absoluta en frecuen cia; a ) obten ida a partir de sefiales sin usoidales de int en ­ sidades medias, ent re 60 y 80 dB, b) ob renida a partir de sena tes sin usoida les de inrensida­ des ce rcanas al umbral de audibilidad (Wi er, [esteadr y Gr een, 1977 a)

0,9

0,8

0,7

0,6

-~~

Ya a med iados del siglo XIX alguno s in vestiga do res supo ni a n q ue el sistema aud it ive no funcio n a en bloque y q ue di v ide las sefiales para su tratam iento d et allad o. Una h ipot esis ternpran a planteab a la pre sencia de alguna cl ase de ana lisis de frecuencia a ni vel de l sistema audi t ivo periferlc o. Este pro ceso de anal isis en frec ue nc ia se h a estudiad o ind irectarnente a pa rti r del fen 6 men o de enmascaramien to , que ocurre cuan do un son ido enmascara 0 "tapa" a otro de di feren te frecuenc ia. El fen 6meno de en mas ca rarnien to se ana lizara con dew­ lle en el pu nto 4 de este capf rulo .

0.5

Experimento de Fletc her

0,4

0,3

El experirnento fund aciona l en este camp o 10 real iz6 H arvey Flet cher en 1940 .2 Fletcher midio el aumen to del umbral de deteccion pa ra una sefial si­ nu soid al en func i6n de un ruido enrnascar ante con de n sid ad de po te ncia cons­ tan te y banda pasante va riable. El ruido esraba centrad o a la frecue nc ia de la

0,2

0,1

64

125

250

500

1000

Frecuencia (Hz)

Figura 2. DAP relariva en frecuencia

90

B AN DAS C RiT lCAS

2000

4000

8000

Harve y Fletch er (1884-1981), ftslco e inge niero estadoun idense. Fue uno de los mas des­ tacados invest igadores en psicoac ustica durant e la primera rnitad del siglo xx.

1

91

sinusoide y su potencia acustica se incrernentaba a medida que crecia el an­ cho de banda. El experimento de Fletcher, que fue repetido gran cantidad de veces des­ de entonces, revelo aspectos desconocidos de nuestro sistema auditive. En la Figura 4 se aprecia un resumen de dicho experimento, realizado por Moore y su equipo en 1993 (Moore, B., 1997). En el grafico se observa que el umbra 1 de deteccion para una serial sinusoidal de 2.000 Hz aumenta al principio a me­ dida que crece el ancho de banda del ruido, pero a partir de un valor deterrni­ nado -400 Hz en la figura- se produce un quiebre marcado de la curva de umbral, que deviene practicarnente constanre. Para dar cuenta de esta singular caracteristica, Fletcher sugirio, si­ guiendo a Helmholtz, que el sistema auditive periferico se comporta como si estuviera compuesto por un banco de filtros pasabanda en paralelo (Ila­ mados fatros auditivos), cuyas bandas se traslapan. Cuando tr a tarnos de de­ tectar una serial en un ambiente ruidoso, usamos el filtro cuya frecuencia central (FC) se acerca mas a la frecuencia del estfmulo: la serial pasa pero atenuarnos gran parte del ruido de fondo, correspondiente a los otros filtros, Solo la porcion de ruido que atraviesa el filtro centrado en la serial la afec­ ta significativamente. Como es de esperar, si se incrementa el ancho de banda del ruido aumenta la porencia de ruido que pasa por ese Fittro en par­ ticular. Pero una vez que el ancho de banda del ruido supera al del Fittro au­ ditivo su capacidad enrnascarante deja de crecer. La parte del ruido que cae fuera del Fittro sintonizado con la serial no afecta nuestra habilidad para de­ tectarla. Se asume que el umbral de deteccion para una serial sinusoidal esta deter­ minado por la cantidad de ruido que atraviesa el correspondiente Fittro audi­ tivo. Mas especificamente, el urnbral estaria vinculado a una cierta relacion serial/ruido a la salida del Fittro. Este modelo es conocido como el mode1o del espectro de potencia, en el cuallos estirnulos estan reprcscntados por su espec­ tro de largo tiernpo, sin fluctuaciones transitorias que involucren cambios en las fases relativas. El terrnino banda cntica (Be), acufiado por Fletcher, gen cralmente se re­ fiere a un hipotetico filtro rec tangular que simula el cornportamiento de los filtros auditivos reales. El ancho de bandarectangular equivalente (ERB) es el an­ cho de banda de un filtro rectangular ideal que posee igual maximo de trans­ mision que el Fittro real y por el que pasa la misma potencia total ante una entrada de ruido blanco. Fletcher establecio las siguientes hipotesis, que defi­ nen su modelo del espectro de potencia: • El sistema auditive periferico contiene un banco de filtros pasabanda lineales.

92

76 75

ill "0

~

74

C1l

>c

Q)

if)

~

73

~ .0 E 72

::J

71 70 50

100

200

400

800

1600

3200

Ancho de banda del ruido enmascarante (Hz)

Figura 4. Umbral para una sinusoide de 2.000 Hz en funcion del ancho de banda del ruido enrnascaranre

• Cuando un oyente intenta detectar una sefial en un entorno de ruido emplea un filtro auditive centrado a la frecuencia de la serial. En general es el Fittro que entrega una mayor relacion sefial/ruido de salida. • Solamente una banda angosta de frecuencias que rode a al estfmulo, aquellas que caen dentro de la BC, contribuye a enmascararlo. • El umbral de deteccion de la sefial esta deterrninado por la cantidad de ruido que pasa por el filtro auditivo correspondiente. La potencia del esnmu­ 10 P dividida por la potencia del ruido dentro de la banda crftica es constante (k). k = P / (W

X Nt' ) W=P / (b N o )

W

=

ancho de la banda critica, en Hz.

N[. = densidad de potencia del ruido, en watts/Hz (la potencia en una banda de 1 Hz de ancho).

Midiendo P y No es posible estimar W. Segun Fletcher, la constante k vale aproximadamente 1, aunque mediciones recientes la sinian en 0,4. La diferen­ cia tiene que ver con el contorno espectral del ERB equivalente, que no fue to­ mado en cuenta por Fletch er, Sabemos que ninguna de las hipotesis anteriores es estrictamente co­ rrecta: los filtros no son lineales, los oyentes cornbinan la informacion de varies filtros para aumentar la capacidad de deteccion y el ruido que cae fue­ ra de la banda pasante del filtro auditive atecta al umbra] de deteccion, Pe­

93

5000

ro estas imperfecciones no imp lican que la hip6t esis central del mode lo es­ te eq uivoca da . De hecho , gran parte de los avances en el ca mpo se han ba­ sado en ell a. La forma rect an gular de l filtro auditivo propu esta por Fletcher merece un cornenta rio aparte . Si el filtro fuese perfectarnente rect an gular el umbr al de det ecci6n deber fa crecer a una rasa de 3 dB por cad a duplicacion de la banda de ruido , En la figura 4 se puede ver que !a curv a de crecimiento tiene una pendiente much o menor. Este desvfo del valor reorico se debe probable men ­ te a dos fact ores: el filtro no es rectangular, y las pequefias flucruacion es del ruido afecran la detecci6n de una manera aprec iable.

~

~ U '"c: '"

2000 1000

"0 D

,

500

Q)

0

s: o c:

,,

200 100

R efin amien to del modelo de Fletc her

P = k fo~ W (f) N(f) df Midiendo los ca mbios en el umb ral de detecci6n de P en func i6n de l ancho de band a del ruido, es posible evaluar la forma de l filtr o aud itive W(f) . En gene ral se eligen ruidos de band a ang osta en vez de sinusoides co mo enrnascarantes a fin de evitar los batidos que se gene rarfan con la seria l en­ rnascarada. Para ruidos de banda muy angosta, sin emb argo, aparece n fluctu a­ ciones que pueden ser oidas. Otro mot ivo por el cua l se eligen ruidos de ban da co mo en masca rantes es que mucha s veces el filrro aud it ive que gene­ ra la mayo r respuesta es uno ce ntrado a una frecuencia diferente de la fre­ cuenc ia de la sefial a derectar, Esra impo rtan te ca rac te rfst ica, en la que e l ofdo explora el ca mpo audible "moviendo" su ventan a espec tral para buscar la mejor respuesta, se den omin a audici6n [uei a de frecuencia.3 Para desact ivar este efecto se co loca ruido a ambos lados de la zona de ex plorac ion con el me­ rodo de supresi6n de bandas por cooet tuta de Patterson , que se describe en el apa rrado siguiente. Otro rnetodo muy ern pleado para esrudiar la selectiv idad en frecuen cia del ofdo co nsiste en medir las curvas de afina ci6n psicoaciistica, en las que se emplea ruido de band a an gosta para evitar la interferen cia de los batid os. 3

Off-frequency listening en ingles,

94

,,

c).

~£. - - - - - - 1 0 0 Hz

I

L

0,05

EI modelo de l espectro de pote ncia se emplea com o punta de partida para el desarroll o de modelos mas precisos. Si el ruido enrn ascarante se representa por su espec tro de pot encia estac io nario N(f) y la forma espec tral de l filtro aud i­ tivo por W(f) , la potencia de la serial en su umbr aI P se puede calcular con la siguien te ex presi6n:

, ". "

'l-\

"0

«

, ,,

0,1

0,2

0,5

2

5

10

20

Frecuencia (kHz)

Figura 5. An cho.de banda crft ico en funci6n de la frec uenc ia cent ral. Las Iineas de pun tos indic an aprox imac iones lineales para baja yalta frecuenc ia (Zwicke r, Flottorp y Steve ns,

1957)

En la figura 5 podernos apreciar el ancho de band a crftica en funci6n de la frecuencia central de ban da. Para frecuencias medias , la banda crit ica tiene una extension de a lrededo r del 15% de la frecuencia cent ral (corre spon de a un intervalo musical a media ca mino en tre un ron o -segund a mayor- y un to ­ no y med io -tercera menor) .

MetoOO de supresi6n de bandas por cobertura Para satisfacer las condiciones impuestas por el modelo de Fletcher es necesa­ rio, entonces, usar un ruido enrn ascarante q ue ev ite la aud ici6n fuera de fre­ cuencia, y que ade rnas limite el rango a lrededo r de l cual la relaci6n sefial/ruido man tiene valores sign ificativa rnen te a ltos. EI ruido enmascarante disefiado por Patterson , cuyo espec tro se puede apreciar en la figura 6, cumple can ambos requi sitos (Patterson , R. D., 1976 ). La forma del filt ro audit ivo puede estudiarse midien do el urnbral de pot encia P para la serial en funci 6n del ancho de la muesca en el espectro del ruido. El ernpleo de ruidos enrn ascarantes de esta clase es muy cormin en el es­ tudio de sefiales tran sitori as, pues las band as lat erales "cubren" los puentes es­ pectra les provocados por las tran sicion es rapidas de la sefial, que aparecen com o consecuencia del prin cipio de ind et erminaci6n acustico (Basso, G., 1999, 2001a).

95

. . · ·.·······.·.·.

. .·.. . · . . .·.·..·

"r-- - - - -- - - - - - - - -- - - - - - - - --"

~ l -;;; ~

M

M

··~· · ·

Banda de ruido enmascarante

Banda de ruido enmasca rante

.~ J!!

VI

~ ro

Filtro auditivo

o

0

31mm 28

24

20 17

13 mm

Distancia al eslribo

1,0

!'!

'u e

'0

a0. 0,5

$

o

a.

E

o

+

Frecuencia (escala lineal)

2000

N

£

c

Q)

I I I I'

I

i

I

I I I I i I

I

'

I

200

Q):;

Q)

o e

, lk

,! ,

2k

,

...

51<

Frecuencia (Hz)

f es la frecuencia central de la band a en Hz. Cada ERB corresponde a una distan ­

500

co 'S

'0

""

200 300 500

1000

'0 0­

elli

100

I I I I II

'0>

ro ~ .oro

' ,],-,

20 30 50

. Figura 8 . Posic ion del maximo de resonanc ia en la membrana basilar al ser estirn ulada por una serial sinus oidal de frecuenci a variable (Bekesy, G . Von , 1960 )

Q)

Q3ro


0,0 I

Figur a 6. Esq uema del ruido en rnasca ran re usado por Patterson pa ra estima r la forma del filrro aud irivo

100

.r: J)l

u u e Q)


50

~

i.L 20 I f il l

I

t

0,05 0,1

0,2

I I I 11' 1

0,5

1

I

I

2

I I I I III

5

10

Frecuencia central (kHz)

Figu ra 7. Esrirnacion de l ancho de band a de l filuo rectan gular eq uivalen ce en funci on de la frecuencia cent ral

Forma del filtTO auditivo

cia de alrededor de 0,89 mm en la membran a basilar. La con jetura de Greenwood se basa en las mediciones realizadas algunos afios an tes por Von Bekesy. Si el filtro aud it ivo fuese lineal su forma no carnbiarfa con la intensidad de l estlmulo. Pero no es asi: a bajos ni veles de excitacion es aprox imadarnen­ te sirne trico, pero deja de serlo a medida que aumerita la po tencia de la serial, En el grafico de la figura 9 se puede ver la forma del filtro auditive en fun ci6n de la intensidad. En particular, la ex tens i6n de baja frecuencia posee un an­ ch o de banda mayor que la de alta frecuencia. Esta acep tado que las bandas criticas son con tin uas pues no ha y ev iden­ c ia experimen tal de d iscontin uidad en tre ellas. Podemos hablar de la existen ­ cia de un a band a crlt ica alrededor de cualquier frec uencia audible. A veces, es util especificar la esca la de frecuen cias de un experimento to ­ man do el anc ho del filtro rect an gular eq uivalen te como unidad: Niimero de ERB = 2 1,4 10g lO (4,37

Experimen tos co mo los anteriores, y otros sim ilares, han llevado a los inves ti­ gado res a form ular qu e el filtro rectan gular equiva lente sigue aprox imada me n­ te los valores de la figura 7. G reen wood prop uso en 1961 qu e el an cho del filtro rectan gular equivalcn­ te represen ta un a distan cia cons tante a 10 largo de la mem bran a basilar. La re­ laci6n de G ree nwood, corregida por G lasberg y Moore (1990 ), es la siguien te: ERB

96

@

Extremo basal Extremo apical

=

24 ,7 (4,37

f+

1)

f

+ 1)

En la actua lidad se puede predecir a parti r de q ue n ivel una serial compleja puede ser detec tada en un arnbiente de ru ido calc ulando los umbrales de sus parciales mas prominentes. Para frec uencias medias el criterio di ce que con un a relaci6n sefial/ru ido de -4 dB la sefial com ienza a ofrse. Es decir, que el es­ tfrnu lo deb e superar el ni vel a -4 dB del ruido de salida del filtro audi t ivo que le corresponde. Un modelo que ap lica cons ideraciones similares fue usado co n exi to en el disefio de sistemas de co mun icac i6n en aeropuertos, a mediados de la decada de 1990. 97

]

~

90 Sumatoria de sonoridad

90

80

80

70 (il OJ

m 60

:s ro

:9

co

Z

-0

60

--0g c

40

50

0


Qj

.2:

70

ro

50


OJ

-0

c

,g

OJ -0

30

40

Q;

>

Z

20

30 20

10

20 dB

I

I

10 50 0,6

0,8

1,0

1,2

1,4

100

200

500

1000

2000

Ancho de banda (HZ)

1,6

Frecuencia (Hz)

F igura 9 . Form a del filrro aud it ive cen trado a 1.000 Hz en func i6n de la in rensidad del esruu ulo, de 20 a 90 dB en pasos de 10 dB

Figura 10 . N ivel de so nor idad para un ruido de ban da ce n trado en 1.0001-t en funci6n del an ch o de band a

3. SONORIOA D A NT E ESPECTROS COM PLEJOS

U mbral para estimulos complcjos

En cl aparrad o 4 de l capitulo J] an alizamos la infl uen cia de los fact ores espec­ qu e in te rvi en en en la percep cion de la son oridad. Pcdernos aha ra exa ­ m in ar el tem a dcsde otra perspectiva. Cons ideremos un a sefial aciistica de intensidad fija y an cho de ban da va ­ riable W. Mi entras W se manten ga menor que la banda crftica BC la sonori­ dad sera mas 0 men os indepe nd ien te d e W, e igua l a la de un tono puro de igual intensidad situado en la frecuen cia cent ral de la banda. C uando W su­ pcra la BC , la sonoridad comienza a incr ementarse. Por 10 tanto , para una dcu .nn inada can tidad de ene rgfa la sonoridad es mayor si la enc rgfa se repar ­ l ~_ sobre un ruim er o de bandas crfticas, en vez de estar co n ten ida en un a so la de ellas. En la figura l O se aprec ia el aurnento de sonoridad alud ido. 4 Esre efec to es mu y importante en musica ya q ue el a ument o de sonoridad dcpcnde de la suma de las sonoridades especi ficas en las d ifercn rcs band as. Por cjemplo , doblar un bajo a la octava es mu ch o mas efectivo, desde el pun to de vista de la sonoridad , que dob larlo al unfsono a unq ue la energfa ffsica puesta en juego sea la misma.

Cuando dos est irnulos sin usoidales poco separados en frecu encia se prcscn tan juntos, puede olrse sonido aun cuan do cada esnrnu lo por sf mismo esre ubica ­ do por deb ajo del umbra]. G assler propus o que, dcntro de un a banda cr ft ica, las energias de los co mpone n res de un est fmul o complejo se surnan algebra i­ ca men te.? Spi egel , por el con trario, sugiere qu e el ofdo es capaz de in tcgrar la en ergia sob re anc h os de ban da mayores que un a BC (S piegel, M . E, 1981). Al gunos ex pe rimentos real izados co n sin uso ides mu y sep aradas confirman es­ to ultimo.

I rules

4 A lgunos autores 10 denorninan "surna de sonoridad"

98

(loudness summation).

Sensibilidad a la fase En un ce lebre exp erirnento rcali zad o por Zwicker y rep et ido casi iuc dio si...lo mas tarde por Sek se ern plearon dos sefia les csrac ionarias , una modulada en amplitud can un Indice de modulaci6n m y o tra modu lada en frecuenc ia ca n un fndi ce de modulaci6n b (Sek, A. , 1994) . S i se igualan los Indices de mo ­ du lacion (m = b) y b es pequefio , el espec tro de potenci a de las scn a les es ; G assier (1954 ), en Moore, B. (1995).

99

identico. Las co mponentes de las sefia les s610 d ifieren en sus fases relativas. EI resultado de este experi mento muestra q ue somos sensibles a las fases rel a­ t ivas de una sefial esta cionari a cuando las componentes caen dentro de una misma banda crftica. Por el cont rario, cuando las co mpo nen tes se encuen­ tran separadas en frecuencia por una dista ncia que supe re el valor de un a banda crit ica, las fases relativas dejan de percibirse. So lo en este caso parece va lida la ley acustica de Ohm, q ue pos tu la la insensibilidad a la fase del siste­ ma aud itivo.? Di scriminacion de parciales en sonidos co mplejos La ley acust ica de O hm tambien estab lece que el ofdo es capaz de percibir los componentes sin usoida les en un son ido complejo . Plornp enco n tro que esta hab ilidad llega, segun la frecuen cia de la fundame ntal, has ta el q uin to u octa­ vo parc ial (P lomp, R., 1976). Co n su rnetodo -diferen te al de Fle tche r- est i­ mo un valor para la banda critica algo menor a la medida por el metodo de enmascaram ien to . Plom p introdu jo la h ipotes is adicional de que un parcial puede ser ofdo en el entomo de otros parc iales si se encuentra separado de es­ tos ultimos por 10 menos en 1,25 veces el valor del ERB de l filtro aud itivo que le corresponde. Los experimentos de Soderquist parecen probar que los musicos poseen bandas crft icas menores a las de los no rmisicos (Soderquis t, D. R., 1970). Sin embargo, Fine y Moore mostraron que no hay tal diferenc ia (Fine y Moore, 1993). La interpretacion mas aceptada es la que presume la exis tenc ia de al­ gun meca nismo, mas entrenado en los musicos, que actua a n iveles no perife­ ricos en la de tecc ion de parci ales. Selecti vidad en fr ecuencia en ofdos dafiados Hay considerable evide ncia de que la select ividad en frecue nc ia d ismin uye por dafio en la coc lea. Una co nsec uencia es la gran sens ibilidad al en rnasca­ ram ien to q ue posee n las person as con lesiones coc leares, con la consiguie nte dificu ltad para ofr en am bien tes ruidosos. Un impedimento ad icional apa rece ante el analisis percep tual de son idos complejos como la palabra y la rmisica , por ejernp lo en la disrninucion de la habilidad para distinguir entre diferentes t imbres. Co n los audffonos conven cion ales no mejor an estas dificu ltades pues, aunque conv ierta n en audibles las seriales, no se recupera la selec t ividad en frecue nc ia perd ida. 6

Ohm (1843), en Moore, B. (1995).

100

4.

ENMASCARAMIENTO

EI enmascaramiento acustico es un fenorne no habitual en nuestra vida cot idia­ na. Cuando elevamos la voz para ser oidos en una reunion, cuando perdemos parte de un a conversacion que es "tapada" po r el paso de una motocicleta con el escape libre, 0 cuando el ruido de una aspiradora nos imp ide seguir un dia­ logo en el televisor, 10 estamos experimentando. La cuestion puede plantea r­ se de la siguiente man era: si alguie n esta oyendo un son ido inten so a un a cie rta frecuencia, lqu e in tensidad debera tener ot ro sonido, a un a frecuen cia difere nte, para que 10 poda mos percibi r? EI enmascaramiento se defin e como 1) el proceso que provoca un aume nto de l umbral de audibi lidad para la serial enmascarada 0 2) la cant idad de aumento de l umb ral expresada en dB. Wege l y Lane publicaron el pr ime r trabajo sistematico de investi gacion sob re el enmascaramien to de un to no po r otro, pero sus resultados se cornpli­ caron por la apa ricion de batidos entre las sefiales (Wegel y Lane, 1924). Pa­ ra supera r el problema en los exp erimen tos recien tes se emp lea ruido de banda angosta tanto para las seriales en mascarante co mo enm ascarada. Los patrones de enmascaramiento obtenidos experimen ta lmen te mues­ tran una pendiente mas abrupta en la zona de baja frecuenc ia que en la de al­ ta frecuencia, tal como se aprecia en la figura 11. Los graficos anteriores ponen en ev idencia el uso simul taneo de mas de un filtro aud it ivo. Una explicacion posible es interp reta r esta forma como un ind icador del mod elo de excitacion del ruido enmascarante : el patron de en­ mascaramiento seria pa ralelo al patr on de la excitacion, pero desplazado ver­ t icalmen te una pequefia cant idad de dB. En la practica la cuestion no es tan senci lla, pues tambien in tervien en los facta res propios del mecanismo de "oi r una frec uencia diferen re" y la de teccion de los productos de cornb inac ion en­ tre la seria l y el ruido enmasca ran te. Moore y G lasberg descri bieron una forma de derivar las curvas de enrnas­ ca rarniento usando el co ncepto de filtro aud itivo (figura 12) , en la q ue supo­ nen que el ancho de banda de los filt ros aumenta al aumentar la frecuen cia ce ntral FC (Moore y G lasberg, 1983). A la descripcion anterior se le debe agregar la acc i6n de las ondas progre­ sivas en la mem brana basilar segun el esquema de Von Bekesv. Una frecu en­ cia elevada pro duce un maximo de vibracion en la membrana basilar cerc a de la ve n tana oval, mien tras que una de baja frecue ncia se esparce practicamen ­ te por toda la membran a. Esta caracterfst ica de "enrnascarar hacia las frecuen ­ cias agudas" se puede ver en el grafico de la figura 13. Como se observa en la figura 13, la segun da sefial se pe rcibe con facilidad si su frecuencia esta alejada de la frecu encia de la serial enmascarante, pero la

101

100

I

i

I

I

j

I

100

i

a ....··.... Umbral de audib ilidad

80

Intensidad del ruido do banda angosta

80

.,."

CD

:2­

B

Aumento del umbral causado par una banda de ruido Aumento del umbral causado par una sinusoide

2

c:


~

c

CD 60

:2- 60

E

b

0

c;

40

0

so

'"o

40

Qj

~ 20

.2: Z

E c:

20

ill

-<..:::r /

oI 100

250

J '"

i

-"""'T=-

I

1000

2000

4000

'--

500

J,..

I

'-i

8000

Frecuencia (Hz)

g

""W u c: '0 13

400

800

1600

3200

Figura 13. C urvas de enrnascaramie ruo : a ) umbr a ] de audibilidad, b) aumento del umbral causado par una banda de ruido y c) aurnenro delumbral causado por una sinusoide

c

0

~

200

Frecuencia (Hz)

Figurn 11. Parrone s de enrnascararnienro para ru ido de band a angosta centrado en 500 Hz

CD

0

dificultad crece apreciablemen te a medid a que ambas sefiales se acercan. Esro no deberfa sorp rend ern os pues sabemos que, si comparten un a rnisma banda crit ica, dos seriales se perturban mut uamen te y la mas debil no se percib e a menos que posea un porcent aje apreciable de la ene rgta de la mas in tensa, al­ ga asi como 6 u 8 dB por debajo de la enrnasca rante . C uando la segunda serial est imula una banda crit ica diferente, sin embargo, el estim ulo llega al cerebra por un canal separado y todavia no ocupado: la serial enmasca rada puedc per­ cibirse estan do aun 30 0 40 dB por deb ajo del ruido.

-10 -20 -30

~

OJ

u ·40 c: 0

D.­

-50 0,5

1,0

1,5

2,0

R elaci6n en tre las bandas cr iticas y el mecanismo de en mascaramicnto

Frecuencia (kHz)

0 -10

CD

:2-

-20

c:

·0

'u -30 .8 u x

ill

a

-40 ·50 0 ,5

1,0

1,5

2,0

Frecuencia (kHz)

Figu rd 12. Der ivaci6n del patron de enmascaramiento segun Moore y G lasberg

102

H ay mu ch as semeja nzas entre las select ividades en frecuen cia med idas tan­ to en la mem brana basil ar co mo a partir de expe rimen tos psicofisiolcgicos (Moore, B., 1995 ): cada a ncho de ba nda rectan gular equ ivalente ( ER B) co ­ rrespon de a alrededo r de 0 ,9 mm en la membrana basilar, sin qu e irnpor te el centro de frecuencia co ns iderado . S in embargo, a pesar de la buena co­ rrespon dencia entre e l co mpo rtarnien to de la co clea y la medida de los ERB, es posible qu e ex ista un mecani sme de "afinac ion " del anch o de banda en etap as supe ri ores de procesamiento. Esto podrfa lograrse a traves de me­ can ismos de supresi on 0 inhib icion la teral. Si la ba nda cr it ica de pe nde de un proceso n eu ral inhib itori o, se pued e esperar q ue el mismo demore algu­ nos mi lisegun dos en ac t uar: la band a c rft ica para sefiales co rtas deb e rfa ser mayor qu e para sefiales largas. Los datos ex perimen ta les en este pu nta se con trad icen .

103

ZIIIIIlUb-------------------­ I

M odel a s de cobertu ra y su pres ion H ay dos modelos q ue explican el proceso de en mascararn ienr o. EI mod e lo de

coben usa in vol ucra la sa turac ion de la ac tiv idad n eural ev ocada por la sefial. S i el ruido en mascaran te prod uce una can tidad significa tiv a de ac t ividad en la banda crit ica que norma lme nte responde a la seria l, en tonces la act iv ida d agregada por la seria l resul tara cubiert a y no se la pod ra detectar, Consi dere­ se, po r ejemp lo, el caso de un tono jun to a un ruido de ba nda ancha . EI urn­ bral del tono esra a -4 dB por deb ajo del ni vel del ruido en su banda crft ica. La exc itac ion co mbina da de l to ne y el ruid o es 1,5 d B mayor que el ruido so­ lo: 1,5 dB represen ta el increm en to m inirn o necesario para la deteccio n del to ne (por eje mplo, si el tono estuviera a -20 dB , el n ive l to ta l h abn a aume n­ tado 0 ,05 d B y no serta aud ible). EI segundo mecan ismo posib le, desarr oll ad o por el mod elo de supresi6n, se basa en la hi p6tesis de que el ruid o enmascaran te suprime la acti vida d neu ­ ral que la serial producirfa de est ar sola. Po r el moment o no hay ev ide nc ia fuerte qu e perrnita descartar alguno de los dos mecan ismos, aunq ue q uiza se co mbine n ambos. S in embargo, el ex i­ to de los mod elos lineales de co mbinac i6n de filt ros aud itivos en la ex plica­ ci6n del patron de en masca ra miento inclina la balanza hacia los mecan ismos d e cobert ura, pues la supresio n es un proceso alrarnen re alineal. Modelos temporal es de en mascaramien ta Existen dat os q ue apoya n la hi pot esis del uso de los patrones temporales de dis­ paro ne uron al en el ana lisis de est irnulos complejos (una sin uso ide produce d isparo s neur ales cuyo int er vale temporal es un multiple en tero de su perfo­ do ). Si la regular idad temp oral es menor que ciert o valor - com o oc urre co n el ruid o alea to ric- la sin uso ide sera en mascarada. El mecanisme te mporal pare­ ce efectivo iin ica men te pa ra frecuenc ias por debajo de los 4 0 5 kH z y cabe su­ poner la acc ion de un disposit ivo sensible a la fase. O tro elemen to q ue posibleme n te se empl ee en la det ecc i6n de un a serial sin usoida l en un fond o de ruido es el cambio en la en vo ivent e de la onda co m­ bina da, que flucni a menos en presenc ia de la sefial sin usoida l.

5. ANA uSIS ESPECfRO-TEMPORAL COMBINA DO EI mod elo del espect ro de pot en cia asume q ue, cuan do tratarnos de detect ar una sena l sinuso ida l en presencia de un ruid o en rnascaran te, hacernos uso de

104

la salida de un filt ro aud itive ce n trado a la frecuen cia de la sefial. En general, se supo ne que la prestaci6n se basa en la salida del filtro que provee la mayor relacion sefial/ru ido y que los um bra les corresponden a un a relac ion serial/rut­ do consta n te. Las fases rela tiv as de las co mpo nen tes y las fluctuaciones de Cor­ to tiemp o del ruido en rnasca ran te son igno rada s. Este mod elo funcion a bien en muchas situac iones , pero no en todas, En parti cular, hay evidencia de que los oyen tes a vece s realizan co mparaciones entre diferentes filtro s aud iti vos, Mas aun , ciertas fluctuaciones temp orales de l ruido en mascarante pueden te­ ner efectos impor tan tes. Reduccion del en rnascararnien to par co rnodulacion H all demostr o qu e las co rnpa rac iones en tre filtros aud it ivos pueden aumen rar la detecci6n de seriales sin uso ida les en presen c ia de ruido (Ha ll, D. et ol., 1984). Para que oc urra este efec to debe ex ist ir una fluctuacion co he ren te 0 correlacionada entre diferen tes bandas del ruid o en mascaran te , fen ornen o al que Hallllam 6 comodulaci6n.7 En la Figura 14 se aprecia el resulr ado de su ex ­ perirnento. Hall uso ruido de un a banda de anc ho variab le. Tarnb ien se puede n em­ plear dos 0 mas bandas de ruido, incl uso una en cada ofdo , sin qu e vade el re­ sultado . Se asume usual mente que la redu cci6n del en ma scararn ien to por como­ dulacion depende de la co rnparac ion en tre las salidas de d iferen tes filrros au­ diti vos. S in emb argo , tarnb ien se produce un efec to similar cuando la fluctuaci6n cae den tro de una sola band a crit ica, aunque en ese caso la dismi­ nu cion del umbraI resulte men or. La redu ccion del en mascaram ien to por co­ modulaci6n es mayor cuando la variac ion del ruido en masca rant e es lenta y cua ndo este cubre un gran anc ho de banda. Para sefiales de hasta lOO ms de duraci6n la redu ccion de l en masca ramiento por co modulaci6n puede lIegar a 11 dB. Esta d ismin uci6n alcanza los 14 dB en el caso de ruido en rnascarante de dos ban das cuando la band a agregada se ubica cerca de la frecuen cia de la primera ban da. Tarnbien aurnen ra hasta lIegar a un max imo de 16 dB cuan do hay mas de dos band as en juego. La magnirud de la redu ccion del enm ascar a­ mien to po r cornodu lacion no camb ia co n la frecuencia central del estfrnulo. La compa racion entre las diferentes env olventes temporales de los filtros aud it ivos parece ser un hecho co rmin en el ana lisis de los pa t rones aud it ivos. A pare n temente juega un pap el mu y irnportant e en la ex tracc i6 n de seria les 7 H oy se 10 den orn ina reducc ion de l enrnasca ram ient o po r comod ulac i6n 0 CMR

(conmodu­

/arion maskingrelease).

105

til 60

FI

:2.

I R

I

I

~

R I

~ ~Vt--.~ I K' ~ '"

55

I

,t."

.!!1

E ~ ::J

I

W "0

I

I

45 1

I

I

I

I

I

M I

50

I

/I ))

1

I

Ancho de la banda enmascarante (kHz)

Figura 14 . Resultado del experimen to de H all. Los puntos marcados "M" corresponden a los umbrales obte nidos con ruido enrnascarante modulado en arnplit ud ca n una serial irre­ gular que varia lentarnenre

de ambientes ruidosos y en la d iscriminaci6n en tre va rias fuentes acust icas, Tarn bien da c uen ta , al menos en parte , del "efec to de ca fe teria" ("cocktail party effect" ) . Hay dos clases de modelos que in te ntan ex plica r la redu cci6n del en mas ­ ca ramien to por co modulaci6n. Los qu e in tegran el primer grupo asumen qu e el siste ma aud it ivo co mpa ra los patrones de modul aci6n de las envolve n tes de las salidas de los d iferentes filtros audit ivos: la presencia de una serial es reve­ lad a por la disparid ad en la modulaci6n en tre los filt ros. Un segundo grupo de modelos sugiere qu e la fluctuaci6n de las en volven ­ tes a la salida de los filtros audi t ivos indican los mom entos 6ptimos en los que se debe escucha r la sefial. Es decir, du rante los mfnimos de la en vo lvente del en masca ran te. Estos modelos no son mutuarnente excl uyentes y no parece que la redu c­ ci6n del en mascaram ien to por comodulac i6n depend a de un uni co mecanis­ mo simp le. Enmascaramiento no sirnultaneo Los efecto s del tiempo sobre el enmasca ramiento han sido estu diados en deta­ lle par nume rosos in vest igadores. El en masca ram ien to "hacia arras", co n la se­ rial precediendo al ruid o enrnascaran te, parece pro ven ir de un a co nfusion 106

en tre las seriales que afecta a los sujetos con poca practica. De heche , oyen tes entren ados - rnusicos y tecn icos de audio ent re otros- obt iene n mejores por­ cen tajes de deteccion que los sujeto s prorned io. Por otro lado, el en rnascara­ miento "hac ia de lan te", con el ru ido en mascarante p reced iendo a la serial, es un o de los tres proc esos que alteran el umbral de un a serial que tien e lugar des­ pues de otro soni do . Los otros dos son la fat iga y la adap tacion. Se disti ngue de ellos por estar limi tado a sen ales que apa recen dentro de los 200 ms des­ pues del mom en ta en que cesa el ru ido en masca rante . El en masca ramien to hac ia delan te t ien e las siguientes part icul ar idades: 1) es mayor cuan to mas ce rca en el t iemp o se suceden ambas sefiales: 2 ) los incrernen tos en el n ivel del ruido en rnasca ran te no co rrespo nden a incrernen­ tos iguales en el um braI de la serial (a d iferencia del en masc aram iento sirnul­ taneo , que responde a una relaci6n serial/ruido co nsta n te), y 3) depende de la relacion.de frecuen cias entre ambas seriales (igual q ue en el en rnascararnien­ to simult aneo), Los pro cesos que dan cue nta del en masca ram iento no sirnul­ tan eo no se co no cen co n exactitud , aunque pro bab lemente sea n co nsec uenc ia de la co mbinaci6n de varios a la vez. La superposici6n temporal de patrones de vibrac ion en la mem brana basilar - una suerte de co la de resonan cia 0 "rin­ ging"- parece ser imp ortant e , asf co mo la adaptac ion de corto term ino tant o en el ner vio aud itivo co mo en los ce n tros ne urales superiores.

Supresi6n lateral en el enmascaramiento no simultaneo Los experimentos sobr e en mascaramie nto sirnulta neo pueden ser exp licados a partir de la superposici6n de filtro s audit ivos aprox imadame nt e line ales. S in embargo, las respue stas neur ales son marcada men te alineales. En part icu lar, es impor tan te destacar el hech e de q ue la respuesta a un a serial puede ser supri­ mid a por otra de diferente frecuencia en el fen6me no de supresi6n entre dos to­ nos, que describe el hech e de que la respuesta an te un estimulo sin usoida l puede an ularse par la presenc ia de un segundo estfrnulo. En la figura 15 se aprec ia este importante efecro. Los efectos de la supresion com ienzan y cesan mu y rapidarnen te, den tro de unos pocos milisegundos luego del co mienzo 0 fin del segundo estfmulo. Para seriales mas co mplejas, el fen 6m en o tom a el nombre de supresi6n la­ teral, en la que un a fuerte activida d a una frecuenc ia ce ntral puede suprimir un a act ividad meno r a un a frecuen cia adyacente. Las cres tas del pat r6n de ex­ c itac i6n son resaltadas por los va lles que las rode an . La pregun ta es w o r qu e la supr esi6n later al no se revela en el en rnasca­ rarniento no simultaneo ? Houtgast estud io exte nsa mente el caso a parti r del umbral de pulsaci6n (Houtgast , T., 1972) . En el enma scaramiento simulta neo 107

Enmascaramiento binaural 80

CD

50

~ Q;

>

Z 40

20 2000

5000

10k

15k

Frecuencia de los eslimulos (HZ)

Figura 15. A reas de supresion de un estirnulo por otro

la supresi6n se manifiesta porque cua lquier reduccion en la ac tiv idad del rui­ do en rnasca ran te en la regi6n de frecu encias de la sefial se acompa fia co n un a redu ccion sim ilar en la ae tiv idad de la seria l enmascarad a. En otras pa labras, la razon "sena l en mascarada /ru ido enmascarante" no es afectada por la supre­ si6n. En el en mascaram ien to no sim ultan eo la supresi6n afec ta al ruid o en­ mascarante perc n o a la sefial. O tra diferencia importante es que la seleet ividad en frecuenci a del en ­ mascarami ento n o sim ultaneo es mayo r qu e en el simultan eo (rnedido por ejem p lo a partir de la curva de afin ac ion psieofisiea 0 PTS) .

Examen del perfil espectral Green y sus co legas dernostraron en 1988 que los oye ntes co mpa ra n la sa lida de diferentes filtros aud itivos para mej ora r la detecci 6n de un a sefial especffi­ ca, aun en los casos en los que el ruido y la sefial flucui an sincronicarnen te. Sugiri eron que se perc ibe un ca mb io entre el perfi l espectral del ruido en pre­ sencia de la seria l y el perfil en ausencia de la misma. El ana lisis es mas efec­ tiv o cuan do : 1) el ruid o de fondo posee u ri gran aneho de banda; 2) h ay varias co mpo ne n tes de la serial dentro de l rang o espeetral del ruid o y 3 ) el ruido de fondo se co mpo ne de bandas de sim ilar intensi dad. En un sen t ido el exa me n del perfi l espeetral no sorpr ende: la form a de l es­ pectro es un o de los facto res relevantes a la hora de identificar una vocal 0 un timbre musical.

108

El umbraI de en mascara miento pu ede ser marc adam ente menor cuando la se­ fia l se oye co n am bos of dos. La difer encia de ni vel entre la audici6n binaur al y la monoaur al se co noce co mo nivel de enmascaramiento diferencial (MLD). El MLD llega a ser de 15 dB para baj as frecuencias y se reduce a s610 2-3 dB para sefiale s de 1.500 H z. N o es cas ua l qu e el lirnite de 1.50 0 H z sea el mismo que el de nu estr a ca pac ida d para co mpa ra r las fases de las seriales entre los dos o f­ dos dur ante la localizaci6n espac ial. En la figur a 16 se aprecia cu alitativarnen­ te un expe rime n to clas ico en este ca mpo . Para qu e el efecto ten ga lugar se debe agrega r el mismo ruido a los dos oi­ dos (0 al menos deben estar co rrelac iona dos 0 provenir de la misma fuente). Se ha obser vad o en masca rarnien to binaural en sefiales sin uso idales, en cli cs y en el habl a. En situac iones reales apa rece cu ando la serial y el ruido provi enen de diferentes posieiones en el espac io y se relaciona fuertemente con el efec­ to "cocktail party". La banda del ruid o en rnasca ran te q ue ac tua en las condi­ ciones de en masca ra miento d iferencial es la que co rresponde a la frecuencia de la serial. H all sugiri6 qu e los filt ros aud itivos qu e intervienen en la detec­ cion monoaural y binaural son los mismos, pero que la det eeei6n binaur al de­ pende de la sal ida de mas de uno de ellos en paralel o, La inteligibilidad del h abl a en co nd iciones de ruid o arnbiental mejora con sefiales an t ifasicas, en espec ial a niveies ce rca nos al umbral. Las co ndi cio ­ nes antifasicas n o s610 mej oran la capacidad de det ecci6n de sefiales, sino qu e tambien incrementan la h abilidad para discriminar sefiales.f Los pro cesos de enmascaramiento y de localizacion espac ial, sin embargo , par ecen procesarse de manera separada . Los mode los mas recient es, co mo los de Colburn, S tem y Trahiotis, asu­ men que las tasas de disparo de los difer entes filt ros audit ivos pro venientes de los dos ofdos son co mpa radas por det ect ores de coi n cide n cia que proveen un a especie de sal ida bid imen sional , co n un a d imen sion ca rac te rizada por las fre­ cuencias centrales de los filtros aud it ivos y la otra por el ret ardo interau ral (Colburn, H . S., 1995) . U n co mp lejo modelo, el de Yoich i Ando , da cue nta con bastante detall e del proceso de eval uac i6n inter aur al y fue util izado en el disefi o de salas para mu sica n o arnp lificada (Ando, Ye t al., 1997 a) .

BU n pararnetro uti lizado en el estud io de salas para rruisica y palabra, el coeficiente de C01Te­ lacion CTUZada interaural (ixcc ), cuan tifica la co rrelac i6n existen re en tra las seriales que lle­ gan a los dos o tdos.

109

"'Cb----------------­a)~

~

b)~ .~

C)~ V\f\N\v

d)~

Sonidos de combinaci6n de segundo orden

W~

Figura 16. Enmascaram ien to bina ural

6. DISTORSl6 N AUN EAL Y SONlDOS DE COMBINAC l6N El vio lin ista ital ian o G iuseppe Tartini obs erve en 1714 qu e al ejec uta r dos son idos mu y intensos se generaba un tercer sonido, mas grave, c uya frecu cn­ cia co rresp ond fa a la diferenci a en tre las frecu encias de los dos son idos origi­ nales, La apa rici 6n de d icho sonido difer encial no deberta sorprcndernos ya que sabemos que el ofdo presenta cornportarnientos alineal es en practica­ mente to das las etapas de transm isi6n y procesamiento de sena l.? El tfrnpa­ no, la cadena de hu esecill os y el ofdo inte rn o co nt ribuyen de manera va riab le a la alincalidad to ta l, a un que es mu y d iffcil hallar el orig en exacto de la dis­ torsion en cada caso. Un sistema de tr an sm isi6n alin ea l produce arm6 n icos cuando se 10 cxc i­ ta co n un a sin usoide pur a (Basso, G., 200 1a). Los productos de est a distorsion arm6 n ica son di ffcil es de ofr pues se co nfun de n con los arm6 n icos propios del esrirnulo ffsico y se integran a la peri odi cid ad definida por la fund am ental de Fourier de la seria l. Pero si el ofdo es excitado con dos senales sin uso ida les, la distorsi6n alinea l produce un a gran ca ntidad de artefactos que se percib en co­ mo sonidos resulcantes 0 de combinaci6n. En teorfa, ex isten infinidad de sonidos 9 A unqu e aqui adopcamos la deno minacion tradicion al de sonidos diferenciales y de sonidos de combinaci6n, no los de bemos confundir con las sena tes ffsicas qu e los causan ni con las frecuenci as de dic has sefiales ftstcas.

110

resultantes, pero en la pra ctica son aud ib les solam ente los de menor frecuen­ cia. Se los pu ede cla sificar de acuerdo co n la can tidad de vec es que aparece n las frecu encias de los estirnulos i, y fz en la formula correspondiente. En la ta­ bla de la figura 17 se ind ican los soni dos de co mbin ac i6n de menor orde n . En la tercera columna estan los arm6ni cos de cada un o de los cornp onen­ res primarios. Por 10 gene ral, los son idos de co mbin ac i6n de las dos prime ras columnas no sigue n un a estructura arrnonica. '?

El espectro d e los son idos de co mbi nac i6n de segundo orde n 0 cuadrciticos se puede apreciar en la figura 18. Ademas d e los arm6 nic os de los co mpo ne ntes primarios (2fl Y 2fz), se ge­ nera un sonido diferencial (fz - !l) y un o adicional (fl + fz) de gran amp litud . El sonido adi cional es d ificil de ofr po rq ue cae en una regi6n esp ectral en la que existen arrnonicos, si las sefiaies primari as son co mp lejas. Tarnbien es en rnas­ carado con facilidad por los co mpo ne n tes primari os ft Yh· En carnbio, el sonido diferencial se perci be co n facilidad, sobre rodo cuando su frecu encia es mucho menor qu e fl' Aunque la frecu encia resultan­ te (h - f\) es la misma , no h ay que co nfund ir el son ido diferencial - producto de la distorsion alineal del ofdo- co n el batido ffsico , qu e se origina en la in ­ terferencia entre sefiales sin usoidales -un proceso lineal. Para un siste ma regul ar con d istorsion cuadrat ica , el nivel del son ido d i­ ferenci al sigue la siguien te ec uac i6n : NI (fz - it)

=

Nl (ft) + NI (fz) - C z

C z es un a constan te que depende de la profundidad de la distorsion cuadrati­ ca . Los exp erimentos psicoacusticos sobre e l tema la ubican en un valor apro­ ximado de 130 dB . Es decir, co n NI (ft) = NI (fz) = 70 dB, el niv el de intensidad del diferencial alcanza 10 dB y no se 10 percibc en todas las ocasio­ n as. Pero con Nl (ft) = NI (fz) = 90 dB e l ni vel de intensidad del diferencial llega a 50 dB y se 10 pe rcibe co n relati va fac ilidad . Se asume que la alinealidad ca usan te de los son idos de combinaci6n de segundo orden se origina en su mayor parte en el ofdo mcdio, con un a parti­ c ipac i6n menor del tfrnpano y del o fdo int erno.

10 Una excepcion se da cuando una frecuen cia primaria es igual ejempl o, i: = Nfl (Basso, G., 200 1a).

0

multiple de la otra, Por

111

r,

Primarias

f, -

Secundarias Tercer orden

r,

f, + f,

2f , - f,

.zr,

3f, -f,

.sr, .r, ,

Cuarto orden

Sonidos de combinac ion de ter cer orden

f,

- f,

2f, + f,

.zr,

+ f,

3f, + f ,

. sr,

+ f, ,

2f, - 2f,

2f, + 2f,

...

...

2f,

.zr,

3f,

. sr,

4f, , 4f,

...

Figura 17. Frecuencias correspondient es a los sonid os de co mbinaci6 n de menor orden . Se presupon e f2 > f j

u

~

a. E


III I, - 1,

I,

21, I, + I, 21,

I, Frecuenc ia

Figu ra 18. Distorsi6n cuadrat ica pura a partir de dos cornponentes primarios de frecuenc ia

f1 \' f2

El espect ro de los son idos de com bin aci 6n de tercer o rden 0 cubic os, gene ­ rados por un siste ma regular con distorsion cubica, se puede apreciar en la Figura 19. Los soni dos adicionales cubicos de alta frecuencia (2fl + iz) y (2iz + fJ) son extremadament e diftciles de oir. Los sonidos diferenciales cubicos (2fl - fz) y (2.fz f l) poseen el triple de amplit ud que los terceros arm6n icos (3fl) y (3fz) de los co mpon entes primarios. En c iertas circunsta nc ias el mas bajo de ellos, (2fJ - fz) , es tan audible co mo el d iferencial cuadrat ico (f2 - fl )' Sin emb argo, en este caso la relaci6n entre ni veles de en trada y sonori­ dad percibida no sigue un a ley tan simp le co mo en el caso de los son idos de combinaci6n de segundo orden , El d iferencial cubico (2fl - iz) persiste a n ive­ les de estfmu lo muy bajos y su audibilidad dcpe nde en gran medida de la fre­ cuencia de los comp onen tes primarios. Po r ejemplo, dec rece rapidamente en sonoridad cuand o la diferen cia en tre iz y i, supera un valor cercano al 30%. Estos hechos revelan la existe nc ia de un a alinealidad esencial, en la que el sis­ tema no se puede aproxi mar a un siste ma lineal para pequefias amp litudes de sefial. Se sabe que el origen de esta alinealtdad esencial aparece mas alia del ofdo medic . Se supone q ue surge de la actividad de las celulas mot oras en la c6clea 0 en algun ce ntro de procesa miento ne ural superior. En la figura 20 se aprec ia el co rnpor tamie n to de los sonidos diferen ciales mas audi bles en fun ci6n de la diferen cia de frecuencia en tre los comp on entes primarios y en la Figura 2 1 se grafican en not aci6n musical aproximada los di­ ferenciales cuadratic os y cubicos presen tes en alguno s intervalos sencillos.

7. ALGORITMOS PSICOACUSTICOS DE COMPRESION

u

~

a. E


I,

21,-1,

21,+1 , 1,+21,

I,

21,-1,

31,

sr,

Frecuencia

Figur a 19. Distorsion cubica pura a part ir de dos co mponentes primario s de frecuencia f[ \' f2

112

El fen orneno de enmascaramiento se emplea desde la decada de 1980 en el di ­ sefio de siste mas para co rnpresion de arch ivos de audio de gran eficacia. Se los denom ina gene rica rnen te algoritmos psicoacusticos de compresi6n y, de todos ellos, en la actualidad el mas difundid o es el MP3. El objetivo primario de es­ tos sistem as es el de redu cir el tamafio de los arch ives digita les de aud io que -en codificacion PCM estand ar- ocupan alrededor de 10Mb por minuto de re­ gistro y tienen una rasa de transmision de 1,4 Mbps. La cornpresion permite un ahorro de espacio de almacen amien to y una mayor velocidad de tr an srni­ sion a traves de sistemas de red. A con t inuacion describiremos brevemente las ca racte rfsticas principales del codigo MP3 , que en prin cipio no difiere sustan­ cialmente de otros forrnatos de co rnpresion de aud io menos difund idos. 113

Frecuencia 21, ~ - - - - - - - - - - - - - - - - - - - _. - - ­ Estimulo I, (Frecuencia variable) 3/2 I, Eslimulo I, (Frecuencia fija)

I,

IC1 = 12 - I ,

Ic3 = 31, - 21,

: Sonidos dilerenciales

y- I ,

Y

'I

)

I, Unisono

c2

3/2 I , Quinta

21, Octava

=21, - I,

• Frecuencia del estimulo variable

Figura 20. Diferen ciales cuadra ricos y cubicos en funci6n de la diferenc ia de frecuen cia entre los compone nres primaries (tornado de Roederer, 1997)

1 :: -0-

~

()

I

;

.Q.

-0­

o

()

~? ( )

En primer lugar, los archivos de audio, generalmen te en dos canale s PCM de 44,1 kH z de muestre o y 16 bits de resolucion , son transform ados en frecuencia y separados en 18 sub-bandas por canal. Cada sub-banda reproduce aprox ima­ dameme el tamafio de un an cho de banda crft ico, La tasa de tran srnision se fi­ ja a un valor meno r al de un CD de audio para limitar int en cionalm en te la can tidad de bits disponibles y forzar la cornpresion . A partir de un modelo psi­ coac ustico se exa mina cada sub-band a y se decid e a cuales se destin a la mayor cant idad de bits. Par ejemplo, las band as qu e son enmascaradas por otras mas potentes reciben menos bits parque en ellas no se va a percibir el ruid o de cuan­ nzacion, product o inevitable de la menor resolucion. En otros terminos, se re­ mueve la parte de la sefial que no vamos a poder ofr al quedar enmascarada. A la salida del cod ificador psicoacusti co se agrega un codificador por re­ dundancia, po r eje mplo uno de H uffman , q ue pe rmi te llevar la tasa de co m­ presion a un valor fin al de h asta 12:1 sin que se degrade signi fica tivamen te la ca lidad de aud io. En la figura 22 se puede aprecia r un di agrama en bloqu es del proc eso completo . La profund idad de co mpresion depend e de la calidad de aud io requer ida y del tipo d e serial que se va a codifica r. Por 10 general, una rasa de tra nsrni­ sian de 128 kbps se considera suficiente para alcanzar la calidad de aud io de un CD, al meno s si se emplea un sistem a de monitoreo de calidad med ia y la rruisica no posee gran ran go dinamico, Es muy imp ortante tamar en cu enta que la co dificacion MP3 y todas las que ernplean esta clase de procesarniento psicoacustico son tecnicas a pe rdida de inform acion. La serial cod ificada no puede vo lver a su est ado original un a vez fina lizado el proce so.

Figura 21. Nor acion musical aproximada de los sonido s diferen ciales mas destacados

La sigla M P3 es un a abrev iatura de MPEG - l Layer 3, un formato defini do par el Mot ion Picture Expe rts Group (MPEG). Es part e de un extenso pro gra­ rna destinad o a estab lece r estandares pa ra la indu stri a del c in e, la tele vision , la musica y de siste mas multimedia.'! El algoritmo de compresion/descompre­ sian (Codec) del forrnat o MP3 comprende dos etapas principales. En la prime­ ra etapa se remueve la parte inaudible de la serial y en la segunda se eliminan las redundancias del material remanente.

11 La parte de audio de MPEG- l (no rma ISO/IEC IS 11172-3 ) fue esrablecida en 1991 y con­ siste en tres modos de operaci6n de complejidad crecien te: Laver-I , Layer-Z y Layer-3. En el estanda r MPEG-Z, sucesor del MPEG -l , se define el Adva nced A udio Co d ing (AAC) que es­ ta reernplazando al MP3 en muchas ap licac iones.

114

Seiial de audio digital (peM)

Seiialdeaudio codificada ~' 92 kll i ls/ s .!!J

1

t'""""1

:i5 u

~5 .~~

I

32kbils/s

== ~:g

u g

~

Figura 22 . Diagrama en bloques de un cod ificador MP3

115

Capitulo IV Procesamiento temporal de sefiales

Decir que los sonidos del ambiente, de la musica y del habla dependen, nece­ sitan y, en ultima instancia, estan hechos de tiempo, es enunciar una verdad de Perogrullo. La naturaleza del sonido es el devenir y el estudio de sus rasgos esenciales ha planteado, y plantea, arduos problemas filosoficos. De las mu­ chas experiencias que nombramos con el terrnino "tiernpo", algunas involu­ cran nociones relacionadas con la sucesi6n, el presente, el pasado y el futuro. Otras con las ideas de instantaneidad, simultaneidad y duracion, Tambien es­ tan las que tienen que ver con la flecha temporal y la irreversibilidad del tran­ sito del pasado al futuro. De la nocion de tiempo se derivan de forma mas 0 rnenos directa otras como movimiento, velocidad, pulso 0 ritmo. La dificultad del llamado problema del tiempo radica en articular semejante variedad de fe­ nornenos y conceptos dentro un sistema coherente. Son abundantes y variadas las soluciones propuestas hasta ahora para re­ solverlo. Pero es posible reconocer en la historia del pensamiento dos grandes tendencias, La primera -que cuenta en sus filas a Arist6teles, Newton y Eins­ tein- considera al tiempo como un hecho Fisico al que se adapta la mente hu­ mana. La segunda supone que el tiempo es un fen6meno que pertenece a la mente humana y que el de los ffsicos es un constructo proveniente de la idea­ lizaci6n de los contenidos mentales. Se pueden situar en esta ultima linea a pensadores como San Agustin, Brentano 0 Husser!. Para Paul Ricceur estas opciones no se solapan por entero: a la perspectiva ftsica le falta la capacidad de concebir un presente a partir del instante, y a la perspectiva psicol6gica le falta sustento a la hora de explicar de forma satisfactoria el durar. En la actualidad, la mayorfa de los investigadores conjeturan que el tiempo no responde a un modelo de tipo univoco, sino que constituye una entidad que se debe pensar desde varias perspectivas diferentes. Segim Fraser (1992), existen al menos seis categorfas temporales: 1. Atemporalidad: en un universo en el que solamente hay radiacion electromagnetica el tiempo no existe. La emisi6n y la absorcion de un fot6n ocurren, en 10 que se refiere al fot6n, simultaneamente.

117

2. Prototemporalid ad : en un uni verso de parnculas elementales el tiempo es fragmentario. No fluye y ca rece de direccion, Los sucesos se pueden situar de forma esta d ist ica porque la sing ularizac ion de un instan te concret o ca rece de significado. 3. Eotemporalidad: en el uni verso rnacroscopico de la materia dotada de masa el tiempo es con tin uo, pero inmovil y sin direccion, No se le apl ican los co nc eptos irreversible s de pasado , presen te y futuro . Es el t iempo de las leyes de la rnecanica clasica. 4. Biotemporal idad : es el tiempo de los anirnales. Tiene d ireccion y ex iste un pasado, un presente y un futuro , pero sus horizontes son lirnitados. Los bor­ des del presente son estables y probabl emente caracterfsticos de cad a especi e. 5. Nootemporalidad: es el tiempo de la mente humana. Existe un a cl ara n ocion de pasado , presente y futuro y sus horizontes son ilirnitados. El pre sen­ te tiene bordes difusos, que varian segun la atencion. 6. So ci ot ernporalidad : es el tiempo co lectivo que regula el ritmo soc ial. Lo organ izan los relojes y los calendar ios. El esquema de Fraser, aunque simple y parcial, sirve para entender qu e e l problema del ti empo no puede abarcarse por co mple te desde un a sol a perspectiva. Al margen de las especulac ione s conc eptuales, el tiempo es un pararnetro ac ustico importante pues casi tod os los son idos fluctuan durante su desarr ollo. Mas aun , para son idos que contien en informacion, como la palabra y la m usi­ ca , esta aparece en los camb ios antes que en las partes est ables. En esto s casos es conveniente distinguir algunas escalas temporales diferentes: 1) la micr oes­ ca la, que va desde algun os milisegundos a varios cientos de milisegundos y qu e porta la estructura fin a del sonido; 2) un a escal a qu e co n te rnpla los ca mbios mas lentos, carac te rizados por las env olven tes temporales de los parametros ac ust icos, que va desde un as decimas de segun do h asta algun os segundos; 3) otra que contenga las estructuras co mpuestas que toman varios segundos en des arrollarse, como palabras y motivos musicales, y 4) la rnacroescala tempo­ ral, que puede abarcar minutos enteros y en la que se despliegan oraciones y frases musicales. Esta ultima escala depende direc tarn ente de la memori a de co rto terrnino. En los grandes desarrollos musicales, co mo el de la forma sona­ ta, tarnbien juega un rol decisivo la memori a de largo terrn in o.

1. RESOLucrON

curre el tiempo y permite aurnen ta r la capacid ad de discrirninacion ante un estfmulo de larga duracion. La mayorfa de los estudios psicoacust icos se orien­ ta hacia ternaticas relacionadas con la resolu ci6n temporal. Sin embargo, la in­ tegraci6n temporal juega un rol destacado en cier tos gen eros y est ilos musicales que ernple an la aliteracion de sonidos en los que algiin par am etr o deri va len­ tamente.! La ma yoria de los autores concuerdan en que la resolucion temporal depende principalmente de dos procesos afines. Por un lado se realiza un ana­ lisis del patron temporal dentro de cada canal del filtro auditivo y, por el otro, se comparan los patrones temporales correspondientes a canales diferentes. La mayor dificultad al intentar medir la resolu cion temporal es consecuen ­ cia de la in ev ita ble relacion ent re tiempo y frecuencia propia de tod o fenorne­ no ondulat ori o, que depende dir ectarnente del principio de ind eterrninacion acustico . Los ca mb ios en el patron temporal de un a serial estan aco rnpan ados generalmente de una modi ficacion en su espectro . Por ejernplo , al interrum­ pir bre vernente una sinusoide aparece un espe ctro de banda ancha qu e se oye como un clic muy sonoro. En la Figura 1 se apre cian los graficos temporales y sonogramas co rrespond ientes. Puede oc urrir que un a aparente deteccion temporal sea en realid ad una deteccion espectral -por eje rnplo, e l espe ctro de potencia de un par de clics mu y cercanos en el tiempo es d iferente del espect ro de potencia de uno so lo de ellos. Para ev itar esta cl ase de confusion es, en las pruebas experimentales se adoptan dos estrategias diferentes, La primera co nsiste en ernplear sefiales de espectro in variante ante cam bios en su pa tr on temporal. El ruid o blanco, por ejemplo , co nserva el espectro p lan o aunque se 10 secc ion e repentinarnen­ te , tal como se aprecia en la figur a 2. La segunda est rategia emplea est imulos cuyos espectros se rnodi fican al al ­ terarse los patrones temporale s - como ocurre con las seriales sinusoidales. Pa­ ra evitar la co n fusion entre dete ccion temporal y espectral, a la sefial de base se le agrega ru ido de fondo a fin de en rnascarar las bandas de frec uencia que surgen en cada trans icion, El ruid o de Patterson, ya visro en el punto 2 del ca­ pitulo 1II , es uno de los mas eficaces ya que no alte ra a la senal en su banda central (Patterson , R . D., 1976 ). En la Figura 3 se puede apreciar la tecn ica de Patterson para en rnascarar las bandas laterales que apa recen en las transicio­ nes en una serial sinusoidal.

E INTEGRACION TEMPORAL

Much as veces se confunden dos nociones relacionadas con el procesamiento temporal de seriales, Una de elias, la resoluci6n temporal, es la habilidad para de ­

118

tecrar ca mbios en el estfmul o a medida que trans curre el tiempo . La otra, la in­ tegraci6n temporal, es la ca pac idad de agregar informacion a medida que trans­

I Hay numerosos ejemplos en la rmisica del sudeste asiatico . En occ idente, la integracion temporal const ituye UD proceso central en el minimalismo.

119

+rl- - - -­

-

-

-

-

-

-

-

-

-

--------,

iii Q) ~

Banda de ruido enmascarante

co

~

co

'u

'"

cQ)

~

13

'u c

co

~

Banda de ruido enmascarante

Sefial

~

u,

o

0..

o

Frecuencia (escala lineal)

+

Figur a 3. Te cni ca de Patt erson aplicada a una sinusoide

Ef ect os de la fr ecu en cia central en la resolucion temporal

Tlernpo (ms)

Figura 1. Grafico temporal y espectral de una discontinuidad en una sinuso ide

r::;­

Eo

co

'u c: Q)

:0

<.:!

~ u,

1i empo (ms)

ro :s. "0

:~

a. E


1i empo (ms)

Figura 2. G rafico temporal y especrral de una dtsconrinuidad en una serial de ruido blanco

120

Se ha sugerido que la reso lucion te mpor al deberfa ser mejor a alta que a baja frecue ncia. Una discontinuidad en un a sinus oide causa un a cola de resonan­ cia ("ringing" en ingles) en cad a filtro aud itivo, que se rnant iene durante mas t iempo a medid a que decrece el ancho de banda del filtro aud itivo correspon ­ dien te -por aplicacio n de l principio de indeterminaci6n aciist ico. En la figu­ ra 4 se puede observar la rnodificacion temporal ejer cida por el filtro aud itiv o centrado en 1.000 Hz sobre un a serial de entrada de 1.000 H z. Como las band as mas angostas se en cuentran a baja frecuencia, es logico suponer que en dicha region del espectro la resolucion temporal resulte infe­ rior que en la zona de alta frecuencia, Datos experimentales sugieren que , por encima de los 2.000 Hz, el tiempo de respue sta de los filtros auditivos es muy pequefio y no afecta sign ificarivarnen te la resoluci6n temporal. Por debajo de esa frecuencia la resoluci6n disminuye aprec iablemen te.

2. RESOLUCI6N TEMPORAL

EN SENA LES DE BAN DA ANC HA

En gene ral, los experime ntos en los que se intenta dete rrnina r el umbral de de­ tecci 6n de disconti nu idades (gaps) se basan en sefiales de ruido de banda an­ cha o El metodo mas uti lizado es el de elecci6n forzada entre dos altemat ivas ( 2 AFC), en el que el sujeto debe decidir cual de los dos pu lsos sucesivos de rui­ do contiene el gap. El umbra l de discontinuidad medido en esta clase de expe ­ rime ntos, por ejemplo el realizado por Plomp, es de 2 a 3 ms (Plomp, R., 1976). Otro grupo de experimentos ernplea seriales de banda ancha invertidas en el tiempo . Sab emos que el espectro de potencia de largo tiempo de una serial 121

I'"

a)

.. ~~ ~ ~ ~~.~

-0

ro

-0

'iii

c

Q)

I

-0

ro

"0

'iii

c

Q)

s

j

,

I

I

I

5

10

15

20

25

30

I

I

I

~

,

E

o

~ i~W~i~1

iII

:s

~~ !~~~~ !I

1 1~ 1 1 \1 1~l l l li

!

~ ~~mi~

Ii

i

liempo (ms)

Figura 4, Respuesra sirnulada de un filrro auditive de Fe seccionada de 1.000 Hz

=

1.000 Hz ante una sinusoide

de corta dur acion no cambia si esta es invert ida temporalmente, Por 10 tan to, si la segunda serial es muy breve y se la dist ingue aud itivame n te de la original debe ser por la diferen cia en su patron temporal. EI umb ral de det eccion entre dos senales de banda anc ha que cambian de arnplitud a la mitad de su desa rro ­ llo (de A a 2A) , pasadas al "de recho " e invertidas, es de 2 a 3 ms, valor qu e co inc ide con el hallado por Plomp. Los sujetos no se dan cue n ta de l ca mb io de arnplitud, pero perciben un cambio tfmbrico (oven "t ick " y "tock" ), En el gra­ fico de la figura 5 se pueden ver las seriales ut ilizadas en el experime n to cit ado , A lgunos autores hall aron valores sign ifica tivarnente menores para el urn­ bral de detecc ion, ent re 0 ,25 y 1,8 ms, pero no se conoce la causa de la d iscre­ panda ent re ambos grupos de med iciones.

3. R ESOLUCION TEMPORAL EN SEN A LES DE BAN DA

AN GOSTA

Para sefiales de banda angosta , la in troducci6n de una disc ontinu idad impli ca "desparr amar" el espectro por efecto del principio de indeterminaci6n aciisti­ co. De todos modos, la sit uacion es d iferente si se trat a de sefiales de ban da angosta moderada 0 co n espectro de linea, como es el caso de las sin uso ides. A contin uac i6n se an alizan ambas posibilidad es.

122

l 'IT" I '1

I

liempo (ms) b)

iII

:s -0

ro

-0

'iii

c

ill

EO

I

'II'" I rr r." r

:» , .

[1 1' 1" ' " .

liempo (ms)

Figura 5. Sena tes de banda ancha ernpleadas para deterrninar el urnbral de detecci6n de disconrinuidades

De tecci6n de discontin uidades en ru ido de banda an gosta Par a seriale s de banda an gosta moder ad a el paramet ro de comparaci6n es el anch o de ban da del filt ro aud it ive qu e Ie co rrespo nde . Tal como hemos vis­ to, la detecci6n de discontinu idad es deb erla ser peo r a baja frecu encia por ­ que en esa region espec tra l e l anc h o de ba nda de los filtros aud it ivo s es menor. Los um brales de det ecc ion de be rfan d ism inu ir a med ida que aumen­ t a la frecuenci a y por 10 tan to el anch o de banda de l ru ido , h asta llegar al va lor de la banda crfti ca cor respond iente . A partir de est e pun to, un au­ men te en el anch o de band a no deb er fa rnejorar la detecc ion de la d iscon ­ ti n ui da d . S in embar go , los datos ex per irne n t a les co n t radic en est a afirrnac ion: cu ando se introd uce un a disco n t in uidad su gran desarro llo es­ pectral afecta sincro ni ca me n te a un a can t idad de filtros aud it ivos -cosa qu e no ocurre con las va ria cio nes de arnplitud produ cto de la aleatoriedad p ro­ pi a del ru ido. La ex c it aci6 n en para lelo de varios filtros aud it ivos perrn ite que e l umbra I de det ecci6n resulte men or que el que se obtendrfa si s610 un filtro fuese pu est o en ju ego. Las medi c ion es experirnentales confirrnan esta hipotesis, pues par a ruido de ba nda angosta, cuya frecuenc ia central va ria entre 30 y 1.000 H z, los um br ales de detecc i6n de d iscontinuidade s di smi ­ nuyen desd e un valor de 40 ms h ast a caer po r deba jo de 10 rns. Este efecto

123

11[:

I~

es de gran importan cia para explicar la parwioja acustica temporal que ana­ lizarem os mas ad elante. D eteccion de discontinuidades en sinusoides Para evitar la confusion entre detecci6n temporal y espectral, las sinusoides se presentan junt o a un ruido continuo con una muesca espectral sintonizada a la frec uenc ia de la sinusoide (figura 3). De este modo se consigue enmascarar la dispersi6n de l espectro ocasionada en la discontinuidad. En lin celeb re expe rimento , Sha iler y Moore estudiaron la detecci6n de discontinu idades en sin usoides en foca ndo la atenci6n en la fase de reinicio de la serial (Shailer y Moore, 1987). Explicaron sus resultados, que contradecfan a la literatura sobre el terna, sobre la base de la cola de resonancia ("ringing") del filtro auditivo: cuando la sinusoide cesa, el filtro auditivo sintonizado a su frecuencia cont inua respond iendo por un tiempo . Si el reinicio de la serial coinc ide en fase con esta respuesta del filtro, la det ecci6n de la discontinui­ dad es mas dificil. En las figuras 6 y 7 se muestran las seriales empleadas y las respuestas del mode lo ante discontinuidades de diferente duraci6n. En los casos en los que la serial "engancha" en fase con la respuesta del filt ro aud itivo , Sha iler y Moo re midieron umbrales de 4,5 ms, consider able­ mente mayores a los 2 0 3 ms esperados.

4. M ODELOS DE RESOLUCr6N TEM PORAL La respuesta de l filtro auditi vo a nive l coclear es muy rapida para altas fre­ cuenc ias y, por 10 tanto , se supone que debe existi r un limitador a otro ni vel de procesa rnien to neural. En genera l, se asume que los cambios rapidos son suavizados en alguna de las eta pas supe riores del proceso. Cas i todos los mo­ delos elabo rados para dar cue n ta de la resoluci6n temporal co nstan de cuatro erapas, similares a las que se aprecia n en la figura 8. • En prime r lugar aparece un filtro pasaba nda que co rresponde a cada uno de los filtros aud itivos conec tados en para lelo. • A co nt in uac i6n, la serial es procesada por algun d isposit ive no lineal. • Luego pasa por un integrador tempora l, que puede caracte rizarse como un filtro pasabajos. • Por ult imo, el producto de los primeros tres bloques en tra a un modulo de dec ision que determina que es 10 que se va a percibir ante la discontinuidad. Estos bloques co rresponden a diferentes procesos que transforman la seria l de l estimulo. De todos ellos, el modu lo de decisi6n es qui za el mas 124

W-1f\v

VW\fv

rvv-M

10 rns

Figura 6. Tres condiciones de fase diferenres usadas en el experimento de Shader y Moore

Selial con discontinuidad

Salida del filtro auditive

~~

~

WvvwvVV'v

~-

V\JVVvWVVV ~ - V\JVVvWVVV

~ -V\JVVvWVVV

~ - fIJVvvvvvVVV

~-~

Figura 7. Salida de un filrro auditivo simulado con Fe = 400 Hz en respuesta a una sinu­ soide, con disconrinui dades de 1,2 a 3,7 ms en la cond ici6n de fase esran dar (exper imento de Sh ailer y Moore)

125


5. OTROS PROCESOS TEl\IPORALES Esti mulo

Discriminaci6n en sec u encias de H uffman Figura 8. Diagrama en bloques de un modelo de resolucion tem poral

-o .~

o

:;

Ci

:g ~

E

E


Q;

-c

'"

:2

ro

(f)~

o

5

10

15

20

Tiempa (ms)

Estim ulo

25

30

o

5

10

15

20

25

Tiempa (ms)

Filtro auditiv o

30

o

5

10

15

20

25

30

Tiempa (ms)

Modul o integrador

Figur a 9. Op eraci6n del mod ulo de decision en el modelo de Shailer y Moore para estimu­ los de diferente frecuenc ia

comp lejo y su co nfig uracio n varia segun la tarea que se le asigne. En un o de los modelos mas desa rrollados, e l de Shailer y Moore, la sefial es procesada po r un modulo de decis ion con las ca racteris ticas que se aprec ian en la fi­ gum 9 . En este model o el in reg rador tem por al es una ve ntana te mpora l n o rec tangular. Se observa claramen te qu e la deteccion de la discon t in uidad resulta in de­ pend ien te de la frec uen cia central del filtro audi tive involucr ado . Hip6tesis del banco de fil tros de modulaci6n A lgunos in vestigadores han sugerido que el ana lisis de los son idos que son mo­ du lado s en am pl itud depende de una parte especializada del cerebro que con ­ tienc grupos de neuronas afinadas cada un a a una tasa de rnodulacion dada. Cada neur ona puede ser co ns iderada co mo un filtro en el domin io de la mo­ du lac ion y el conjunto de neuronas se conoce como banco de filtros de modula­ ci6n. Este modelo es to davia co ntrove rsial, pero pod ria explicar la eficacia de ciertos parametr e s de prediccion de Ia inteligibilidad tales como el STI 0 el RASTI, que tratarernos en el capitulo IX.

126

G reen estudio la d iscriminacion temporal en sefiales que tienen el mismo es­ pect ro de largo tiempo - a gran esca la-, pero d istin ros espectros de co rto t iern­ po - a pequefi a esca la- (Green, D. M ., 1973) . Son sonidos breves de banda anch a - parecidos a clics- excepto qu e la energfa de ciert as regione s es retra­ sada con relacion a la de otr as regiones. La frecu en cia ce n tr al, la cant idad del ret ardo y el ancho de banda de la region co n retardo pueden va riarse inde pen­ di en tem enre. Est as seriales se de no rnina n sonidos de Huffman. El experime n to de G reen postul aba que si los sujetos notaban deferen cia entre dos son idos de Huffman d iferen tes, quedaba dern ostrada su sensibilidad al pa tr on te mporal. El resultado confirrno la hi potesis: el um bra1de det eccion del ret ardo de la re­ gion bajo est udio fue de 2 ms, resul tad o ind ependiente de la frecuencia cen­ tr al de las seriales util izadas. Los suje tos percib ieron las d iferencias en el patron temp oral como carnb ios en la ca lidad del sonido . Detecci6n de asincronias en el ataque y la extinci6n de sefiales complejas La asinc rorua de co mpo ne ntes de una serial compleja es de tec tada con ma­ yor fac ilidad en el ataque que en la ex t inc ion de la serial. Pa ra seriale s armo­ nicas se perciben d iferencias en el ataque de los arrnonicos de men os de 1 ms (con umb rales algo may ore spara componen tes de alta frecuenc ia), m ien tras que el um bral en la ex tincion va dcsde valores comprendidos entre 3 y 10 ms - cuan do el co mpo nente asinc ron ico ce sa des pues qu e el resto de la serial compleja- has ta va lores en tre lOy 30 ms cuando esre cesa antes que la seria l de base. El resu ltado de estos experimen tos es consisten te con la irnportancia per ceptual del ataque de un sonido . Tamb ien esta estrech arnente rel aciona­ do con la adapracion audit iva y con la percepcion del timb re ins tru men tal. Los umb rales de deteccion de asincron ias para seriales no arrnonicas so n de 2 a 50 veces mayores que para senales arrnonicas . Este hecho es explicable en te rrnin os de agru parnient o perceptual: es mas diftcil esta blecer la sincro n ia de ataques de sen ales que parecen provenir de fuentes dife ren res. Discri minaci6n de la d uracion Vari es estud ios revelan que , para va lores de duracion del est fm ulo T supe rio­ res a los 10 ms, el um bral diferencial de duracion AT se incrementa con T y es ap roxirnadarnente independien te de las caracte risticas espec trales de la se­

127

rial. Esta regia se c umple tanto para la discriminaci 6n de la duraci 6n en soni­ dos como en sile ncios entre sonidos. Valores tfpicos de boT son de 1,7 ms pa­ ra T = 25 ms y de 15 ms para T = 320 ms (Di ven yi y Danner, 1977). La fracci6n de Weber, boT/T, decrece levernente al aurnentar T. Como co n cas i todos los pa ra me tres que cuan tifican la d iscriminac i6n audit iva, se enc on tro q ue boT aumenta a intensidades pr6ximas al umbral de audibilida d. Estos va lores se co rre lacionan con los de integrac ion tempo ral de la sono ­ rid ad, en part icu lar co n el posculado de H enning qu e esta blece q ue, al eva lua r la sono rida d en estfmulos de co rta d uraci 6n , prevalece la cantidad tot a l de ene rgfa en lugar de la intensidad de la sefia l, tema q ue tratam os en el cap itu­ 10 u, punto 4 (Henning, G . B., 1970).

6. ] U ICIOS SOBRE EL ORDEN

T EMPORAL

La habilidad para juzgar el o rden te mp oral en un a secue nc ia de son idos depcn­ de en gran medida de la tarea asignada al suje to : una cosa es la identificaci6n de l orde n q ue oc upa ca da son ido dentro de la sec uenc ia y otra la discrimina­ cion en tre sec ue nc ias co n distinto orden , sin q ue se pu ed a precisar la ubi ca­ ci6n de ca da son ido en el conjunto. En el caso de la identificacion de l o rden tempo ral, Hirsch encon t r6 q ue sujetos en tre nados necesitaban al menos 20 ms por son ido para det erminar el orden en un a sec uenc ia (H irsch , I. ] ., 1959). En el ca so de la di scriminaci6n entre sec ue ncias la resoluci 6n es mas fina, y se necesit an ent re 2 y 7 ms po r son ido . Estos va lores son de gran importancia para comprender el desplaza­ rniento ac ust ico temporal, q ue pre sentamos a co nt in uaci6n .

EI desplazamien to acustico temporal

que esgrirne pa ra defender d icha hip6tesis es la del desp lazam iento te mpora l de estfmu los acust icos ex trernos: to ma ndo la sec uencia [a] - b - azl en el riem­ po fisico t, si el estfrnulo ce n tral b tiene un a frecu encia qu e difiere de forma no­ tab le -por ejemplo cu at ro oc tavas- de los est frnulos later ales y escogemos esti m ulos muy breves -del orde n de los 80 mi lisegun cios-, 10 qu e se oye en el tiempo fenomenico T es un a suces i6 n distinta [A I - A z - B]. Los sonido s mas agu ­ dos se oye n seguidos y cl son ido intermedi o, mas grave, se ve re legad o al fin a l de la suce si6n (Vicari o , G . B., 1997). En la Figura 10 se puede ver un esquema del experirnento. La diferen cia entre las frecu encias de aj y az corre sponde a un intervalo de seg un da mayor desce nde n te . Vicar io comprob 6 q ue e n e l caso de q ue los es t trnu los al Y az sea n no ta­ blernente mas exte nsos q ue b el fen6 meno se hac e mas ev ide n te , in clu so de ­ sap arece la noci on de "localizaci on temporal" de b, q ue parece flota r sobre los dos son idos agud os. Llega a la co n clus i6n de qu e las secuen cias de estirnul os no h o mogen eos son m as propi cias pa ra la producci 6n de de splaza m ien tos temp or ales. EI desp lazamiento temp oral no se pued e a tribuir a n ingun proceso fisiolo­ gico y no parece senc illo ex pl icar de q ue modo re laciones especfficas no tern­ por ales -como semejanza 0 d isimilaridad- pueda n in teraccion ar con relaciones temporales tales como anres/des pues. La ex plicaci6n mas difundida supo ne q ue la posici6n de los so n idos e n el t iempo feno rnenico se decidirfa luego de h a­ ber ofdo todos los estfrnulos, La o pe rac i6n , prec onsciente, te ndrfa lugar en el lapso de aprox ima da me n te 200 ms q ue va de sde la lIegada de las sena tes at tfrnpano y la pe rcepci6n consciente de las m ismas (Fraisse, P. , 1967).

[

a, = 1.800 Hz

I

I b

Las prueb as ex pe rime n ta les refe rida s a l de sp lazam iento entre el tiempo ffsico y el fenomcnico fueron ini ci ad as por W h ilhem W undt y continuad as luego por Edgard Rubien , q uien es lograro n tr ansforma r un fen 6men o de si multa nc i­ dad fisica en un a suces i6n psicologica, Varias h ip6t esis fueron pro puestas po r entonces pa ra dar cu en ta de l fen 6meno, y en tre elias pre valeci6 la qu e supo­ nfa qu e la h et erogen eid ad de los estfmu los consti tu ye el factor responsab le de los desp lazami entos ternporales. En la dccada de 1970 el psicologo italiano Gio vanni Bruno Vicari o desa­ rrollo un a serie de tr ab ajos sobre el fen ornen o de l de splazamiento tempor al en la aud ici6 n , en los q ue plantea la imposibili dad de est ab lecer un a co rresp on ­ dencia biunfvoca en tre el tiempo ffsico y el psico logico . Una de las ev ide nc ias

128

I

o

a, = 1.600 Hz

=66 Hz

I

I

80

160

240

Tiempo (ms)

I I

A,

I

A,

\

B I

I Tiempo

I. I. I

I

Figura 10. Esquema del expe rimento de Vicario

129

..,....-

Umites de validez del fen6meno

a)

Una cond icio n necesaria para la oc urrencia del desp lazam iento tempor al es qu e las di stintas sefial es no deben co nec ta rse esp ectr alme n te en las t ran sic io­ ne s. De h eche, la rep roducc ion literal del experim en to de Vicario no da el re­ sultado esperado. El motivo hay que buscarlo en el pe rfil di n arni co de las sefia les: si las tr an siciones son bruscas (figura l l a ) apa rece un gran anc ho de banda que destruy e la separacion espectral estipulad a en la h ipotesis o rigina l. La apa ren te ano rna lia se debe simplemente a que n o puede ser qu eb rantado e l lfrnite impu esto por el principio de inde terrninacion ac ust ico . El efecto se aprec ia clara men te en el diagrama tridimensional de la figura 11b. S i se suav izan las transiciones entre las sefiale s, po r eje rnp lo co n ven tarias te rnporales gaussian as, se eliminan los puentes espectr ales q ue co n ec ta n Ia re­ gion aguda co n la grave y el fenorneno de de splazam ien to tempor al se perc ibe co n claridad, En la figura 12 se observa la sefial de prueba mod ificada y el efec­ to espectral de rivad o. Se ve cla rarnente la ma yo r independen c ia (sepa rac ion espe ct ral) ent re las seriale s aj y az con respecto a la seria l b, q ue correspo nde a la co nd icion de n o h omogene idad de los est imu los post ulad a en los t rabajos in ic iales (Basso, Gu illen y Liut, 2000).

u ro u

~

0

2

S

Tiempo

ol rJ.2J ms ".

544.54 ms

Frecu encia (Hz)

Figura 12 . a) Deralle de la sec uenc ia temp oral co n transi c io nes gaussian as largas. b) Ora­ TEFd e la misma sec ue nc ia

f ICO

a)

Aplicaci6n musical u m

:g

c: 0 '"

3

t:

b)

iIi"

Tiempo

:so

_ O,Oms

~

u

.~

~ JJ-+'tJ2i! -­ 344

689

1033

I

1378

~ ip·EM ~!pe=-; :~ ::~ :

'!J

1 1722

2067

2411

2756

Frecuencia (Hz)

Figura 11. Gr afico te mporal y t iempo-energta-frecuen c ia (TEF) de la sena les de la secuen­ c ia origin al

130

Estas ex pe rie nc ias controlada s - co mo reco nocen casi tod os los inves t igadores qu e par tic ipan de ell as-, por su simpl ic idad d istan bas ta n te de 10 qu e sucede en la vida cotidiana, Es posible, sin embargo , encontr ar en rnuc has obras de rruisica el uso -intencional 0 no - de algun a de estas pec uliaridad es de la pe r­ cep c ion a udi t iva. Por tratarse de situaciones m usicales reales (es to es, dentro del contexto de una "puesta en ob ra") n o ti en en la intensi.dad y la clari dad que se puede lograr en el marco ascetico de un laboratorio. De acuerdo con sus objetivos y co n los pre supu esto s esti lfsticos in vo lucra­ dos, un co mpositor puede decidir el mod o de aplicac ion del desplazam ien to aciistico temporal. Si su intencion es in depe nd izar y desvincu lar d iferentes ele­ mentos de un conjunto, la estrategia pl an te ada permite de sdoblar la estru ctura en dos tr aru as temporales separadas y autonorn as. U n ejemplo q ue ilustra esta tecnica se encuentra en la pieza para orquesta red ucid a Homenaje a Garda Lor­ ca (1936) de Silvestre Revueltas, en la qu e la m isma melcdfa se in te rp reta en para lelo con una tuba y una flauta piccolo a d istan cias de cuatro y c inco oc ta­ vas. Aunque el paralelismo absolute de alturas y dur acion es deber ia ayuda r a fund ir perceptualmente los instrumentos, la en orme separacion de los regist ros

131

Tiempo

Capitulo V Percepci6n de la altura tonal

iD ~

"D

'"

"D

"Vi

932 .97 ms

C QJ

C

tIT"

516

1033

1550

206 7

258 3

3 100

1,391 S

36 17

Frecuencia (Hz)

Figura 13. Grafi co T EF del fragment o cita do de H omenaje a Garcia Lorca de Silvestre Re vueltas

y la ausenc ia de puentes espec trales rompen la relacion temp oral ent re cllos. A l

ofr el pasaje se percibe un a ambigua sensaci6n de "desajuste", provocado por el desfasaje en tre tiempo ffsico y psicol6gico propio del fen 6m eno bajo ana lisis. En la Figura 13 se puede ver un grafico TEF de dicho fragmento. Por el con trario, si el prop6sito del autor se dirige a la fusi6n de estruc tu­ ras, el fen6meno de desplazam iento temporal debe ser evitado . Adernas de re­ ducir la d istanc ia espec tral que separa a los estim ulos, es necesar io agregar da tos espectrales que sincro n icen las secuenc ias en las zonas de transicion . Cie rtas ar­ ticulaciones y ata ques des truyen la paradoja temp oral, sinc ron izand o el tiempo ffsico con el psicol6gico . A q uf una cuidadosa elecc i6n de los medios instru ­ mentales, que inclu ye tanto los instrumentos mismos co mo las dernas va riables involucradas -registro, rnatiz, articulacion, etc.- result a decisiva.

La altura tonal se define tecn icam ente co mo "aq uel atri buto de la sensac i6n audit iva en terminos de l cual los son idos pueden ser orde nad os en una esca la musical" (American Sta ndards A ssociation, 1960) .1 En otras palabras, un a se­ cue ncia de son idos que varfan de altura ton al tien e el car acter de una melo­ dia, Un ejernp lo qui za ayude a delimitar este concepto. Si se alte ra la ec ualizaci6n en un sistema de audi o ca mbia el brillo del so­ nid o y, en cierto sen tido , algun aspecto relacionado con su altu ra. Pero h ay otros elementos que no se rnodifican, pues el cambio en la ecualizaci6n no ha ­ ce que el Do de un a flaut a sesustituya por un Re, ni que el fragmento modul e a ot ra ton alidad. Estas caracte risticas -que perrn an ecen in variantes frente a los cam bios en la d istr ibuc i6n de energfa del espectro- definen la altu ra ton al pre­ sen te en los son idos llamados t6nicos (Sc haeffer, P , 1966) . La ton icidad de un son ido es el rasgo percep tual q ue permite que se 10 identifique con uno de los grados de la escala musical. Lo q ue cam bia al modificarse la posici6n de los cur­ sores de un ecualizador es la distribuci6n de ene rgia en el espectro de la sefia l. Esta dist ribuc ion de ene rgia se asocia co n la percepci6n de la altura espectial del son ido: dos guita rras que emite n la misma not a, una de soni do rnet alico y la otra de sono ridad oscura, produ cen la misma altura tona l pero distintas alturas espec tra les (es ha bitua l decir que la primera es "mas aguda" que la segunda) . El grado de tonicidad varia de un son ido a ot ro: una flau ta genera sonidos muy t6nicos, una ma rimba sonidos de tonicid ad interrnedia y un ta rnbor ge­ ne ra sefiales de ton icid ad nula. En una primera aproximaci6n podemos esta ­ blecer que el grado de tonicidad guarda relaci 6n con el ancho de band a de la serial ffsica: a mayor ancho de banda menor tonicidad, y viceve rsa. El princi­ pio de inde te rrninacion aciistico gobierna la rela ci6n frec uencia/duraci6n en los casos anteriores. La altura tonal se considera comp leta 0 "fuerte" cuando permite la for maci6 n de aco rdes y funciones tonales, e incompleta 0 "debil" 1

132

Err la literat ura err ingles se la den omina pitch chroma"

133

cuando no 10 hace. Po r ejernplo , con tres to m- to ms de banda angos ta se pue­ de gene rar un a sec ue nc ia melodica Do-Mi -Sol, pero si se los ejec uta simulta­ neam ente no se forma e l aco rde de do mayor: los to m-to ms posee n altura to nal incom plet a (Basso , G., 200 1a ). En general, las sefiales periodicas son percibidas co mo son idos toni cos, a los q ue se pued e asigna r un valor de altura tonal defi nid o q ue se corre lacio na direct arnen te con la funda mental de Fourier de la sefial. Se presenta aquf un a de las propiedades mas notables del sen tido de aud icion : perci birnos con un a altura to na l (mica los son idos causados por est imu los peri odi cos, al margen de la co mp lejidad arrno n ica qu e posean. En la figura 1 se puede ve r el espec tro de un son ido de v ioloncello. La can tidad de arrnon icos es aqui mu y gran de. S in em bargo, se oye cla ra­ ment e un a sola altu ra tonal. En estos casos el sistem a audi tiv e presra mas ate n­ cion a la salida de un hi po te tico centro de pro cesamiento de la altura (q ue sefiala un a iinica sensac ion de altura tonal) que a las caract erfsticas de la altu­ ra espec tral 0 pr imaria de l son ido , Si se desea air en detalle cada com pone n te aislado es necesar io inhi bit el mecanismo anterior, operacion que demanda un tiemp o co nsiderable y que explica la dificultad de perci bir por separado los 8.[­ rnonicos superio res en los son idos de corta dura cion . Se den omina audici6n analftica a esta ulti ma forma de ai r y audici6n sintetica a la prim era.? Al gunos a utores , entre elias Terhardt, sugieren que la capac idad para sin­ te tizar gran cant idad de arrn on icos en una un ica altura tonal se aprende du­ rante la pr imera infancia a parti r de la reiterada exposic ion a son idos periodicos, en espec ial la voz huma na (Terhardt, E. et aI. , 1982). A 10 largo de esre capitulo nos encontraremos constanternente co n dos teorfas que trat an de explicar la percepc ion de la altura to na l. Una de elias es la teorfa dellugar (vease cap. I, aparrado 4), que parte de dos postu lados d istin­ tos. EI primero establece que el aida efectua un an alisis espectral en el int erior de la coc lea: d iferen tes frecuencias exc itan d iferentes lugares de la membrana basilar, en una especie de organizac ion tonotopica. EI segundo postu lado afir­ rna que la altura tonal se relac ion a con el patron espaci al de exc itac ion produ­ cido por el estfmulo. La prime ra h ipot esis es aceptada por la casi tota lidad de los investigadores, mien tras que la segunda toda via es materia de discusion . Una teorta alterna tiva a la teo ria dellugar es la teona temporal, q ue sugiere que la alt ura se relaciona con el pa tron temporal de los impulsos neurales origina ­ dos en el csn rnulo. Co mo los d isparo s de las ce lulas nerviosas t iend en a ocurrir en una pa rt icula r fase de la forma de onda, interviene necesariarnen te la sens i­ Por ejernp lo, Ge rard G risey tuvo que ralen rar las masas sonora s en Partiels, co rnpuesra en 1975, para que se pudiera o fr la evoluci6n de cada componente (parcial) aislado ,

2

134

0 -6

-12

-18

-24

-30

m -36 :s- -0

:::J

~ E

«

-42 -48

-54

·60

-64

-72

-78

-84

-90

-96

100

200

500 1k

2k

5k

10k

20k

Frecuencia (Hz) Figura 1. Espectr o de un son ido de violonce llo

bilidad a la fase de l sistema aud it ive . Como esta sens ibilidad desaparece para frecuencias por en c ima de los 5 kHz, la teorfa tem pora l no expli ca la percep ­ c ion de la altura to na l a alras frec uenc ias.

1. P ERCEPCION DE LA ALT URA T ON A L EN SINUSOIDES

A comienzos de l siglo XX el psicologo Herm ann Ebbin gh aus postul o qu e se de­ be remover tod a la informacion supe rflua en el estud io de los esti mulos y sus respue sta s psfquicas. A par t ir de esta regia, q ue mezcla pr inc ipios torna dos de las ciencias ffsicas y una mala lectu ra de l teorerna de Fourier, se impuso una trad icion en la que se ern plea n casi exclu sivament e seria les sin usoida les para los experimentos de psicoacustica. En co nsec uenc ia, tambien se ut ilizaron es­ tirn ulos sin uso idales para est ud iar la percepcion de la altura tonal. Sabe mos, sin em bargo, que las sin usoides son sefiales de prueba inade cu adas po rque la altura tona l se asoc ia en gran medida a la peri odi cidad de los estfrnu los arrno­ nicos co rnplejos , qui za par nu estr a ca pac idad para agrupar los diferentes co rn­ pon entes espectrales pre sentes en la voz h urnana . La altura tonal originada en una sinuso ide result a impr ecisa e inestable, co mo puede co mpro bar cua lquier oyente ante un a mel odia realizada can ton os pur os - h abituales en las sefiales de espera de los co ntestado res te lefonicos, Adernas, cu ando los est frnulos son simp les y posee n solarnente un a sola frecuencia dest acada, la altura to na l se con funde en parte co n la altura espec ­ tr al. En c ierto sentido , un a sin usoide co ntiene su propi o timbre , ya que al rea­

135

lizar un barrid o ascende nre en frec uenc ia del uni co armo n ico presenre (la si­ nuso ide misma) se exc itan sucesivamen te zonas advacentes en la mem bran a basilar. El resultado perceptu al es un glissando acornp afiado de un cambi a continu o del co lor to na l. U n ejemp lo trad icional de esta confusion entre al­ tura tona l y espectral 10 brinda la esca la de altura, expresada en me ls, que se muestr a en la figura 2. Los valores de altura en mels, elabora dos a part ir de estimu los sinusoidales, d ifieren no tablemente de los obtenidos a partir de sefiales arrnon icas complejas. Para alguno s auto res, la escala en mels describe simplemenre el brillo tfmbrico de los sonidos simples y no es aplicable a la altura to na l ta l com o se la en tie n­ de en la pract ica musical. A prin c ipios de la decada de 1970, Fred Attneave y Richa rd O lson postu laron que para est udiar las escalas musicales se deben ernp lear las seria les co mplejas que se usan en la practi ca musical concreta (Attneave y O lson, 197 1). Los experimen tos que realizaron a part ir de este postu lado diero n resultados mejor correlacionados con un vfnc ulo logarftmi co en tre la frecuencia de l estfrnulo y altura tonal que la escala de me ls, al men os dentro del rango de las frecuencias fun damentales que se emp lean en musica.

10 largo de l tiempo. Para la teoria del lugar ambas habil idades esran relac iona­ das , pues depende n de l filrrado en frecuencia de la coclea . Para las te orfas temporales la re lac ion no es tan marcada. El limen - rnfnima variacion det ect able en frecuencia- permite evaluar la discriminacion en frecuencia y crece mon otonarnente con el valor de la fre­ cuencia del estfmu lo sinusoidal.' En las figuras 3 y 4 se pueden observar sus va­ lores absoluto s y relatives, El valor relati vo de l limen, expresado en relacion con frecuenci a central Fe, tiende a ser menor a frecuencias centrales y aume nta a med ida que el estfmulo se desplaza hacia los ex tremos del espectro audible. Por ejemplo, el limen absoluto es aprox imada ment e ~f = 2 Hz para una frecuen cia ce nt ra l de 1.000 Hz y corre sponde a un limen relative de 0,2%. Es habitua l rea lizar las experienc ias de medi cion del limen a partir de dos metodos: la var iacion en frec uenc ia de sinusoides aisladas y la variacion en frecuencia de la sefial moduladora en un dispositivo de frec uencia modulada (FMDL).4 Los resu ltados de las experiencias de FMDL se utili zan, por ejernplo, en el calculo de los Ind ices de inteligibilidad de la palab ra en sistemas de cornu ­ nicacion. En el capitulo IX desarrollarem os este top ico , C ontrariamente a 10 pred icho por la teorfa del lugar, el DLF no varta con D iscriminacion en frecu en cia la frecuencia de l mismo modo que la band a cr ft ica y disminuye al aumentar la sono ridad de l estfrnu lo. A part ir de estos datos la mayorfa de los invest igado­ Como ya serialamos, es necesario d isti nguir en tre selectividad en frecuencia, res se inclinan por las teorlas tempo rales al proponer sus mod elos, aunq ue los que es la habi lidad para distingu ir cornpo nentes en un son ido co mplejo , y dis­ resultados experimenta les sugieren q ue ex iste un mecanis mo temporal para las criminaci6n en frec uencia, la capacidad para de teetar cambios de frecu en cia a bajas frecuen cias y un mec anismo tonotopico para altas frecuencias. Zwicker y Henning crearon un modelo mixto que produjo resultados con ­ sistentes con los valores medidos de DLF y de FMDL (Zwicker y Fastl, 1999 ). Es­ 3000 I I t I j I I t I JII te modelo establece que el limen esta det erminado por la informacion tem poral (sensibilidad a la fase) para frecuen cias de h asta 5.000 H z - la sensibilidad a la 2500 ~ . ········.f······_····f··· L. L•. +· ·.. 1 ·1 fase dec rece ai llega r a 2 kH z y desa parece a 5 kH z. Por enc ima de 5.000 Hz tanto el DLF y como el FMDL parece n responder a un a suerte de teo rfa del lugar. 2000 -I ······i-··- i+- -: · ··········;··········;·· + 1 ..~ . j '

T'

..

w

Q;

E

- ; l S00

-I . _~ ......­

Variaci6n de la altu ra ton al co n la sonoridad

.3

«

Stevens constat o en 1935 , a part ir de esti mulos sin usoidales, que la alt ura to­ nal varfa con la sono ridad del esn mulo (Stevens, S. S., 1935). En la figura 5 se muestran los resultados del ex perime nto origina l.

1000

500

10

20

50

100

200

SOO

1000 2000

5000 10000

Frecuen cia (Hz)

Figu ra 2. Relacion en tre altura (rnedida en mels) y frecuencia

136

(difference limen in frequency) y, como

tal, pertenece al conjunto de parametres de d iscriminaci6n agrupados como "rnin imas di­

ferencias perceptibles" (JND, de just noticeable difference).

4 FMDL (difference limen in modulation frequency ).

3 Se la con oce como DLF pa r sus inic iales en Ingles

13 7

100,0 50,0

15

,_+.J -L- ---~-._---_+---~-.-- !..-.L-~--,

-I-:

+--Ti-~r-- -r -----r----- --'-_

-t .

~ ': : f-~tf~ ;t· -" · · ·_· L

I

I

I

I

8000 ~ Hz

~

10-1

-

--+

··-

I

I

I

5J OO Hz

- +1

;;g

+"

C1l

>

~ o l~ C1l

::: I~ ~Z[] - ..J+_. +

I

~

·5 -l ­

I

-'-_ _...._

I

!

.i. _1()OO.H" ...

I

- + ' . . ; ..

I

~ _. ~- ;: " .·' 1

Shower y Biddulph (193 1) -10 -/-

- - - - Promedio de varias mediciones

. --.+-

.;.-. , ·········· - i · X·· ···· ' ·1

!

! 125 250 500 1000

2000

4000

6000

-15

c

0,02

& co

-; c -o

80

i

i

90

100

I

LRF FM 10 Hz(FMDLF) 0,01

-.

0Q

2. PERCEPCION

'.



K 0,005 c

'"

o > .~

~ c

'"

E 0,002

:::;

250

500

1000

2000

II"

4000

8000 \

Frecuencia central (Hz)

Figura 4. Limen relat ivo en frecuencia para esnrn ulos sinusoid ales. El FMDL se obtiene ca n un a modulaci6n en frecuencia

138

ii 70

Aunque los dat os actuales son men os profundos que los medidos por Ste­ vens, el fenorneno ocurre y, para senales alejadas del centro del espectro audi­ ble , la variacion en altura ton al puede superar el 5%. Este fenorneno no tien e aun explicacion teorica. La variac ion de la altura ton al con la son orid ad desaparece cuand o el es­ timulo est a cons titu ido par sefiales arrno n icas com plejas y no es, por 10 tanto, apreciable en la mayorfa de los son idos que se usan en musica.

LRF (DLF)

:::>

60

Figura 5, Variaci6n de la altura can el nivel sonora

Figura 3. Limen absol uro en frecuencia para esnrnu los sinuso idales. En la medici 6n de Shower y Biddulph se ernplearon FMDL

'"

50

Nivel sonora (fanes)

Frecuen cia (Hz)

ec: c'" .~

Iii 40

12000

8000

-,

"

DE LA A LT URA TON A L EN ESTfMULOS A RMO N ICOS COMPLEJOS

A pesar de la gran ca nt idad de estudios realizados a parti r de estfrnulos sinu ­ soidales, la altura to na l es un rasgo propio de los son idos t6 n icos deri vados de sefiales periodicas cornplejas, cuyo espectro es aproximadamente arrnon ico. El nacim ien to del concepto de altura tonal esta asoc iado al desarrollo h is­ ronco de los modelos explicativos de la relacion (recuencia-a ltura y del per­ feccionamie nto de los met odos de rned icion en psicoacust ica . En el siglo XIX, Fechner llego a la idea de que existe una transform acion logarftmi ca del esn ­ mulo ffsico a partir del uso de metodos diferenciales para sus experirnentos. A mediados del siglo xx , Stevens com pare las alturas tonales provenientes de es­ timulos sinusoid ales y propuso la escala de mels. Sus result ados difieren de los de Fechner, en part icular en los extre mos del registro. Mas tarde , Sheppa rd

139

sost uvo que ambos merodos resultan incorr ecros a la hora de eva luar y dar res­ puesta a la cuest i6n de la alt ura to na l, y que se debe ce ntrar el estud io en la rasa de repetic ion de Four ier de la serial acustica. Sin dud a, hay al menos dos d iferen tes clases de altura to na l: la que deri ­ va de estfrnulos d iacron icos 0 suces ivos y la que provien e de est frnulos sinc ro­ nicos 0 simultaneos, Aunque la escala de mel s no es un a esca la aprop iada para usos musicales, ca ptura sin embargo algun aspec to irnportan te relacion ado co n la alt ura tonal de los son idos d iacron icos, Al gun os dat os estad fs ticos, co­ mo la mayor can t ida d de inter valos cerrados en el ran go central de frecuen ­ cias , esta n relac ionados co n la esca la de mels. Tamb ien tien e algo que ve r co n el brillo de los son idos, tal como co rne n ta ramos antes. La teo rfa del lugar clasica tien e d ificultad es a la hor a de descr ibir la pe r­ cepc ion de sefiales comp lejas ya q ue, por 10 gene ra l, la alt ura to na l no co­ rrespo nde a la posic ion del max imo de exc itac ion en la membrana basilar. U na dernostr ac ion co n cluyen te la provee el fenorneno de la fundamental re­ co nst ruida 0 fantasma, descr ito por Schouten en 1940 co mo el "residue " de bat ido de un grupo de arrnonicos co nsecut ivos.' La percepcion de este resi­ duo n o requi ere ac t ividad en el punto de la MB que responde a un a sin uso i­ de de alt ura sim ilar. Tiem po despues, Licklider ( 956) dernost ro que la al tura del resid uo pe rsiste aiin cuan do los ca n ales en la MB co rrespo nd ientes a la fundamental de la serie arrnon ica se enmascaran co n ruido de baja fre­ cuenc ia: los soni dos de baja frecuen cia qu e se perc iben, asoc iados al residuo de batido, apa rece n a part ir de los canales exc ita dos por los comp onentes de me dia y alta frecuen c ia de la serial. Varios mod e los fue ron prop uestos para exp licar la incid en ci a de la fun ­ dam enta l reconstruida en la percepcion de la a ltu ra ton al. U na primer a c la­ se de modelos, los llamados modelos de reconocimiento de purrcnes, asume qu e la a ltu ra de un soni do co mp lejo se de riva de las sefiales neura les co rrespo n­ dientes a los estfmulos prima rios en la membrana basilar, por eje mplo las fre­ cuenc ias de los pa rc iales indi vidu a les. La segund a clase de mod elos sost iene q ue la percep c i6n de la a ltura to na l se as ienra en la eva luac ion de inter va­ los te rnpora les. Veam os cada una con det all e. Modelos de recon ocimi ento de patrones Los modelos de reconocimienro de pa trones di viden el proce so de percepc ion de la altu ra tonal en dos e tapas, La primera consra de un ana lisis en frecuen cia, 5 La funda menta l reconstruida cor responde al primer arrnon ico en el desarro llo de Fourier de una serial per iodica. Vease el Apendic e l.

140

sim ilar al analisis clasico de Fourier, para det ermin ar las co mponen tes sinusoi­ dales de la senal co mpleja. La segunda e tapa co nsiste en el recon ocimiento de los esquem as 0 patron es que det erm inan la altura ton al co nforme a la salida de la pr imera et apa. En el afio 1962 Sc ho ute n realize un a expe rienc ia que provoco la apari­ cion de gran cantidad de modelos teoricos que intentaron dar cuenta de los result ados (Sch ouren , }. F. et aL, 1962). A part ir de sin usoides modul adas en amp litud genera , en primer terrnino, sefiales co n tres co mponent es de 1.800, 2.000 y 2.200 H z. La altura to na l percibida cor respo ndfa, com o era de esperar, a la de un a sin uso ide de 200 Hz, fundame nta l de Four ier del tr fo de arrnoni­ cos an te riores. Luego gene ra otra sefial co n co mpo ne ntes de 1.840, 2.040 y 2.240 Hz (que son los arrnonicos 46, 51 y 56 de una funda men tal de 40 H z). Los oyentes, sin embargo, percibfan un son ido compuesto cuya altura to na l predom ina n te era similar a la de una sinusoide de 204 H z, jun to a dos alturas secundarias que se pod fan asoc iar co n sin usoides de 185 y 227 H z. Ninguno de los sujetos que part iciparon de la experienc ia perc ibio la altura correspon­ dien te a la fund amen tal de Fourier de 40 Hz. El modelo propuesto po r Wa lliser, en 1969, para ex pl icar estos resultados con sta de dos pasos: 1) se calcula la altura de te rm ina da por la diferen cia de frecuencia entre pa rc iales vec inos (la tasa de repetic ion de la en voIven te) y 2) se busca el subarrno n ico del co mpo ne n te de meno r frecuenc ia que mejor se ajuste a la frecuen cia enc ontrada en el paso pr imero ," Este modelo aplicado al experimento de Scho ute n da 200 H z en la pr imera operac ion 0 ) y 204, 4 H z 0 .840 H z / 9) en la segunda operac ion (2). Esra ulti ma es la frecuencia que de te rm ina la altura tona l. En 1972 Terdh ardt sugirio , inspirado en el modelo de Walliser, que la al­ tura residual es un subarrnon ico de un compo ne nte dom ina n te y discrimina­ ble, sea 0 no el de meno r frec uenc ia. C uando los parc iales estan muy proxim os en frecue ncia no puede n d iscrim inarse y resulta imposible o fr la altura resi­ dual. Estimo q ue los parcia les dom inantes cae n en la region espectral com­ prend ida entre 500 y 1.500 Hz." U nos afios despues, Terdh ard t sugirio qu e la capac idad necesaria para ha­ cer uso del mecanisme prop uesto en su modelo apa rece en un a fase ternpran a del ap rendi zaje, en la que estarnos expuestos sobre todo a los son idos del ha­

Walliser (1969), en Moore (1995).

7 Terhardt llama 5ubaml6nico5 al conjunto de las funda menta les de Fou rier cuyas series ar­

m6ni cas inclu yen el co mpone nte del est fmulo en cuesrion. Sus frecuencias coincide n co n

los subm ultiples de la frecuencia de l compone n te. No se los debe confund ir con el produc­

to de un a h ipotet ica resona ncia inferior.

6

141

bla (Terdhardt, E., 1974) . Afirrn o que aprendemos a asociar la frecuen cia de un corn pone n te del estim ulo co n los suba rrnoni cos del m ismo: la estirnulac ion de un solo arrnon ico produce alturas prob ab les a las frecuenc ias de los subar­ mon icos. C uando un co mplejo arm6 n ico se pres enta, la mayor cantidad de co inc idencias a la frecu encia de la fundamenta l determina la altura to na l del son ido, Para son idos no armo n icos (como el de la experiencia de Sc ho uten ) no hay co inc ide ncias exa ctas y la sensac ion de altu ra no resulta tan precisa. Queda claro que este modele requ iere de l ana lisis de mas de un parc ial de la serial de entrada .

a)

b)

Mas 0 men os en la misma epoca, G o ldstein propuso un modelo en eI q ue la alt ura tonal de un son ido complejo es der ivad a por un procesador ce nt ral que recibe informacion solo de la frecu en cia de cada cornp on ente, soslayando la informacion apo rrada por la arnpl itud y la fase (Goldstei n , ]. L., 1973 ). EI procesador presum e que todos los estirnulos son peri od icos y que rodos sus es­ pectros comprenden arrnon icos sucesivos. Los errore s de estirn acion de la fun ­ dam en tal oc urren al estima r eI ruimer o de ar rnonico apropiado. A plicado al experirnento de Scho uten , los arrnon icos de 204 H z ex plican razon ab lernenre bien los co mpone n tes de 1.836, 2.040 y 2.244 , pe ro no dan cuen ra con igual exactirud las frecu en cias de 185,5 H z y de 226,7 H z - cercanas a las de 185 y 227 Hz percibidas en e l expe rime nto ori ginal. Los mod elos de reconoci mien to de patrones dependen de la resolu cion espectral de la mem brana basilar, pero no irnpli can necesari arnente el uso de informac ion to notopica perse como un a medida de la frecu en cia.

La altura residu al se determina por el in ter va lo temporal ent re rnaxim os 142

l ' 2 ' 3:

l' 2' 3'

Figura 6. Form as de onda de dos sefiales modu ladas en arnplitud. En el pr imer caso, la portadora (2.000 H z) es un multi ple exac to de la moduladora (200 Hz) y el pertodo ent re picos correspondienres (1-1 ' , 2-2' ) es de 5 ms, En el segundo la frecuen cia de la portadora aumenra a 2.040 Hz y el in tervale en tre picos es algo menor a 5 ms

en la esrructura fin a de la onda en la membran a basilar (Scho uten regisrro la sefia l en el punto de maxima osci lacion en la MB). S i hay mas de un interva­ 10 tempo ral posible, la altu ra to na l co rrespo nde a la cre st a mas prominente. Si se considera la repr esen racion de la serial a n ivel neur al adq uiere significac ion el intervalo temporal ent re los disparos nervi osos sim ilares. Si el sistema "con ­ tase" simplernen te la ca n tidad de d isparos por segundo, el modelo de Sc hou­ ten no podrfa fun c ionar.

Mo de los temporales Para da r cuen ta de su celebre ex perirnen to , Sc hou ten propuso un mod elo basad o en el patron temp or al q ue desarr olla la onda del estimu lo en la mem ­ bran a basilar. Seg un su mod elo, la a ltura tonal es determinad a po r la pe rio­ dicidad de los parciales in vo lucrados en la dete rminacion de l residu o. EI peso relati ve de cada parcial depende de su capacidad para atraer la ate nc ion del oye nte , ya sea po r sono ridad 0 po r co n traste con esn rnulos prev ios. La gran diferen cia ent re los modelos temporales y los mod elos de recon o­ cim iento de patron es es que este s ulr imos requ ieren que mas de un parcial sea discriminabl e del co mplejo para q ue se perciba la altura de l residuo , mientras que los primeros solo pid en que los parciales interactuen , no que sea n discri­ minab les (n o es n ecesario que sean perc ibidos separados) , En la figura 6 se mu estran los resultados temporales del exper ime n to de Sc ho uten .

1 2 3

Evidencia experime ntal relevan te a cada mod elo

LA regiOn de existencia de la altura residual

"

-,

De acuerdo con la teori a de reconocirni ento de pat rones, la altura residual so­ lo se puede perc ibir cuan do al men os un o de los co mponen tes sin usoida les del estirnu lo puede ser o fdo en form a separad a. Es decir, qu e ne cesita ser discrimi­ nable. S i el esrfrnu lo posee uni carnen te arrnon icos muy altos no resolub les la altura residu al no deberfa perc ibirse. R itsma encontro que el caracter to na l de la altura residual existe iin ica­ mente dentro de una regi6n de frecuencias lim itada, que llarno la regi6n de existencia (Ritsma, R., 1962) . C uando el mim ero del armo n ico es muy grande (po r encima de 20 0 mas) se oye un zumbido de altu ra ind efinible. Tiempo 143

.

~ despues, Plomp hallo qu e la altur a residual puede percibirse para tasas de re­ peti ci6n de hasta 1.400 Hz, dat o compatible - aun que no identico- con la pro­ puesra de Rit sma (P lo mp, R., 1967). A con trapelo de las h ip6tesis an teriores, Moore estableci6 q ue para an no­ n icos de orde n elevado hay un rango determinad o en el cual se puede o ir una altura residual aun cuand o ningun o de los arm6n icos pueda o frse por separa­ do (Moore, B., 1995 ). Los modelos de reconocimien to de pat rones no pueden dar cuenca de este heche . De tod os modos hay que apuntar q ue los son idos ge­ ne rados un icarnen re a parti r de arm6ni cos elevad os no definen tan clara rnen ­ te la altura residual como aquellos que con tiene n arm 6nicos mas bajos. A unq ue la altura residual se percibe rnejor en presencia de gran can tidad de comp on entes arm6n icos, Houtgast reporto que si el con tex to lleva al suje­ to a centra r la atenc ion sobre alturas de un rango particular, aun un solo arrno­ n ico es capaz de evoca r la percepcion de una altura residual grave (Ho utgast, T., 1976). C uando la infonnaci6n sensorial se vuelve ambigua, como ocurre en presencia de ruido, esas alturas potencia les se perciben con mas facilid ad. En un expe rimen to sec uencial de Hall y Peter s, en el que tres arm6nicos sucesivos de 40 IDS de dur aci6n se presen taban separados por 10 ms de silencio, los son idos se ofan d isociados en condiciones de laborarorio (H all y Pet ers, 198 1). Pero en presenc ia de ruido la altura residual asociada, correspond iente a los arrnon icos en presen tac i6n sincron ica, se volvla perceptible. Parece ser q ue el ruido habilita la aparicion de un mecan ismo sin tetico de percepc ion de la altura.

El principia de dominaci6n De acuerdo con la teo rfa de reconocimie n to de patron es, los arrnon icos dis­ cr imin ab les de rnenor frec uenc ia son los mas import an tes para det erminar la altura tonal. En ca rnbio, para las teorlas tem porales los mas impor tantes son los de mayor frec ue nc ia. La altura residu a l se h a observado uni camente cuando los arrnon icos esta n presen tes a frecue nci as por deb ajo de 5.000 H z, region q ue coi nc ide co n la efec tividad del proce samienro de la inform acion temporal. Rit sma sugirio qu e los arrnon icos 3, 4 y 5 domi nan la sensac ion de altura tonal en la region de 100 a 400 Hz (R irsrna, R., 1967). Plom p co incid io en parte con este postulado, pero considero q ue la region no se define en cuan ro al nurn ero de armo n ico, sino qu e es funcion de la frecuencia absoluta (Plomp, R., 1967). Para alturas to na les agudas son imporran tes los prim eros arrnon i­ cos, mientras que para alturas ton ales graves cobra n import an cia los arrnon i­ cos por enc ima del quinto. 144

Evidenciadel rol de mecanismas centrales de pracesamiento Houtsma y Go ldst ein en contraron que es posible percibir alturas residuales cuando los armonicos sucesivos se presentan alternados entre los dos oidos, por ejemplo los arrnon icos pares al oido derech o y los impares al izquierdo (es­ timulos dicoti cos): este hec ho no puede explicarse confonne a los modelos que requi eren la in teracc i6n de los co mponen tes en la membran a basilar co­ mo el de Sc houten (Ho utsma y Go ldstei n, 1972) . lrnplican necesar iamen te la exis tencia de un proceso neural central. Los model os temp orales pueden , sin embargo, expl ica r el recon ocimi ento de la altura residual a partir de secuen ­ cias de disparos neuron ales en lugares de procesa mien to superiores, mas alla de la membran a basilar, en los que se enc uenr ra la informac i6n pro venie nte de los dos oidos.

A lturas tanales basodos unicamente en informaci6n temparal M iller y Taylor invest igaron la sensac i6n de altura ton al provocada por seria­ les de ruido blanco que se co nec ta n y desco nec ta n periodica men te, cuyo es­ pectro asociado no posee maxirnos ni mfnim os destacados (Mi ller y Taylor, 1948 ). Encontraron que para una frecuenc ia de conmutac ion co mprendida entre 100 y 2.000 Hz la mayorfa de los sujetos pe rcibieron una cierta altura to­ nal. Llegaron incluso a const ruir melodtas recon ocibles. Estas expe rien cias demu estran la exis te nc ia de mecan ismos te mporales en la percepcion de la altura to na l, pues los rnodelos de reconocimiento de pa­ crones no pueden dar cuenta de sus resultados. Modelo de Brian Moor e del mecan ismo par a la perce pc ion de la altura tonal en son idos complejo s La evidenci a expe rimental revela que la percepc ion de una altura tonal parti ­ cular no depende de la ac tividad local izada en un lugar especifico de la mem ­ brana basilar, 0 de la ac t ividad de un unico grupo de neuronas perifericas. Se sabe que la altura ton al indu cida po r estlmulos complejos arm6n icos es obte­ nida, en gene ral, a part ir de la int eracci6n de los arrnon icos mas alla de la fun­ damental de la serie. Por 10 tanto, es posible percibi r altu ras tonales similares proven ientes de pat ron es espec trales diferent es, que comprometen dist int os esque mas en la ac tiv idad basilar 0 neural. Para estfrnulos period icos que con­ tienen un gran rango espec trallos primeros arrnonicos, bas ta el quinto, tie n ­ den a dominar el percepto auditive . Dichos arm6n icos caen en un a zona en la que es posible discrimin arlos - resolverlos- po r separado y el proceso puede ex­ 145

plicarse sobre la base de los modelos de reco nocimien to de pa trones . S in em­ bargo , se puede pe rc ibir una altura residual aun cuando los co mpo nen tes son dem asiado altos co mo para ser discriminados por sepa rado , Este hecho no pue­ de ser explicado por los modelos de reco nocimien to de pa trones, pe ro sf po r los mod elos tempo rales. Parece q ue ningun a de las teorfas expuesta s hasta aquf puede dar cuen ta po r sf sola de l con jun to de dato s expe rirnen ta les. Brian Moore propuso un mo­ delo cualita tivo que co rnbina elemen tos tanto de la teor fa de reconoc irnien to de patro nes co mo de las teorias tem porales (Moore, B., 1997). O tros modelos, co mo los de Van N oordern (19 82), Patt erson (19 87) y Meddi s y H ewitt (199 1) tarnb ien com bin an aspec tos de las dos teorfas, aunque los algoritrnos materna­ ticos difieran sign ifica tiva rnen te en cada caso . EI mode lo de Moore (esquema­ tizado en la figura 7) co nsta de cinco etapas. La primera etapa esta definid a pa r los filtros audi tivos en la membran a ba­ silar. Respo nde n a los arrnon icos que son aprox imada men te sin usoidales en su forma y qu e pueden resolverse. La resp uesta de los filtros a los arrnon icos mas a ltos co mbina va rios de ellos po r banda critica , y no puede n discriminarse. A unque la forma de onda de salida de la etapa es co rnple ja, la rasa de repeti -

c ion corresponde a la que se enc uen tra en la en trada. A modo de eje rnplo, en la figura 8 se aprec ia la salida de diferentes filtros audit ivos an te un tren de irn­ pu lsos de 200 pulsos po r segundo. La segu nda eta pa consis te en Ia transducc ion de la salida de los filt ros an­ ter iores en impulsos nervi osos. La tercera etapa defin e un dispositi ve capaz de analizar los in tervalos en­ tre rnaximos a cada frec uenc ia central Fe (vease la figura 8). En la cuar ta etapa se comparan los in tervalos rernporales presen tes en los diferen tes cana les y se buscan los pa tron es com unes a varios de ellos, Esre cir­ cuito tam bien deb e in tegrar Ia informac i6n a traves del t iernpo. En general, el interva le temporal mas frec uen te corr espond e a la co mpo ne n te fund amental. En la quinta etap a los valo res de los in te rva los ternporales mas prcrn ine n­ tes llegan a un mecan ismo de decision qu e selecciona un o de ellos. Este cir-

Hz

6400 -ItI...- - ----t_ --

- ­

5080 -141_~--~_.--­

-----'l/j,..-­

4032 -HIH• • Entrada

acustica

banco de filtros pasabanda

3200 1-"W\J1i1ftArv----.AAflJJ.A/'tN'J""-~ 2540 -J---.AAAAiW

-

-.AJW't:Prf\!'
20 16 +--.A;f'rAJ_

-

-

1270 Transducci6n nerviosa

'
1600 +-"""p.,<""'-

­

""'-__­

f. .-- -=--.=.,-.",- _ ­

1008 +=,=..,_~~"""""'""".,,=....=......=.... 800 +="=="""'==--"=="""'==--"==­

Analisis de los intervalos entre picos

635 = = = =~ ~===== 504 4 - --

- - --

-

-

-

­

400 Combinaci6n de mtervalos con frecuenclas centrales

Selecci6n de los intervalos mas promlnentes

: : j-~-~----~-~

159 .

Tiernpo A ltu ra ton a l

Figu ra 7. Modelo esquematico para la percepci6n de la altura tona l de Brian Moore

146

Figura 8. Sim ulacion de las respuest as de la MB ante un tre n de impulses de 200 pps. Los mim eros de la izquierd a ind ican cada un a de las frecucncia s cenr rales Fe, que co rresponden a las formas de onda de salida de cada ftltro

147

cuito incorpora la memoria y la atencion, y puede ser influido tanto por los es­ tfmulos in med iata rnen te precedentes como por el co n tex te y las co nd ic ion es generales de pres entacion. La altura tonal final (sefial de sa lida del modelo) corresponde al intervale seleccionado. El modelo de Moore explica satisfactoriamente gran ca n t idad de ev iden ­ cia experimental. A co n t inuac ion mencionaremos algu na de las situac iones que logr a resol ver. • C uan do la altura residu al se obtiene a partir de un os pocas armoni cos ele­ vados (por ejemplo, el 12, 13 y 14) que no pueden resolverse por separado, resul­ ta debil y am bigua. Este hecho ex plica por que los primeros arrnon icos tienden a dominar en la percepcion de la altu ra. La altura asoc iada a los armo n icos supe­ riores se hace mas clara si aurnen ta el mim ero de armonicos presen tes. • Un pequefio grupo de armo n icos mu y altos no gen era la sensacion de al­ tur a tonal, h ech o que se puede explicar en terrninos dellimitado ran go de in­ tervalos tempor ales que pueden ser analizados por el grupo de neuron as de cada frecuencia ce n tral. Para arrnon icos por encima dellS, el intervalo temporal co­ rrespondiente a la fund am ental cae fuera del rango que puede ana lizar el can al que responde a esos armonicos (este dato es muy import ante en el modelo de Moore). • Cuando los arrnon icos superan los S kHz la estructura fin a de la forma de onda a la salida del filtr o de la primera et apa no se prese rva en el patron tem pora l de los imp ulsos ner viosos. • La altura de estfmulos qu e no presentan picas espectrales, com o el rui ­ do blan co interrumpido periodicarnente, se percibe en el mod elo a traves de los interv alos tempor ales presentes en los cana les de altas frecuen cias ce n tra­ les FC, que poseen mayores anc ho s de banda y por 10 tanto mayor defini cion tempor al (preservan la estructura temporal fina de la forma de onda) . La altu­ ra tonal de esto s est irnulos es debil. • Si se incorpo ra un mec anismo comparador central de la informacion proveniente de ambos o idos lue go de la tercera etapa, se pueden in te rpretar los fenornenos dicoticos. El modelo se parece al de Terhardt en el tratamiento de los primeros arm o­ nicos, pero este ulti mo no puede explicar la altura producida por los arrnon icos superiores no discriminables . En el modelo de Moore los sonidos de co mb ina­ cion juegan un rol en la dete rminac ion de la altura. El mas impo rtante (2ft - f2) se percibe aun a bajas sonoridades y puede actuar com o un arrno nico infe rior mas facil de d iscrimina r que algunos co mponentes del espec tro de en trada . El modelo de Moore se utiliza ac tua lrnen te en el disefio de tradu ctores de altura tonal para sistem as cod ificado s a ruimero uni co , por ejernplo para dise­ fiar conve rsores de altura tonal desde un a guitarr a al siste ma MIDI.

148

3. LA ALTURA

TONAL COMO UN MEDIO MORFOFORICO

A principios de la decad a de 1970 A ttneave y O lson esta blec iero n un nu evo crite rio qu e permite c lasificar de manera diferente los par ametres del sonido. Aunque ex isten o tros atributos par a la organ izaci6 n de los sonidos - com o el timbre, la sonoridad y la locali zaci on espacia l- s610 la altura tonal y el tiern ­ po co ns tituyen medi os ca paces de portar formas, 0 medias morfaf6ricos8 (A u­ neave y Olson, 1971) . De ac ue rdo co n los au to res, el espacio visual es un medio morfoforico: un triangulo se puede tras lada r -0 rotar- y sigue siendo el mismo tr ian gulo, su identidad se rnantiene bajo cie rtas operaciones de trans­ formaci 6n. De manera similar las estructuras ge ne radas a partir de la al tur a ton al, tales como melodias 0 funciones arm6 ni cas, pueden ser transportadas h aci a arriba 0 hacia abajo y aun ser rec on oc idas como las mismas: la infer­ mac i6n estructural que pose en resul ta in vari ante frente a los transportes en altura tonal." El tiempo tambien es un medi o morfoforico poderoso. Pero o tras dim ensiones utilizadas en rruisica (c om o la son or idad , el timbre y la 10­ calizaci6n espacial) no 10 son . Por ejernpl o , n o se logra el mismo grado de prese rvacion de la informacion est ruct ural actuan do so bre la son oridad. En el siglo xx va rias co rr ien tes musicales in te n ta ron co mpo ner pie zas a partir de esca las de sono rida d, de at aques 0 de otros param etres so no ros, pero fracasa­ ron en el in ten to de equiparar Sll ca pacida d estructural a la de la altura tonal o e l tiernpo.'? En la mism a linea, el psicol ogo cog n itiv ista Mi chael Kub ovy distingui 6 en tre atributos dispensabl.es e iruiispensabl.es (Kubovy , M ., 1981). En vision la posici on espacial es un atributo in d ispe nsa ble, mientras que el color es disp en­ sable, hecho rel acionado con su in cap acidad ana litica trente a los colores: al me zclar azul y amarillo vemos un nu evo co lor, el verde, pero no sus compo­ n entes ini ciales. En audicion la altura tonal es un atributo indispensable, m ien tras que la localizacion espacial no 10 es. La "ind ispensab ilidad" del espa­ cio en vision y de la altura tonal en aud ici6n es paralel a al hecho que ambos son atributos co rrespon d ien tes a medios morfof6ri cos. Emonces el pararnetro ana logo del espacio v isual no es el espacio aud itive, sino la altura tonal. En la figura 9 se grafican las diferencias entre atributos dispens abies e indispensables en visi6 n y en la figura 10 en aud ic ion . 8

Morphophoric medium en Ingles.

El ejemplo clasico consiste en tran sport ar un fragmento musical un cierto inrervalo, par ejemplo una quinta justa ascende nte. 10 Podemos citar aquf la pieza para piano Modes de valeurs er d'intensitis, co rnpuesta en 1949 por O livier Messiaen (1908-1992), que emplea por primera vez la recni ca serial no sola­ mente para las alturas sino tarnbien para las durac iones, los araques y las intensidades.

9

149

------------------------.....------------------ - - - ­ La 1

La 2

La 3

La 4

La 5

La 6

55 11 11

110

220

440

880

1.760

12

13

14

15

16

11x 2

12 x 2

13 x 2

14 x2

15 x 2

En la percepcic n visual el colo r es dispensable, la posicion no

Figura 9. A tri butos dispe nsables e ind ispensab les en vision

Mi l l

Escucha dos nolas: Do y Mi

Do+Mi

~

Re

Escucha dos

notas: Do y Mi

II

Figura 11. Represent aci6n logartrmica unidimensional de la altura ton al

Escucha una nota: Re

En la percepci6n auditiva la altura es indispensable, la posicion es dispens able

Figu ra 10. At riburos d ispensables e ind ispensables en audicion

4. R EPRESENTAc rON GMFICA DE LA ALTURA TONAL La representacion grafica trad icion al de la altura tonal emp lea una escala 10­ garftrnica unid imen sion al de frecuenc ias que preserva los in tervalos musicales bajo diferen tes tran sformacion es, pero no alcanza a describir las complejas re­ laciones que operan en tre los int erva los musicales. En la Figura 11 se puede ve­ rificar que las ocravas ocupan segmentos de la misma longitu d a 10 largo de l espectro audible. Lo mismo oc urre con el resto de los in tervalos.' ! Esrricrarnenre , la represent acion tradic ion al no describe alturas tonales sino las frecuen­ cias de los estlrnu los asociados. 11

150

Frecuencia (Hz)

Sin embargo, un a esca la logarit mica unid imension al no refleja el hecho de que ciertos int ervalos, como las oc tavas y las qu int as justas, poseen carac­ terfst icas especial es. C iertos estudios etnomusicologicos h asta prerenden de­ mostrar que dichos intervalos son culturalmente un iversales, pero el debate sobre el punto sigue lejos de alcanzar una con clusion defin itiva.lA mediados de l siglo XIX Drob isch con cibio un a rep resen tacion tridi­ mension al en for ma de he lice que dis tingue en tre la altura un idimension al (a la que llama pitch height) y la altura tona l (pitch crama segun Drobisch l.P En la figura 12 se puede apreciar la version de Shepard de la helice de alturas ton ales. En el esquema los son idos de cada familia tona l (po r eje mplo todos los la a distan cia de oc tava ent re sf) se hallan encolumnados: eI La5 queda mas cer­ ca de l La4 que del Mi5, d isposicion que corresponde a la proximidad segun la consonancia musical, al men os en la rruisica tonal tradicion al. Si se desea suprimir la altura tonal (croma) sin eliminar la altura unidi­ mension al (height ) 10 mas senc illo es reemplazar las sefiales arrnon lcas origina ­ les por ruido de band a angosta. En otras palabras, se remueven los elemen tos que aport an ton icidad y se dejan solarnen te los que corresponden a la altura espectral del son ido. En ese caso la helice se reduce a un solo eje vert ical, el que define la altura un idim ens ional. 11 Co mo contraeje rnplo, Un ernoto cornent a que no existe una palabra en el idio ma japo ­

nes para designar el inte rvale de octav a (Une rnoto , T., 1989 ).

13 Drobisch (1855), en Cook, P. (1999).

151

La5

-

La4

--<; rel="nofollow">-Mi5 Parcial

Do

00#

L

Re

Oesplazamiento

La Ancho de banda Sol#

Sol

Fa#

Fa

Figura 12. Helice de alturas tonales

Frecuencia (escala logaritmica)

~

Figura 13. Serial de Sheppard

En cambio, si se quiere suprimir la altura unidimensional (height) y dejar s610 la altura tonal (cmma) , es necesario generar una serial que obligue a la he­ lice a colapsar en un cfrculo como el dibujado en la base de la figura 12. Ro­ ger Sheppard public6 en 1964 un trabajo en el que describe la construcci6n de seriales capaces de suspender la percepci6n de la altura unidimensional, en las que la altura tonal parece ir hacia el agudo (0 el grave) indefinidarnente (Sheppard, R. 1964).14 Sonidos de Sheppard Los sonidos de Sheppard consisten en una gran cantidad de componentes si­ nusoidales a distancia de octava que abarcan por completo el rango de fre­ cuencias audibles, modulados en amplitud por una envoivente espectral en forma de campana que tiende a cero para altas y bajas frecuencias (Risset, J. c., 1978b). La figura 13 muestra el espectro de una serial de Sheppard. A medida que transcurre el tiempo, la frecuencia de cada parcial se va co­ rriendo hacia arriba, en una suerte de glissando en octavas paralelas, mientras que la amplitud es controlada por la envoivente en forma de campana. Nue­ vos parciales ingresan en la parte grave del espectro a medida que superan la barrera del umbral de audibilidad, a la vez que los mas agudos se reducen has­ ta desaparecer. La cantidad de parciales y la energfa de la serial son constan­ 14 Se puede hallar un paralelo visual en el grabado "Ascendiendo y descendiendo" de M. C. Escher.

152

~ Croma ~ Figura 14. Toroide que permire representar las relaciones de octava y de quinta

tes, pero se percibe un incremento continuo de la altura tonal. Los sonidos que descienden indefinidamente se obtienen de man era similar, desplazan do hacia abajo la frecuencia de los componentes. Una ilusion equivalente a la de los sonidos de Sheppard se puede obtener con el otro medio morfof6rico conocido, el tiempo. Ligeti y Risser ernp learon procesos de este tipo en varias de sus composiciones.

IS3

P er cepcion de in ter valos mu sicales

Figura 15. Helice toroida l q ue permue represen tar la altur a tonal, la a ltura (height) y las relaciones de oc tava y de quinta

Aunqu e la h elice de Sheppard de la Figura 12 pre serv a la relacion de oc­ ta va , n o registra la irnportancia que poseen los in tervalos de quinta en la rnu­ sica to nal tradi cional, El to ro ide de la figura 14 sf 10 h ace, pero p ierde la ca pac idad de grafica r la a ltura un id imensional (height). Para representar al mismo t iempo la altu ra un idimension al (height), la al­ tura to nal (cromzr) y las relaciones especiales de octava y quin ta es necesario un espacio de c inc o d imensiones. La h elice toro idal result an te serla similar a la representada en la Figu ra 15. Si ade rnas deseamos representar los in tervalos de tercer a mayor y tercer a rnenor, imprescindi bles a la hom de definir la rnod alid ad de un aco rde, la fi­ gura se complica h asta e l pun to de resu ltar imposible de d ibuja t So lamen te se pued enplantear las ec uac ione s alge bralcas que co rrespondan a cada modele .

5. A LT URA TONAL E INT ERVALQS MUSICALES Un desarrollo que in te n te exponer la co mplejidad de la percepcion de los in­ ter valos y de la gen erac ion de escalas musica les requ iere por 10 menos un li­ bro comp leto. P A qu f in tentarernos pre sentar los top icos mas re lev an tes sin aden tram os en el estud io co mp let o de los po rmeno res prop ios de la prac tica mu sical. 15 Esre libro, en este mom en ta simpl e exp resi6n de deseo, ten dr fa natu ralrnente un lugar en la co lecci6n Mus ica y Ci en c ia.

154

N oam C ho msky d istingui6 entre competence (h ab ilidad para reconocer las re­ glas que gobieman la lengua) y perfonnance (h abilidad para real izar un acto de h abla) en su teorfa de la gra rna tica y la sin taxis. Aunque tengam os alrnace n a ­ das inte rn arnente las reglas de la lengua, debido a nu est ras lirnitaciones par a proce sar y emitir sent enc ias comp lejas, muchas veces no las ap licamos correc ­ tamente al ofr 0 praduc ir frases cornpletas. Del mismo mod o, las reglas que go­ b iernan las re lac iones inte rvalicas en mu sics de ben se r con oc idas e in temal izadas (es dec ir, "n atur alizadas") por los oye ntes. Veamos algunos ca­ sos prapios de la rnusica occide ntal tradi c iona l, en la que d ichas relacion es ya han sido largarnen te n atu ralizadas. Dos son idos cuyos estimul os estan sepa rados po r un in te rva le de oc ta va suen an , en algun sen t ido , de rnanera similar. En muchas culturas se les dena­ m in a con el m ismo nornb re dentro de la esca la musical (son, por ejemplo, los son idos de la familia del Do) . Desde el pun to de vista del est irnulo , la frecuen ­ cia de la segund a sefial se ajusta a un valor ce rcano al doble de la frecue ncia de la frecuen cia de la p rimer a sefial. En otros ter rn inos , si la relac ion de fre­ cuenc ias fund arnen tales es a prox imadarnen re fz "'" 2 fl se percibe un in te rvale de ocrava, O tros in te rva los pue de n d efin irse tamb ien a pa rt ir de relac iones si­ milares. Asf, un a q uinta justa correspo nde a la relaci6n fz "'" 0 /2) f t y un a cuar­ ta justa a fz "" (4/3) fl' Las rel aciones son so lamen te ap rox irnadas pues la definicion de los intervalos depende de gran can t idad de fact or es, [a mayorfa cultura les, algun o de los cuales vere mos mas adelan te . Las relac iones an teriores, sin emba rgo , s610 se pe rc ibe n c lararnen te cuando las dos frec uenc ias se ubican por de bajo de 5 .000 H z. Exi ste gra n ca n t ida d de ev id enci a expe rimenta l q ue indica qu e los est fmulos cuyas fre­ cue nc ias fund arnenta les (l as q ue dec ide n la periodi c idad de la serial comple­ ja ) supe ran el valo r de 5.000 H z n o definen la a ltura tonal. Po r eje rnplo, una sec uen cia de so n ido s no prod uce la sensac i6n de rnelodta po r enc ima de los 5 kH z. Y los sujetos con ofdo absoluto fracasan repetid arnenre a altas frecuen­ ci as. Estos dat os son consiste n tes con el heche ya v isto de que a alrededo r de los 5 kH z carnbian los mecani smos de perc epci6n de la altura: un mecanisme temporal ac tua a baj as frec uen ci as y un mecan ismo tonot6p ico 10 h ace a altas frecuenc ias. Tan to el sentido de la altura to n al com o la sens ibilidad a la fase se pierden mas alia de los 5.000 H z. Puede ser in teresan te repasar el rango de frec uenc ias fun dame n ta les que aba rca el teclado de un pian o moderno: la frec uenc ia mas alta n o lIega a 4.200 H z (vease la Figur a 16 ).

155

Frecuencia (Hz) I

I

3729 3322 296 0 2489 22 18 1865 1661 1480

~ )86 -

1244 ,5 1108 ,7 932,3 830,6 740 622 ,3 554 ,4 466 ,2 415 ,3 370

~

~

~ ~ ~

-

3 11,1 277 ,2

~

233 ,1 207 ,7 185



155,6 138 ,6

-

116,5 103,8 92 ,5 77,8 69,3 58,3 5 1,9 46 ,3 38,9 34,7 29 ,1

lntervalos sinc r6nicos y diacr6nicos

~

~ ~

~

~

3951 3530 3 136 2794 2637 2349 2039 1976 1760 1568 1397 1318 ,5 1174,7 1046 ,5 937,8 88 0 784 698,5 659 ,3 587 ,3 523,3 493,9 44 0 392 349,2 329,6 293,7 26 1,6 246,9 220 196 174 ,6 164 ,8 146 ,8 130,8 123 ,5 110 98 87,5 82,4 73,4 65,4 61,7

Do 8 Si 7 La 7 Sol 7 Fa 7 Mi 7 Re7 Do 7 Si 6 La 6 Sol6 Fa 6 Mi 6 Re 6

Do 6 Si 5 La 5 Sol 5 Fa 5 Mi5 Re 5 Do 5 Si 4 La 4 Sol 4 Fa 4 Mi4 Re4

D0 4 Si 3 La 3 Sol 3 Fa 3 Mi 3 Re 3 Do 3 Si2 La 2 Sol2 Fa 2 Mi 2 Re2

55

D02

Si 1

La 1

49 43 ,7 41 ,2 36,7 32,7 30,9 27 ,5

Sol 1

Fa 1

Mi 1

Re 1

Do 1

Si 0

La 0

Figu ra 16. Ran go de freeuenei as fund amentales de un piano moderno

156

Los dos mecan ismos que acnia n en la percep ci6n primaria de la altura, el ton o­ rop ico y el temp oral, se man ifiestan de mane ra d iferen re si se presen tan int er­ valos sucesivos 0 diacronicos 0 int erv alos simultaneos 0 smcrorucos. C uando los estfmulos son diacr6n icos, la sucesi6n de intervalos posee ca racter melod ico. La eva luaci6n de la diferen cia de altura ent re esn mulos -el intervale diacroni­ co- puede derivar uni carnente de la evaluac ion de la distancia que existe ent re puntos de vib raci6n en la membran a basilar. S i los est frnulos son periodicos, con espectro arrnon ico, se eva lua la d istan cia ent re los dos patrones de excit a­ cion. En esros casas el mecan ismo tonotopico es el unico que pued e act ivarse porq ue, al no actuar los dos esn rnulos al mismo tiempo, no es posible el anali ­ sis tem poral sirnulran eo ent re ambos. En la figura 17 se ap rec ia un grafico tem­

pora l de las sefiales que indu cen un interv alo diacroni co de qu inta justa. ] uzgamos los interva los sucesivos casi de rna nera tactil, cornparando el pun to de maxima excitac ion del segundo esrfrnulo co n el recuerdo de l punto de ma xim a excitacion de prim ero . En este caso , el rol de la me moria de co rto terrni no resulta dererrninanre. S i ade rnas actua la mem oria de largo terrnino, hech o que oc urre en alrededor del 1% de la poblaci6n , se dice que el oyen te posee ofdo abso luro. El oldo absolwo es la habilidad de recon ocer la altu ra ro­ na l de un son ido sin co mpararla con una referencia cercana en el tiernpo, En camb io, cuando los esn rnulos se presen ran de manera sincronica , la man ifestacion simulta ne a de dos 0 mas son idos posee carac ter arm6nico. 16 La eva lua ci6n de la d iferencia de altura entre estfrnulos - el in tervale sincronico­

Mi

La

ill

:s "0

I1l

"0

'iii

c

CD

E Tiempo (ms)

Figur a 17. Se na les asocia das a un in tervale diaer6ni eo de quint a justa

16 El termino "armon ico" se emplea aquf en un sent ido arnp lio y sign ifica ocurreneia sirnul­ tanea . De rnan era similar, en el parrafo ante rior se habla de caracter melodico para descri­

bir la ocurrenc ia sucesiva. Se podrfa trazar un correlate eon las estruc turas ver tic ales y ho rizon tales en una partitura 0 en un sonogra ma.

157

!

CD

:s­ "0 C1l "0

"Vi c

2c;

V\fL"

;

I

I

Ii

~"

I

I

!

.

~

1

-j---j -

. -

j

T-I

I.-­

i_J

1

1

-

"0 C1l "0

"Vi c

_.

I

I

CD

C

~-"-I

I.

i - -;

I

1

-

~---" -~:

I

:s­ Q)

;

I

-~

I

_."- - -

I

-

-

l

I l"'

I

Figur a 19. Espectro de Fou rier asociado a un intervalo sinc r6n ico de quinta justa

ro :s­

j

"0 C1l "0

"Vi C Q)

C

Tiempo (ms)

Figu ra 18. Seriales asociadas a un int ervale sinc ron ico de quin ta justa

l

+----!~"

I

-'-

1S8

--'

--+-----+ ~ - - 1 -1 ­

-~; ~--~ -; :r;- ~-:IJ"~ ~l"_

I -

1I

'-

-1.-.1 - - -

puede deri var en este caso tanto del mecan ismo tonot o pico a n te rio r co mo del analisis temp ora l sirnultaneo de las dos sefiales. En este ultimo caso la apari­ ci on de batidos y so n idos di ferenciales pre va lece como cr ite rio de co nso na n­ c ia y co rrec ta afinac io n , al menos en la mu sica tonal occ idental. Tomem os como ejemplo un intervale sincron ico de qui nta jus t a , C a­ da vez qu e la seri al m as gra ve, un La4 d e [ = 440 H z cornplet a dos ciclos la m as aguda, un M iS d e i': 660 Hz cornpleta 3 , tal como se apr eci a e n la fi­ gur a 18. La ex ac ta coinciden cia de fase cada dos ciclos del La4 -0 tres del MiS ­ imp ide la aparic ion de batidos y d iferenc iales . EI grafico espec tral del interva ­ 10 an terior es el qu e se mu estr a en la Figura 19. iQ ue oc urre si desafina mos un poco esta q uinta justa , po r eje rnplo, au­ mentando la frec uencia del M iS ap e nas 2 H z pa ra llevarl o a 66 2 H z? A pare ­ cen n ece sari amente ba tid os de primer o rden que crece n en frecuencia a med ida qu e aumenta el orden de los arrnon icos involucrados. EI batido mas grav e se da entre el tercer armo n ico de La4 (un M i6 de [ J =

I

r I--t-a

.I"

1j -

t i - .­ " ­ -- .J- . . j: ~ : f/ j

-1I '-1-- !-

--

"

.

I

Figu ra 20 . Espect ro de Fourier asociado a un Intervale sincr6n ico de quinta justa desafinado

1.320 Hz) y el segundo arrnoni co de Mi S (otro Mi , pero es ta vez de f z = 2 x 662 Hz = 1.324 Hz) con un per fod o de batido de hi = 4 Hz. EI siguien te ocu ­ rre en t re el sexto arrn onico de La4 ([6 = 2.640 H z) y el cuarto arrnon ico de M i5 (f 4 = 2.648 H z). A h o ra el perfo do de batido es hz = 8 H z. La secuen cia continu a h asta, te oricarnen te, alca nzar el lImite del rango a ud ible. En la m usica occidental trad icion al, consonancia arrnon ica y co rrecta afi­ n aci on de acordes sign ifican m fnirno ba tido. Po r este motivo, para eva lua r los intervalos sincro n icos prev alece n los c rite rios tempor ales -que aseguran el -control de los posib les batidos- sobre los c rite rios to n oto p icos. H ay que acla­ rar q ue en la miisica de much as cu lturas el ba tido entre sonidos no es co ns i­ der ado un elemento ne gat ive 0 disonante , sino q ue se 10 integra com o part e de la text ura del sonido.

159

~ r-. --

_

r-. ':' e-------=¢--o

-

Figura 2 1. O ctav a d iacr6n ica ejecutada con un vio lin

I'7't

I'7't o e

o

del marco cultural de referencia. Dich os int entos de un iversalizar el concepto de consona nc ia son rebat idos al confr omarlos con la gran ca nt idad de len gua­ jes musicales no occ identa les en los cuales no se cump len . Incluso dentro del area de la rnusica occ iden tal misma se crearo n, a part ir de fines del siglo XIX y principios del XX, sistemas que redefinen cornpletarnen te la noc i6n tradicional de consona ncia.!" U n estudio exha ustivo del tema necesar iarnente deberfa contemp lar el desarrollo con tex tual e historico de cada len guaje musical part i­ cular. Dich o estud io no podra soslayar el ana lisis de las cornbinac iones de altu­ ras ton ales, de sus ca mpos de acc i6n y de las jerarqufas relativas que ocupan en los diferent es sistemas musicales. En o tras palabras, el estudio q ue imaginamos rendrfa que enca rar ampliamente un ana lisis escalfst ico completo de cada sis­ tema musical.

Figura 22. Oc tava sincr6ni ca ejecurada con un vio lin

U n ejernplo pract ice para dernostrar la diferen cia entre un a octava dia­ cronica y o tra sinc ronica se puede realizar con un instrurnen to de arco, por eje mplo un vio lin . Primero se toea la tercera cue rda al aire (Re4), se hace un pequefio silencio y se toea en segunda cuerda la oc tava (Re5) del son ido an ­ terior, buscando la mejo r afinac ion posible. A cont inuacion se compara esta ultima no ta con el segundo arm6n ico de la tercera cuerda (Re5 ): el Re5 en se­ gunda cuerda es casi siempre mas agudo q ue el arm6n ico. lQue ocurre? La octava diacr6nica fue afinada de acuerdo con la memo­ ria audit iva y no pud o controlarse por baudo. Par 10 gene ral se la afina un po­ co mas grande que la que corresponde a la relacion Z: 1. A su vez, la frecuencia del segundo arrnon ico, si la cuerda es de buen a calidad, es casi exac ta rnen te el doble de la frecuenc ia de la cuerda a aire. En ca mbio, si la octava an terior se interpreta sincroni camen te (un bicorde) es posible llevar el batido en tre ambos son idos a cera. En este caso la altura del Re5 en segund a cuerda y el ann6 n ico en te rcera son de la rnisma altura to nal. Co ns onancia y disonancia Los conc eptos de conso na ncia y disonanc ia son, obviarnente, cultu rales y de­ pend en del contexte h istorico, del gen ero, del estilo y hasta de las caracterfst i­ cas part iculares del compositor de cada pieza de rnusica. En muchos textos se leen frases del tip o: "cuando los son idos musicales relacionados por un a razon simple suena n sirnultanearnente el son ido es agradab le" 0 "la d isonancia puede ser explicada en parte por el bat ido entre cornpon en tes en la membrana basi­ lar", que pret end en establecer causas perceptu ales primar ias e independ ientes

160

<.; 17 Q ue alguno de los siste mas experirnen rales que apa reciero n en el siglo xx ha ya n sido ac u­ sados de "ax iom at icos", y hasta de "recnocra ricos" , no invalida la aftrmac ion ante rior.

161

Capitulo VI

TImbre

Aprendimos en nuestra etapa escolar que el sonido tiene por atributos la altu­ ra, la intensidad, la duraci6n y el timbre. El timbre se referia a cierta cualidad del sonido que nos permite reconocer los instrumentos de una orquesta 0 dis­ tinguir entre sonidos diferentes. Pero, a diferencia de la altura, de la intensi­ dad y de la duracion, el timbre no es un atriburo perceptual de descripci6n sencilla. Entendernos la percepci6n como un proceso en el que usamos la inforrna­ ci6n provista por nuestros sentidos para armar representaciones mentales del mundo que nos .rodea, Una parte irnportante en esta tarea es decidir que par­ tes de la estimulaci6n sensorial corresponden al mismo objeto 0 evento ffsico, y cuales no. La necesidad biologica del timbre tarnbien puede ser comprendi­ da desde una perspectiva evolutiva, a partir de la adapracion del sentido del oido para proporcionar informacion sobre la base de las vibraciones mecani­ cas del aire. Bregman opina que el timbre surgi6 de la necesidad de distinguir entre dos objetos auditivos cuando estes no pueden identificarse a partir de parametres simples (Bregman, A., 1994). Si un rasgo auditive se mantiene dentro de limi­ tes unidimensionales, como ocurre con la altura tonal, podemos operar hasta una cantidad maxima de cinco 0 seis elementos individuales a la vez. Para ma­ nejar simultaneamente una mayor cantidad de unidades de informacion se re­ quieren mas dimensiones y el timbre aportarfa esas dimensiones adicionales. Segun Shepard, el sistema perceptual de los animales nace con la incor­ poracion sensorial de las regularidades propias del arnbiente en el cual han evolucionado.' Por ejemplo, somos muy sensibles a ciertos aspectos del soni­ do que no se modifican durante el recorrido entre la Fuente y el oyente, como -",,-,J a altura tonal. Por el contrario, somos practicamente insensibles a las carac­ t~risticas que varian de manera aleatoria con el contexto, como la fase y la in­ 1

Shepard (1981), citado en McAdams y Bigand (1994).

163

tensidad relativa de los co mpo ne ntes en un a serial co rnpleja. De ac uerdo con esta co nce pc i6n, soste n ida por gran cantida d de in vesti gadores, los parametros "fuertes" que determin an el timbre de los son idos esta rfan rel acionados co n las ca rac te rfsticas de la serial ac ust ica qu e resisten la distorsion propi a del medi o qu e n os rodea,

1. DEFINICION ES DE T IMBRE EI primer problema qu e aparece al estud iar el concepto de timbre es la vague ­ dad y arnb iguedad del terrnino. Rep asem os las dos defini ciones mas utilizadas . 1. Una maner a clasica de definir timbre es asociando lo a las fuentes acus­ ticas de origen. En musica , los nombres de los instrurnentos se usan co mo eti­ qu et as para deno tar los t imb res, por eje rnplo "timbre de flau ta" 0 "timbre de violin". S i uno de sea comunicar la impresi6n gene ral dada por un son ido , est e met odo de nombrarlo puede ser adec uado. Las etiquetas norninales ac nia n de modo ana logo a los n om bres de los co lores: el termino "rojo" es suficien te pa­ ra ped ir un torn ate maduro en un a verdulerfa, pero result a dem asiado arnplio y vago para describir los miles de "rojos" que se usan en la indu stri a grafica. Del rnisrno modo, h abl ar d e "so n ido de flaut a" n o n os sirve para diferenciar en tr e los son idos de dos flaut as d iferentes, ni para distinguir los son idos que obt ien en dos flau tisras del mismo instrurnento . C om o eje rnplo, podem os men cionar la mut aci6n que ocurri6 co n el co nce pto de ruido blanco: en princ ip io describe un a ca racte rist ica ffsico-mat em arica de un a sefial ac ust ica de espec tro plano, pero se co nv irt io en tre los rruisicos electroac usticos en un a nu eva unidad c ul­ tura l, el "ruido blanco" co mo un timbre mas de su repertori o. Como vere mos mas ade lante, el uso del timbre a man er a de et iq ueta irn­ plic a el reconocimienro del son ido sobre la base de un esq ue ma previo en el qu e la mem oria auditiva juega un papel cent ra l. 2. La defin icion acade mica de timbre se puede encon trar, por eje rnplo, en el apartado sobre terminologta ac ustica del ASA . Es repetida hasra el ca nsanc io en rnultitud de norrn as y tex tos, y dice menos de 10 que no d ice: "ti mbre es el at ributo de la sensaci6 n auditiva en term inos del c ual un oye nte puede juzgar qu e dos son idos simil ares, co n igua l sono ridad y altura tonal, son diferenr esv.s Esta es, qui za, la defini cion menos co mpro me tida de tod a la historia de la

2 American Sta nda rds Associati on (1960) , trad ucci6 n de GB. Esta definicion es de fendida, entre otros, por Crow der, aunq ue impone una restriccion remporal que sc suma a las con­ d iciones originales (Crowder, R. G., 1989). O tros autores (Plomp, R., 1976) restringen la definic i6n a la clase de los sonidos co mplejos estaciona rios en el tie mpo.

164

acust ica. H ast a se podria dud ar de su co m petencia en ta nto definicion . Impl i­ ca, por eje rnplo, qu e los son idos a los que se le puede asigna r tim bre poseen al­ tura tonal; luego, los soni dos no t6nicos -corno los de un plat illo 0 de un tambor- , [no poseen timbre ! S6 10 nos queda n dos posib ilidades: desistimos de estudiar mas de la mitad de los sonidos que nos interesan, 0 buscam os otra de­ finicion. Como ve re mos mas adelan te , este en unc iado esta profundamente in­ fluid o por el modelo ac ustico clasico de tim bre. A de rnas, iq ue sign ifica "dos son idos sirnilares''? iAlcanza esta seme janza a la ubi caci6n espac ial, 0 a la tasa de repeticion si ex istie ra? iD ifiere el timbre de un registr o este reofon ico de una tr ornp et a si un o int ercam bia los ca na les derecho e izquierd o ? iEs d istinto el timbre de dos not as de un a flauta del t im­ bre de tr es not as del mismo instrumento ? Son dem asiadas preguntas sin res­ pue sta, y qu iza co nvenga aq uf repetir la op in ion de Bregm an sobre el punta : "Creo qu e la defin icion de timbre de la ASA deberfa ser la siguie n te: 'N o sabe­ mos c6 mo definir el ti mbre, pero no es n i la sonorida d ni la al tu ra tonal " (Bregman, A., 1994).3 Una pos ible ex p licac ion del lugar espec ial qu e oc upa n la son oridad y la alt ura tonal en la defini ci on aca dernica es q ue ambos param etres son uni di ­ mensionales y de fac tl co n tro l en los experimen tos de ac ustica y psicoacust i­ ca. Otro moti vo es sin du da ellugar preponder an te que oc up6 la alt ura tonal en las investi gaciones ac usticas a plicadas tan to a la rmisica occ iden ta l co mo a la no occ ide n ta l, al men os hasta la de cad a de 1980. Sin dud a, e l timbre es mas que un simple cata logo d e son idos 0 qu e 10 que queda de un so n ido al quitarle la sono rida d y la a ltu ra tonal. N ecesitam os, por 10 visto, un a nu eva definici6n. Se rfa co nvenien te q ue esta nue va d efini ci6n co n ternple un a descripci 6n senc illa de los eleme n tos qu e usamo s para percibir el timbre y qu e, en 10 posibl e, se rel aci one clarame nte co n las seriales ac ust i­ cas qu e 10 ca usan. H ace afios que los in vesti gadores en ac ust ica y los rruisicos electroac ust icos tr abajan para desarrollar un a co lecc ion orde na da de terrninos t fmbr icos desc ript ivos , aunq ue co n resultados in ciertos. Las definiciones tr adi cionales de timbre prcsentan o tra difl cultad . Un evento ffsico puede co m prende r mas de un a oc urrenc ia: los pasos de un a per­ son a, la llu via sob re un a cha pa, los soni dos gran ulados qu e se usan en electroa ­ custica , varios instrumentos de rnusica tocando una sec uenc ia isorritm ica, etc . Todos estos eje m plos se oye n co mo unidades acabadas pues forman part e de una representaci6n pe rcept ual co h eren te, pero no se ada pta n con faci lidad a ,~oc i6n lim it ada de sonido qu e aparece en las definic iones de t imbre. EI co n­ 3 Mich el Chion es mas sarca.stico: "[ ] 'altura, int cnsidad , duracion, timbre' equivale a 'al­ tura, peso, edad , fisonom fa genera l' [ ]" (Chion , M., 1998).

165

cep to de objew auditive , q ue ana lizaremos en detalle en el ca pitul o V[lI y qu e co mp rende la fusi6n de las diferentes ca rac te risticas de la serial de en t rada en un a (mica imagen cohe ren te, resulta mucho mas adec uado en estos casas.

recen provenir) de la misma fuen te ac ust ica y descubrir las propiedades qu e fa­ cultan la ca tego rizacion tfmbrica de los o bje tos auditivos. . En 10 qu e sigue pre sentar em os algunos de los modelos explicativos mas destacad os sabre el timbre . Al fina l de esta parte resumiremos las caracteristi ­ cas que, a nuestro jui cio, sinteti zan e l est ad o ac tual de la cuest ion.

2. EsTUDIOS Y MODELOS EXPLICATIVOS SOBRE EL TIMBRE EI mode1o clasico El timbre de un son ida es un rasgo perceptual de n aturale za diferente a la de los otras rasgos ya ana lizado s, co mo la alt ura tonal a la sono ridad. Par eje rn­ pi a , no es posib le or de na r los soni dos de menor a mayor e n un a sola di men­ si6n tfrn br ica: el timbre es, en consecuen cia, un rasgo multidimensional. Durante los iilt imos doscientos afios se estudio ca n cie rto det all e el tim­ bre de los son idos, Se reali zaron gran cantidad de est udios ex pe rime n ta les y se pr opu sie ran un a plural idad de mod elos explicati vos, tanto desde el punta de vista de la serial ac iistica co mo del de las representaciones psiqui cas de los so­ nid os. Cas i tod as las ex pe rienc ias se dedicaron al estudio del timbre en los in s­ trum entos de mu sica. En la mayor fa de los estudios el tim bre n o es co nsiderado co mo un ob je to de estud io en sf mismo, sino co mo un a ca rac te­ n sti ca perceptiva q ue perrnite ide n t ifica r un a ca tego rfa particul ar de fuen tes sono ras. Las sefiales prefer idas en los est ud ios de laborat ori o son mayoritariamen ­ te estac io na rias en el tiempo - sinusoides a combinaci ones de sinuso ides-, pues son fac iles de produc ir, de co n t ro lar y de medir. Aunque las seriales esra­ ciona rias son mu y raras e n la natu raleza, los cantos y gritos de mu ch os an ima ­ les se les pued en aprox irnar por tram os. Los son idos gene rados por algunos instrumentos de mu sica tarnb ien poseen segmentos que se pueden eq uipa ra r a o ndas estac iona rias. O tros grupos de estudio ernplean puls os de ruid o, blanco a rosa, en vez de sefia les esta cio na rias deterministas. De nuevo la elecc i6n re ­ cae sab re un artefa c to tecnicarnenre simple. Aunque los pulsos de ruid o son mas h abituales en la naturale za q ue las seriales esta c iona rias, oc urren muy ra­ rarnente en esrado puro. Como sab emos, el universo ac ust ico q ue nos rod ea es mu y co mplejo y tod o intento de sirnplificac io n implica riesgos reconocid os, Mu chos de los desvtos y desaju stes qu e aparecen ent re los mod elos acus t icos sobre el timbre y la real idad arnbie n ta l - 0 mu sical- tienen su o rigen en un a ex trapo lac i6n incorrecta de los resultad os de los expe rimentos de lab ora torio a sit uac ione s ac usticas rea les. Al margen de las h err arn ientas rnetodologicas ado pradas, la mayorfa de los mod elos y teorias sabre el timbre intentan vincular ciertos param etres de la se­ n al ac ustica ca n las co nsecuencias perceptuales asoc iadas, co mpren de r nu est ra capacidad para asigna rle un ida d a los diferentes soni dos q ue provien en (0 pa­

166

El mod elo clasico empleado pa ra exp licar el timbre -al menos en los instru­ mentos de rnusica- establecia q ue, asf co mo la frec uencia funda men tal deter ­ mina la altura percibid a y la intensid ad ffsica la sono ridad, el timbre tiene origen en la a mplitud y distribuci6n del espec tro promed io de la sefial acu sti­ ca . El modelo est ab a basa da e n la ley ac ustica de O h m, enunc iada en 184 3 , segun la c ual el o fdo es ca paz de disc riminar los arm6 n icos que co mpo n en un a sefial peri odica, pero n o pu ed e pe rc ibir las diferencias de fase entre los co m­ ponentes, En la figura 1 se pueden ver los osc ilogra mas de cu atro seriales pe­ ri6dicas can igual espec tro de potenci as y diferentes fases relativas en tre arrnonicos. S i pudierarnos ofrlas n o e nco n trarfarnos diferenci as aprec iables. De mod o mas pre ci so, la ley ac ustica de O hm esta blece qu e un oye nte no puede d isti ng ui r en t re dos sefia les can la m isma distribucion de frec ue n­ cias y a mplit udes en los a rmo n icos, pero can un a di stribuci6n de fases di fe­ rente . En est e modelo el timbre depende unicarnente del espec tro de potencias de la o n da , q ue es s610 un a parte del ana lisis co mp lete de Fourier (Ba sso , G., 200 1a) . Segun la tradi cion, el defensor mas dest acad o del modelo clasico fue H er ­ man von Helmholtz. S in emba rgo, H elmholtz tuvo la precauci6n de limitar su alcance a las sefia les est acion ari as: "Ciertas ca rac te rfsticas particulares de los sonidos de va rios instrumentos dep enden del mod o que co m ienzan y cesa n [Oo .J", de man era q ue estudi6 sola mente "[...] las pec uliarida des de los son ido s mus icale s que co n tiruia n un iforrn ernente"." Los seguido res del model a -easi todos los ffsicos, ac usticos y rmisicos hasta bien e n trada la dec ad a de 1960-, n o tuvieron la prud encia de Helmholtz y procl am aron resuelto el asun to.l A 10 sum o , reconoclan qu e la teorf a es ta ba limitad a a las ondas estacionarias pe­ riodicas qu e, seg iin ellos, co mpo n fan la mayor parte de las sefiales de los in s­ trumentos de mu sica. " <, .............~

4 Helmholtz, H. von (1885-1954). Trad. de GB. s S in int enci on de agota r la lisra, esra posicion se puede ver reflejada en los trabajos de Ray­ leigh (1945), C ulve r (1947), Olson (1952) , Benade (1960) , Berane k (1962), Backus (1969), Feyman (197 1) y Sundbe rg (199 1).

167

,

'}I)~ AJL'~,Y\r.

Tiern po

b)

ILL

o

OT' --,.-~---,--,

Flauta

UillJ

-20

co

~ -20 "0

.-E

-40

0.

E

<{

I

I

I



Frecuencia

Figura 1. a) Oscilogramas de cuatro sena tes periodicas con igual espectro de potencias y d iferentes fases relat ivas: b) espect ro de potencias de las senal es anteriores

2

3

4

0

Frecuencia (kHZ)

Llevar esta teorfa a la realidad no fue tarea simple. Se sabla desde princi­ pios del siglo XX que los espectros de los son idos varian en el tiernpo, asf que la pregunta central fue: lc ual de tod os los espec tros sucesivos de bia to rnarse para determinar el tim bre del son ido? La respuesta la dio H all en 1937 al es­ tablecer que se deb fan pro med iar temporalm ente los espec tros, y que el resul­ tad o de este promedi o era e l responsable del tirnbre .? Un eje rnplo repr esentative de estud io experime n ta l basado en el modelo clasico se puede aprec iar en la Figura 2. Si el timbre es co nsec uenc ia de la distr ibuci6n de los armonicos 0, ex­ puesto de otra manera, de la forma de onda estac ionaria, una serial cuya for­ ma se mantiene no deber fa sufrir modifi caciones t fmbricas. Pero un o de los experimen tos acusricos mas simples contradi ce esta afirrnac ion .? La fo rma de onda de un a sin usoide no ca mbia a l cambia r su frecuenc ia, pero si se genera un glissando que recorra buena parte del tan go audi ble poc as personas d iran q ue el timbre perrnan ece inmutabl e. En realid ad, a bajas frecuen cias la sin u­ soide suena bland a y oscura, mientras q ue a altas frec uencias parece dur a y br i­ llante." [La sin usoide, el "ladrillo" con el que se pret end fa construir el edificio del timbre poseia, a su vez, un timbre particul ar! 0 peor aun, mutaba de t im­

Hall (1937) , en Cook, P. (1999). El experimento fue realizado por primera vez por Kohl er en 1915 (Risser y Wessel, 1999). 8 Q ue en un texto sobre el timbre esternos usand o palabras como "duro", "oscuro" 0 "bri­ llant e", romadas en presramo de otros sent idos, demuesrra 10 lejos que esta rnos de rener re­ suelro el asunto . 6 7

168

Figura 2. Espect ros de son idos de diferentes instrurnen tos segun Wedln y Goude (Hande l, S, 1995)

bre a medid a que ca mbiaba de frecue ncia. La conclusion del expe rimento es ca teg6 rica: no ex iste una relaci6n uno a uno entre forma de o nda y timbre. U no de los pilares del modelo clasico se desrnoro naba. Otra cuest i6n que gener6 un intenso de bate fue la de la invariancia del timbre ante un cambio de frecuencia. Para que el timb re no varie, ldeb en con ­ servarse las relacione s de amplitud entre arm6n icos para preservar la forma de onda escalada, 0 de ben conservarse las posicion es absolutas de la envoi vente temporal? El modelo clasico sosten ia clararnen te la prime ra opcion. En un ce­ lebre trabajo, S lawson demostr6 que el model o tarnbi en fracasaba en ese pun ­ to (S lawson, W., 1968 ). En la Figura 3 se pueden ver las dos opciones. Los oyen tes juzgaron que la alte rna t iva 1 co nserv a mejor el ti mbre que la alter na ­ tiva 2 -defend ida por el modelo clasico, Durante el ana 1926, en plena auge de la teorla clasica, Me tfessel public6 un artlculo en el que ponia en duda la simplista propos ici6n "forma de on da es­ tacionaria igual timbre" (Butler, D., 1992). La inve rsi6n temporal de una serial de aud io -posible desde la aparicion del registro magne tico durante la segun da .~rra mundial- , en la que se mantiene sin carnbi os el espectro de potenc ias pro medio pero se alteran las fases relativas, de mostr6 que hab ra alga mas que distribuci6n espec tral en el te rna del t imbre (cualquie ra puede co mproba r el cam bio d rarnat ico que se oye al invertir temporalmente un registro de pian o, por ejemplo mediante el uso de software de aud io en una corn putado ra) . 169

a)

1

2

5

4

3

6

7

· .....1 I..,I.

-0

eo

1 ••

-0

'iii

c

8

9

I

Espectro original

r-- ..'l

OJ

C

dos y para prede cir 0 crear otros n un ca experimentados. Dur ante el siglo pa­ sado se pot encio la necesi dad de aplicar las nuevas recnologias a la construe­ cion y a la sirnulacion de instrumentos m usicales. La llegada de la energia electric a prime ro, del control electr6nico desp ues y, por ulti mo, de la sintesis digital, perm iti6 gradualmen te la construcci6n de sonidos a partir de la des­ crip c ion ffsica de las sefiales asoc iadas a tales sonidos. El mayor esfuerzo tee­ no logico se apoy6 en los tratados de acust ica qu e repetlan, obv iamen te, el modelo clasico . En la mayo rla de los casos el producto de la sin tesis instru ­ mental se parecfa muy poco al instru men to origina l. Los son idos resulraban apagad os, carentes de identidad y de interes.? La conclusion fue entonces evi ­ dente : la descri pci 6n ffsica de la cau sa del t imbre era in adecuada, pues fallaba en el dec isivo test de la sintes is aciistica. Este fracaso pued e describirse como un a auten t ica "catastrofe del t imbre" de la ac ust ica del siglo xx. El modelo cla­ sica debta ser reemplazado par otro.

10 Numero de arm6ni co

1

"' j . . .

Frecuencia (Hz) b)

2

3

co

-0

'iii

5

4

I .

-0

Nurnero de arm6nico

I Alterna tiva 1

c

I

OJ

Conservaci6n de las tor-nantes espe ctrates

.'. I

C

.' ··1···... Frecuencia (Hz) c)

~

l

1

234567

I .... ~ ... '1

1 . . . . ' .

I

*.~:..r.' r,'. _. 1'. '. ~

~ ~

"

#

-.» '

'\ '



~ ..

Altirnativa

8

Anal isis multidimensional

~

d~."""?"

Conservac ion de la

.I-. --.1....· r····· estructura

Frecuencia (Hz)

Figura 3. Experimento de Slawson sobre la invar ianc ia del t imbre ante un ca mbio de frecuencia, a) espectro or iginal, b) alterna t iva 1: frecu encias fijas 0 conservaci6n de las formames espectrales: c ) alt ern ativ a 2: frecuencias relativas 0 conservaci6n de la estruct ura de arm6n icos

lPor q ue contin uam os reconoc iendo la fuente acustica al o ir musica en una pequefia rad io , 0 cua ndo o frnos un instrumen to en una sala con una res­ puesta en frec uencia irregu lar ? En ambos casos el espectro de potencias origi­ na l se alte ra profunda mente y tarnbien deberta a lterarse, de acuerdo co n el modelo clasico, el timbre que per cibim os. H emos exa minado va rias de las dificultades que encontro la reorl a clasi­ ca del timbre desde su en unc iac ion a med iados del siglo XIX . Aunque no daba cue n ta de nume rosos he ch os, segula siendo considerada correcta por la mayo­ ria de los especialist as, qu ien es supo n ian que solamente restaba realizar algu­ nos ajustes. Esta sit uaci on se mantuvo ha sta la decada de 1960, cuand o la aparicion de la sintesis acust ica por cornp uta do ra ter rninarfa definitivarnente con el modele . Como sabernos, un modelo sirve para explicar hechos cono ci ­ 170

--

La falla principal del mod elo clasico fue, sin dud a, que en su form ulaci6n sos­ layaba compl etamente la importancia d e los fac tores temporales. Hel mho ltz ya habta sospecha do que el ataque y la extincion de c ierto s son idos co n renia n informacion relevante para la det erm inacion de l t imbre. Y resultaba eviden re que la co rrespondenc ia en tre los datos ffsicos y los rasgos pe rcibidos no era simple y line al co mo, por ejernp lo, en la relac i6n frecu enc ia-altura. Para no repetir el erro r comet ida dur an te el apogeo de la teo ria clasica, en el q ue se inten to imponer un concepto ffsico para explicar la perc epci6n , dur ante la dec ada de 1960 se idearon y realizaro n gran can t idad de expe rien­ cias psicoaciisticas. Las motivaban la necesid ad de encontrar los datos fisicos empleados efectivamen te en la percepci6n del timbre, comprender la estruc­ tur a de las rep rescntaciones pslquicas de l t imbr e de un son ida y hallar un a co­ rr espondencia en tre datos fisicos y representaci one s mentales . Aunq ue par ece habe r un a gran ca ntidad de maneras de describir la form a en qu e un son ido se dis ting ue de otro , la psicoacust ica necesita encon trar las mas sencillas para simplificar el problema . Es in teresan te aqui comparar el es­ tudio de l t imbr e can el del co lor. Un co lor esta determinado ffsicamente par un espectro de luz carac reristic o. Exisren infinid ad de espectros posibles y po­ dem os percibir miles de co lores, Sin embargo, tod os los colores pueden desert ­ birse can s610 tres dimensiones: dos de ellas define n la cro ma t icidad y la otr a Algunos de estos instrumen tos, sin embargo, lograron irnponerse como generadores de timbr es a rigina les y novedosos. Tal es el caso del organa Hammond.

9

171

\'

c l brillo . iEs pos ible desc rib ir las difer enc ias de t im bre en tr e los son idos a par­ tir de un ruirn e ro peque fio de dimensiones, c om o oc urre co n e l color? Para responder a esta preg un ta se emplea el metoda del analisis multidim ensional, me­ di ante el cu al se procesan esta d fst ica rnen te los .I uicios de los o yen tes sobre e l grado de sim ilit ud entre dos sonidos elegidos de un conjunto restringid o . La hipot esis de trab ajo del metodo afirrna q ue ex iste un numero lirnitado de di­ mension es ca paces de desc ribir la total idad de los timbres pos ibles. S i dos so­ n idos tiene n un va lor ce rca no en una d imens ion , so n sim ila res e n esa dimens ion aunq ue no 10 sea n en las o t ras. Bregman 10 ex p lica de la siguien te rnan era: "C uan do co menza mos a pensar en las similitudes en t re cosas, inrn e­ dia ta rnen te nos dam os c uen ta que un a cos a puede parece rse a o tra de man e­ ras di feren tes , Una pe lo ta se parece a algun os jugue tes e n su redondez, a o tros e n su co lo r roj o, a o tros en su ta rnafio , [...] el hecho de q ue a lgo pued a pa re­ ce rse a o tras cosas de diferen te s maner as lle va n at ura lmente a la idea de la ex iste nc ia de dimensiones de sirnilit ud'U '' A co n t in uac io n describiremos tre s destacados estud ios de ana lisis mu lti ­ dimen siona l sobre el timbre.

ESttldios de Plomp. En 1967 Re ini er Plomp descubrio q ue las d iferenc ias t im­ br icas se corre lacionaban bien co n dife renc ias en el espectro cua ndo se cons i­ deraba n los ni veles de 18 ban das de te rc io de oc tava, ape nas mayo res que las bandas cr iticas. Dicho de otra forma, el ti mb re se re lac ionaria con e l pat ron espectral de excitacion de l son ido . Como h ay 37 bandas c rfticas cub riendo to­ do el rango aud ible habrta qu e co n side ra r o tras tantas dimensiones. Para co­ rrobora r estas co nje turas decidi6 realiza r un est ud io sistem at ico. Los primeros tr ab ajos de evaluacion mult idimensional fueron realizados ent re 1960 y 1976 (Plo rnp, R. , 1967, 1976). Ernpleo co mo datos de partida so n idos de violin, viola, vio lo ncello , oboe, c la rine te, fago t, trornpe ta, co mo frances y trombon, De term ino qu e los ju ic ios so bre di ferencias entre los so n idos podfan reso lver ­ se co n solo tres dimensiones perceptua les. En un a segunda e ta pa in rento det ecr ar la clase de in for macio n acu stica usad a para det errninar el timbre. Analizo ffsicamenre las sefia les de los instru­ rnentos filt rando las e n 15 bandas de terc io de oc rava, siguiendo a prox irnada­ mente la distribucion de las bandas c riticas e n el oldo . A partir de la co nje tura de q ue las 15 bandas no e ran totalmenre independ ientes un as de otras , redu ­ .1 0 tod a la in formacion espec t ra l a cua tro dirnensiones basicas, La int enci6 n de Plomp era rot ar y aco mo da r estas c ua tro dimens iones fisicas para ajusta rlas a las tres dimen sion es percep t ua les derivad as del analisis de di fer en cias en tim­ 10 Bregman, A. (1994) . Trad . de OB.

172

bre. La h ipotesis principal esta blecia q ue los oye ntes ernplean la corr elacion entre diferenc ias espect rales para per ci bir el timbre de los so n idos . Aunque Plornp permite la apa rici6 n de nu evas dirnensiones perceptuales en cases par ­ ticulares (po r eje rnplo, la "tasa de rui do" es dec isiva para evaluar e l so n ido de un cascabel) , sugiere qu e siernpre se reducen en ultima ins ta nc ia a no mas de tres. Simplern ente, cada son ido pol ari za e l ca mpo perceptua l de ac ue rdo a sus carac teri sti cas particulares. Aunque e l mod e le de Plornp introduce e l a na lisis mul tidimensional en el esrudio de la percep c ion del timbre, sigue fie l a l mod elo espectra l cs rarico de la reo ria c lasica . Quiza por eso su rnejor resulrad o se h a ob ren ido con so n idos cuyo c ue rpo es mu y es ta ble e n e l tiernpo , co mo 10 so n los qu e ge ne ran los tu ­ bos de o rgano. En la Figura 4 se aprecia un d iagrama bid ime nsio na l e n el que se comparan los jui cios so bre los so n idos de los t ubos reales co n sus sirnulac io­ nes esp ectrales. La d im en sion vert ica l desc ribe la ca nt ida d de arrn on icos supe­ riore s (d e men or a ma yo r ca n tida d), rnie n t ras qu e la horizon tal es produ ct o de una com binacion co rnpleja de pr opi ed ad es espec t ra les . Una de las criticas mas irnport antcs que se le h an h echo a este tip o de ana­ lisis es q ue de pende fue rte me nte de l co nj unto de sonidos eleg idos. En cie rta me­ d ida , para cada co nj unto de datos se obt ienen resultados d iferentes, A dern as, las

o o---b. Trompela

L;,

Organa Sintetizadar

Regal

~ F" "

' Diapas6n 4'

LengOe1as

J?

s

~

f:/alJla s

Q~JD iapaS6 n

8' .



Diapason ~

G ed aC~

Octava 2'

Waldftule

------

~

Rohrtlute

Figura 4. Repr esen tacion bidimen siona l de l timbre de sonidos de organa (cfrculos) versus son idos de orga na sin retizados (triangu los) (R asch y Plomp, 1999 )

173

diteren cias en el timbre "esta tico" de Plomp no son sufic ien tes para definir un objeto audi tivo, en part e porque la serial acust ica puede ser alterada espect ral­ mente par las reflexiones en una sala. En la epoca de los trabajos citados se sa­ bia que el reconocimien to de los instr umentos musicales, pa r ejernplo, depende ca n fuerza del at aque y de la estructura temporal de la en voiven te d inarnica del son ido.!' S in embargo, Plomp no incorp or6 factores ternporales en su modelo.

Especlro

angoslo

1 ~

u Q)

0.

Y

if)

Q)

c

-0

'(3

Modelo de GTe )!_ Entre 197 5 y 1979 John Grey realiz6 una serie de experien ­ cias tendientes a construir un espacio ti mb rico vecto rial , sim ilar al que se em­ plea para describir los co lo res. En la primera de elias ernpleo di ec iseis son idos de la misma altura, intensidad y duraci6n , pro ven ientes de 12 instr umentos t6nicos (es decir, de al tu ra to nal defini da ). Digitalize las seriales, las simplifi­ c6 reempl azando las m icrovariaciones temporales pa r secciones rectilineas, y se las presen t6 de a pares a ve in te oyen tes. Los suj etos deb ian cuantificar la si­ militud en tre los son idos de cada pa r medi ante el usa de un a esca la grad uada de uno a trein ta. Grey interpret o qu e las dista ncias psicol6gicas se pod ian co ­ rrelacionar negativamente ca n las sim ilitudes per ci bidas. En otras palabras, a menor similitud, mayor dista nc ia timbr ica. Los result ados de est a experienc ia fueron graficados en el espacio vec torial tridimension al de la figura 5. Cada dimen sion , aunque obten ida par ana lisis multidimen sional , representa los atribu tos ffsicos que Grey consider6 mejor apa reados con las respuest as per­ ceptuales obten idas (Grey, J., 1975) . La d imensi6n vertica l (Y) repr esen ta la distribuci6n de la en ergia en los parciales arm6 n icos de la serial. Se trata princ ipalmente de una dimensi6n es­ pectral. Se puede pensar en ella co mo repr esentando el grado de "brillo" del so­ nid o, y en los analisis trad icio nales queda defin ida par la envolvente espectra l. La dim ensi 6n horizontal (X) repres enta en parte el grado de fluctuacion de la env olvent e espectral dur ante el desarrollo del son ida y en parte el grado de sin ­ cron ismo en el ataq ue de los diferentes arrnon icos, Es una dimensi6n espectro­ temporal, den ominada "flujo espectral" por Krumhan sl (McAda ms y Bigand , 1994 ). Permite distinguir entre sonidos de evolu ci6n esta t ica y sonidos de ev a­ luci6n dina rnica. La tercera dimensi6n (Z) repres enta la presencia de vibracio­ nes inarm 6nicas prev ias a la parte arm6n ica pr incipal del son ido. Se pued e hablar de una "calidad de ataque" y es esenc ialmen te una dimensi6n temporal. En una pub licaci6n de 1977 , Grey ilustr6 dos de las proyecc iones bidi ­ mensionales de su espac io tridimens ional con los d iagramas tiemp o-energia­ frecu en cia (TEF) de las sefiales de los instrumen tos (figura 6). clasico en esa epoca consistfa en invert ir cernporalmerue un regisrro de audio: la en volvente espectr al promedio no cam bia, pero el tim bre sf 10 hace. 11 EI ejemplo

174

:J

'C

.~

y

o

Especlro ancho

r

_ .

( -(

/ u 7L

fr.7/

~ Jncrcnlco

-

'. ~' :z:tt

I

1r. ?1-

I.:::=J L:..':l

\

'-=-'

\

s

z


\

\\

-

Desplazami ento del ataqu e

Q)

&

r>: ----X

Tran sitorios de alta Irecuencia

i

.c

Asincr6nico

Sin transttorio s de alta frecuencia

Figura 5. Representacion tridimension al de similitudes rfmbricas. O boes (01 , 02 ); como Ingles (EH) ; fagot (BN) ; clarinete alto en Mib (C l ): clari net e bajo en Sib (C 2); saxof6n alto mf (Xl ), saxof6n alto p (X2) ; saxof6n soprano en Sib (X3); flaura (FL); trompe ta (T P); co mo frances (FH) ; trombon con sordina (T M), violoncello sui ponticello (51), normal (5 2) y sui wsw (5 3) (Gr ey, ).,1 975 )

~ ~Q" ~

_

u

'" 0

C

0 '

\ '\

Q.l

n

~,~ tt l L @

~@ t" '@~ ~,, ' ~.c~~ . ~ ~

l

~

~~

"

-.

' 0 01 •

@

,

Sincro nicos

Parciales Dimension 2 Asincroni ccs

i

w

~1 ~

~

~

iii ~:J

'~

«

~

«

Figura 6. Ejempl o de una pro yeccion bidime nsion al del espacio de tim bres (los instrurnenr os son los rnisrnos de la figura 5) (Gre y,[ ., 1977)

175

"\

Las conclusiones que el autor extrajo de este estudio, y de otros similares, fueron muy valiosas. En primer lugar, constato que la representacion mental del conjunto de timbres es relativamente estable y mas 0 menos identica en­ tre un sujeto y otro. Se comprob6 que un cambio en una dimensi6n ffsica par­ ticular (por ejernplo en la envolvente espectral) provocaba un desplazamiento en la dimension perceptiva correspondiente ("brillo" en este caso ). En ciertas ocasiones se producian tambien desplazamientos en otras dimensiones. Quiza la conclusion mas controvert ida este relacionada con la continuidad de las transiciones timbricas: "No hay fronteras perceptuales marcadas en la identi­ ficaci6n entre dos sonidos interpolados [...] la ausencia de llmites abruptos y la sensibilidad al contexte sugiere que, definidas estrictamente, las transicio­ nes no se perciben categorialmente'l.U De acuerdo con las experiencias de Grey, es probable que existan distin­ tas estrategias perceptuales asociadas a la discriminaci6n tirnbrica, que se ac­ tivan en funcion de la caracteristica particular mas pronunciada -temporal 0 espectral- del sonido en cuestion. Quiza estas diferencias en las respuestas es­ ten fundamentadas en la polarizaci6n de la atencion hacia 10 que los oyentes seleccionan, en un proceso preconsciente, como la caracteristica tlmbrica dis­ tintiva en cada caso. Se puede poner en duda la hip6tesis de Grey segiin la cual sonidos extre­ madamente complejos no difieren entre sf mas que en ciertas dimensiones subyacentes comunes. Es posible que algunos timbres pose an caracterfsticas unicas no codificables en dimensiones continuas. Un buen ejernplo se en­ cuentra en la preeminencia de arrnonicos impares en el clarinete, que contri­ buye a su identificacion mas que otros datos aciisticos espedficos como la envolvente de arnplitud. En cambio, en los sonidos en los que la envoivente de arnplitud posee caracteristicas destacadas, como en el tromb6n 0 la flauta, esta prima en la identificacion por sobre la estructura arrnonica. Con todo, la mas profunda de las objeciones a los modelos basados en es­ pacios vectoriales ataca directamente su naturaleza: un espacio vectorial es esencialmente lineal. Sabemos, sin embargo, que en la percepci6n del timbre ocurren grandes saltos y bifurcaciones marcadamente alineales. Un modelo como el de Grey quiza sirva solarnente para describir regiones timbricas aco­ tadas, con comportamientos lineales locales, ocupadas por sonidos de caracte­ rtsticas afines. Estudios de Iverson)' Krumhansl. Iverson y Krumhansl analizaron la percepcion del timbre empleando sonidos de instrumentos musicales tonicos en tres con­ t1

Grey,

176

J

(1977). Trad. de

GG.

diciones diferentes: senales cornpletas, solo los primeros milisegundos de las sen81es (ataques) y sefiales cornpletas menos los ataques (es decir, el cuerpo y la extincion) (Iverson y Krumhansl, 1993). Como en el estudio de Grey, los sujetos juzgaron la similitud de cada par de instrumentos tomados de un total de 16. Los juicios de similitud fueron notablernente consistentes en las tres condiciones impuestas. Los autores graficaron parte de los resultados en el es­ pacio bidimensional de la figura 7. La dimension perceptual horizontal esta relacionada con las diferentes envolventes de amplitud. Los instrurnentos de ataque rapido, como los de per­ cusion, se encuentran a la izquierda, mientras que los de ataque gradual, como los de viento, a la derecha. La dimension vertical esta asociada con la envol­ vente espectral (el brillo aumenta hacia arriba). Iverson y Krumhansl sostie­ nen que los oyentes basan sus juicios en las propiedades acusticas que se encuentran en la totalidad del desarrollo del sonido. El proceso fisico de ge­ neracion vincula fuertemente las diferentes partes entre sf. El ataque, el cuer-

i~

O ,~taqu es

I

'D TonGssin att:i ques

Frecuencia

Perfil espect ral mas ancho

I

~o

JIM '0' o 't:

rf

M

& ~ ~

Perfil espectral

mas angosto

r:

®L21

Frecuencia

Envolvente de amplitud

to] Tiempo

+ Subito

I

~'E E:] 1'1 2

4:

.,

Tiempo

Tiempo de ataque

I~ Tiernpo

• + Lento

Figura 7. Representaci6n bidimensional de similitudes tfmbricas. Comparaci6n entre ataques aislados (cfrculos) y sonido sin los ataques (triangulos): fagot (1); violoncello (2); clarinere (3); como ingle, (4); flauta (5); como frances (6); oboe (7); piano (8); saxof6n (9); tromb6n (10); trornpcta (11); trompeta con sordina (12); tuba (13); carnpana tubular (14); vibrafono (15) y violfn (16)

177

po y la ex t incion son inte rdependientes y n o se co ntrad icen . Este argumento explicarfa la causa por la cual co n solo un a part e del son ido - el ataque 0 el cuerpo , segun el caso- pode mos iden tifica r su tim bre. O tra conclusion der iva­ da de este estudio estab lece que los datos que usam os para percib ir el timb re depe nd en del context e . La repre sentacion psfquica resultante es func ion tan ­ to de la durac ion, in tens idad y envolve nte espectral de la sefia l acust ica, co­ mo de l ban co de son idos almace na dos en la memori a del sujeto , su estado de atencion y su experien cia previa. En este punto, los auto res declaran la proba­ ble inexistencia de invariantes aciisticas subyac en tes en la percepcion del tim ­ bre de los son idos,

Conclusiones sol:rre los modelos multidimensionales. A pesar de la gran ca ntidad de inform acion que aportaro n hasta la fecha, los inrent os tendient es a encon­ trar un mimero redu cido de dimension es no han llegado a result ados conclu­ yentes. N inguno de ellos dern ostro que las d imen sion es sugeridas son co rnple ta mente adec uadas, aun de n tro de un un iverso restringido de estimu­ los. Nu estr a objec ion al modelo de G rey puede ex tenderse, en menor 0 mayor medid a, al resto de los estudios sobre el timbre basados en el analisis multid i­ mension al.

ta y baja frecuenc ia, y se parece al "bri llo" presente en casi todos los estudios sobre t imbre. La segunda di mension en import anci a -"compacto- d isperso"­ perrnire separar los son idos to nicos del ruid o. En esta experie ncia , como en to­ das las de su clase, el resultado es muy sensibl e a la selecci on inicial de son idos. Pa r ejemplo, la dimension "cornpacto-disperso" no hubiera apa recido si no se inclu ian pulsos de ruido entre los esti mulos de partida. O rra posibilidad de ace rca miento verba l al timbre la dan las "ex perie nc ias de campo", en las que simplerne n te se recopil an y clasifican los terrninos que las perso nas -rnusicos 0 no musicos, segun el caso-, usan para describir los so ­ nidos. Aquf la dificult ad est a dada por la mu lti plicidad de un iverses lin guist i­ cos exis te ntes, aun de ntro de un a misma comun idad. Los mejores trabajos son los que restringe n las muestras a un uni verso mu y aco tado . Dos buen os ejern­ plos son los tra bajos de Kend all y Ca rtarette , en los que analizan los terrninos que apa recen en el tra bajo de Von Bismark citado y en el trat ado de orqu es­ tacion de Wal ter Piston (Kenda ll y Cartarette, 1993). EI fin prac tice mas sig­ nificari vo de esra clase de estudios es obtene r un diccionario de terrninos que, al alimentar uri siste ma basado en una red ne ural, perrn ita que los rru i sicos controlen de man era verbal ciert os programas de sinresis pa r co rnputado ra. Mod elos de analisis por sfntesis

Modelos verbales Desde un a perspect iva d istinta, Von Bismark int ent o reducir el mime ro de va ­ riables necesarias para de term inar el timbre a parti r de la verb alizacion de las percepciones (Bisma rk, G., 1974 ). Q ue es, de heche, 10 que hacemos habitu al­ mente cuando tratamos de descri bir un son ido en un a co nve rsaci6 n. Se lecc io­ no 35 son idos diferentes y le pidio a los oventes que los califiqu en, con un valor de 1 a 7, con relaci on a 30 cualidades 0 dimensione s d iferentes, Cada dimen­ sion se defin io a partir de una parej a de adjet ivos contrarios com o "duro-blan­ do", "seco-vivo", "opaco-brillante" y asf hasta llegar a las 30 inclu idas en el estud io. Los son idos prove n lan de genera do res de sefiales periodicas co mplejas, co n un ruirnero variable de armo n icos, y de pulsos de ruid o rosa. Se hac ian pa ­ sar a traves de filtros que los modifi caban de acuerdo co n determinadas envoi ­ ventes espec trales, entre las que figuraban las correspondientes a las voca les en idiom a aleman. Aplicando el met odo de selecc i6n de co mpone ntes princ ipa­ les, el auto r reduj o las 30 dime nsiones verba les origina les a cuat ro d imensiones perceptuales. Las dos d imensiones mas destacadas represen taban los pares "punzante-apagado" y "compacto-disperso". La d imension mas importante -definida por el par "punzante-apagado"- se relacion o co n el ce ntro de grave­ dad del espectro de la sefial, que depen de de la relacion ent re la ene rgfa de ai­

178

EI ti mbre de los sonidos tarnbien se puede estudiar des de un a perspectiva to­ talrn en te diferenre, que parte de la produccion antes que del analisis. La idea cen tr al co nsiste en el desarrollo de modelos de sin te sis qu e perrn itan gen erar son idos sinte t icos indi stinguibles de los soni dos "na turales" que se desea n irnitar. S i ambos so n idos, el sinte tico y el or igina l, se ove n exactame nte igua­ les, en ron ces la descripc ion acus tica del son ido - adoptada para elaborar el mod elo- es acertada. EI metodo se denomina ancilisis POl' sfnresis . Jean C lau ­ de Risse r ilust ra el proce so en un diag rams sim ilar al de la Figura 8 (Ri sset y Wessel, 1999). Quiza un ejernplo ce lebre sirva para aclarar el procedimiento usual en es­ ta clase de inve st igaciones. En la decada de 1960 R isser y Max Mathews in ­ te ntaron, sin exi to , imitar los soni dos de los instru mentos de bro nce. La teorfa \ clasica - con sus espectros estati cos- fallaba comp leta men te, y el intento p'or \ dot ar a las sefiales de un co mporta mle nto tem poral senClllo - compuesto por un ataq ue , un cuerpo y un a ex tinc i6n- tamp oco mejoraba mucho los resulta­ dos (R isset y Math ews, 1969). Para destrabar la cuest ion , registraron magne­ ticamente el sonido de una trompet a real ejec utada por un profesional. La grabac ion fue realizada mediante el metodo de anal isis sincronico de alt ura en un a camara anecoica -con un tiempo de reverberaci6n muy bajo- para elimi­

179

0'"

2

~t"

~:'I>

60

C0Q.

' 'o~

,/>",

~~


CD

~

U t1l

;Q

~ 30

2

c

o

100

50

150

Tiernpo (ms )

Figura 9. Resulrado del ana lisis sinc ron ico de altu ra del son ido de un a tro rnpera (Basso, G .,200 1a)

2

Figura 8. Diagrama conceprual del proceso de aua lisis par sfnresis 60

iii' ~

na r los efectos aciist icos propi os de un a sala normal. El ana lisis sincron ico pre­ supon e qu e la serial es cuasi-pe riodica y de scribe el desa rro llo de cada arrno n i­ co individual en el t iernp o. El resultad o de un ana lisis de esta cl ase se mue st ra en la figura 9. A partir de este an alisis del sonido or igina l, los autores sirnularo n la serial simplifica n dola de dos rnane ras: elirnina ron las fluctuacion es de alta frecuen­ c ia y aprox imaro n las curvas po r trarnos lin eales. La sena l sin tet izada que do co mo la que se ve en la Figura 10. Las dos sefiales resu ltaron ind ist ingu ibles cu ando se las co rnparo a ud it iva­ mente. Las simplificacion cs, por 10 ta nto , n o afect aron los datos relevan tes presentes en el sonido origina l. Au nq ue el mode lo er a simp le, para la epoca resul taba m uy costoso a n i­ vel co mputaciona l (e n el estud io or igina l se simu laron las evo luc ion es tern ­ por a les de los primeros 13 arrnorucos) . A partir de suce sivas simplificac iones, Risset y Mathews encon tra ron que: 1) la variac ion tem poral del esp ectro es crft ica pa ra deterrnin ar el timb re; 2) las variacio nes de alta frec uencia y pe­ q uefia arnpli tud n o se perciben; 3 ) la dinarnica del crec im ient o de cad a ar­ mo n ico defin e gra n pa rte del tim bre de los bronces; 4 ) existe un a forrn ante ubicada entre 1.000 y 1.500 H z de gra n imp ortan ci a pa ra la d iscrirninacion 180

U t1l U

5

.~ 30 Q)

E

.~

.... .

.3.. .

4

o

100

50

150

Tiemp o (ms)

Figura 10 . Slntesis de la serial anre rior simplificada

tfmbr ica; 5) la prop orcion de ar rnonicos supe riores aumen ta signi ficat iva­ mente con la inte nsi dad . Empleando estos nu evos co noc im ien tos lograron cre~un model e co mp utac ion alrnen re mas econo rnico que supero ex itosa­ men e la prueb a de discr irninacion aud itiv a . l.ejernplo ante rio r, aunque limitad o a un os pocos sonidos de rrornp eta, ilustra las caracte rist icas y ve ntajas de l an alisis por sin tesis. Par a em pezar, per­ mi te eva luar cada pararnetr o del so nido de ma ne ra ind ividua l, uno por vez, evitando la co mp lejfsima tarea de lid iar co n espaci os multidimensionales en los que no se sabe bien qu e cosa produ ce cada efecro per ceptual. N o menos

181

irnportante, saca prov echo inmedi ato del avance tecnol ogico en los ca mpos de la aciistica y de la informati ca, a la ve z q ue im pul sa nu evas in vestigacio ­ nes y desarro llos . Los mod elos de ana lisis po r sin tesis h an demost rado ser efi­ caces para gene ra r co noc irnien ro cient ffico y te cnico , reducir la can tida d de in formacion necesar ia para exp resa r una serial acu stica, pro du cir varian tes y modi ficaci ones nunca ex pe rirnen tadas y co ntro lar la pro sodi a m usical en tiempo real. U na descr ipc ion deta llada de las tecnicas empleadas conr en dria la h isto ­ ria de la elec troac ust ica duran te los ult irnos 60 afios. S610 para enu rnerarlas, podem os c ita r la sin tesis aditiva, la sln tesis sustrac t iva, la sin tesis alinea l 0 glo­ ba l -a este grupo per tenece la sin tes is por FM de Chowni ng- , el mo de lado ff­ sico y, ac tua lme n te en desar rollo , la sfn tes is basada en prin cipios percep tu ales. Estudios sob re el timbre en la VOz h urna na Parece que poseem os cap acidades audi t ivas especiales para co mp re nde r la voz h urnan a, q ue no empleam os para oir el resto de los sonidos, Es algo similar a 10 q ue oc urre en la decodi ficacio n visual de los rostros. Se sabe que pa ra el re ­ conoc imien to del rostro de un a persona se usan rec ursos diferentes de los q ue se usan para percibir el resto del camp o visual (ex isten personas que n o pue­ den distinguir los objetos, pero que leen perfec tarnen te los rostros, y viceve r­ sa ). Q uiza esta s capac idades tengan que ver con la irnpor tan cia socia l de la in formacion y co n 10 parecidos que son los rostros - y las vo ces- entre sf; es prob ab le que se n ecesite cierta ca pac idad pot enciada y espe cifica para distin ­ guir en tre un a voz y otra. Por otra parte, existe fuerte evide n cia de que la pa­ labr a y la musica se procesan en lugares d iferentes de la corteza cerebral. Anteriorme nt e se crefa que cada un o de los h emisferios cerebr ales estaba es­ pec ializado en un o de estos do rnin ios, pero en la actualidad se sabe que tanto la producc i6n como la perce pci on de miisica y pa labra involucran varios sub­ procesos , cada un o de ellos lat era lizado de mod o diferen te. Por eje rnplo , se descubri6 que las ta reas de discr imin aci6n y de identificacion (q ue implican un acceso al lexico verbal ) son independ ientes y estan loc alizadas en dife ren­ res lugares de la co rteza . El pro blema de la iden t ificac ion t fmb rica de las voces es mucho mas di­ freil que en el caso de los dernas son idos, N o s610 porqu e pode mos ident ificar m iles de voces di fer entes (contra un gru po reducido de et iquet as ti rnbri cas gene rales ), sino por el peq uefio ran go de variaci6n de los rasgos n o t lmbr icos en la voz. Sa bemos que las frec uenc ias fundamenta les t fpicas en h ombres, mujeres y ni fios estan comprend ida s en tre 80-240, 140-450 y 170-600 H z, respectivam ente. Y que el ran go de variac ion en frecuencia para un habl ante

182

prom edio alcanza una relaci6n de 2 a 1 (en el can to no profesional es de 3 a 1) . Pese a est a amplitud de val.ores espec trales, se co mpro b6 que un carnbio de ape­ na s 5% en la frec uen cia de alguna de las tr es primeras forma n tes puede redu cir drasticam ente la capa cid ad de identificacion de un a voz con ocida. Aunque apa re nte rnente la frec uencia fund amen ta l, la frec uencia de las forman te s - especialmen te entre 1.000 y 2.500 H z- y el anc h o de banda de las forrna ntes participan en la ide n t ificac ion de la voz human a, se pre sume que la infor mac ion aciistica relevante depe nde de las ca rac terist icas part iculares de cada locutor (Van Dornm elen , W., 1990) . En otros ter rnin os, no ex iste un conjunto fijo d e datos in variantes que se ap liquen a todas las situaciones . Por ejemp lo, pued e oc urrir q ue la seria l ac usti ca de la voz del h ablante A posea cierta can tidad de informac ion especffica , de la c ual el oven te extr ae un sub­ co njunt o de datos adec uado para su idenrificacion. Pero en el caso del h ablan ­ te B el subcon junto ant erior pod ria resu lt ar in aprop iado , y el oyente deb e elegir otro diferente . Estudios sobre el "color" del sonido Un grupo part icu lar de est ud ios fue orientado sobre 10 q ue se llam6 el "co­ lor " del son ido , El co lor del sonido no t iene , segun sus defe nsores, prop ieda­ des tem por ales y se ap lica a los atr iburos estacionar ios de l soni do , n o a los tra ns itori os. De ac uerdo con Wayn e S lawson, "un son ido pued e camb iar de co lor a 10 largo del tiernp o, pero el camb io en sf m ismo no es un color in de ­ pendi ente. N o mas q ue un cambio en un co lor v isual puede ser un col or in­ dependiente 't.P S lawson intent o descu brir el modo de co nt rolar el co lor del soni do mientras ca mbia la altura tonal, la sono ridad 0 algun otro rasgo del so­ n ido , Propuso un sistema de contro l basad o en el modelo fisico de fuente y filtro, Por eje rnplo , en un a guita rra la cuerda es la fue n te de oscilaci6n y la ca ja de resonan cia el filtro. A parti r del modelo prop uso un a ser ie de reglas de co nt ro l y tran sforrnac ion . 1. El co lor del son ido esta asociado con el filtro, no co n la fuente . Para man tener el color constante se de ben rnan ten er co ns ta n tes las ca racterisricas del filrro, 2. Para man ren er el color del soni do co ns tan te se debe mantene r la en­ -olven te espectra l co ns ran te .!" \ \ \ 3 . El color de l son ido posee cua tro dim ensi on es ind epend ientes: apertu­ ra, agudeza, lasitud y pequefiez, 13 Slawson (1985) , en Butle r, D. (1992). Trad, de GB.

14 Esta

regla no es mas que una variaci6n de la ant erior.

183

4. Para tra nsporter un co lor respecto a una dime nsion, se debe agregar un va lor constante en esa dimension. 5. Para invertir un color respecto a una d imen sion, se debe inverti r el sig no del valor en esa dime nsion. IS Estas reglas definen claramente un espac io vec torial, simil ar al espac io de los colores visuales propu esto por Schrodinger. A 10 controversial de la con jetura, Sla wson le sumo ciertas afirrna ciones que se pueden calific ar, por 10 menos, de arriesgadas: "el color del soni do aparece com o un elemento mu­ sical viable que puede ser sometido a un control estructu ral precise , en todo an alogo al que se le aplica a la altura tonal". Aquf aparece por primera vez el debate sobre la capacidad del timbre para sustentar tr ansform aci ones estruc­ t urales 0 , dicho de otro modo, sobr e la capac idad morfof6rica del timbre (m as adelante desarrollarernos este pun to) . A l margen de la audacia de las afirrna­ ciones de Sla wson, en sus conjeturas se perciben claros resabi os de l modelo clasico del timbre . En sinton fa con Slawson, Yee On Lo acepta que la envo lvente especrra l dete rmina en gran medida el timbre de los sonidos, pero se diferencia al asig­ narle tam bien gran irnportancia a la evo lucion temporal del espectro. A firma que percibimos los cambios espectrales a traves de "cuadros" defin idos com o la minima porc ion repet itiva de la onda. Estos cuadros acnia n como las tr an ­ siciones entre fonemas en la voz hablada . Asf como los cuadros proporcionan la microes tru ct ura temporal -del orde n de los milisegundos- , la rnacroe struc­ rura -del orden de los segundos- esta tarnbien const ruida a partir de la co nca­ tenacion de cuadros, Como ap unta Lo: "El tim bre es la evo lucion de los cuadros"." Existe n c iertos cuadros crft icos q ue define n los cambi os importan­ tes a 10 largo del tiempo. En el modelo de Lo, la percepc ion de l t imbre se fun ­ da en tres parametres: la d isposicion de los cuadros crit icos, la envolvente de arnplit ud y la trayectoria de la altu ra tonal. En la Figura 11 se aprecian los dia­ gramas de Lo para dos sonidos diferenres. El model o de Yee On Lo se puede ver com o una version cuan rificada a d i­ ferentes niveles de la concepcion que asoc ia el timbre con la evoluc ion tem ­ poral del espectro de la serial. Even tos acus ticos dif erentes a la voz y a los son idos mu sicales Aunque la mayo rfa de los estudios sobre el timbr e tratan sob re los son idos de la voz hab lada 0 de la rnusica, algunos investigadores centraron su ate ncion 15 Slawson 16

(1985), en Butler, D. (1992). Trad. de GB. Lo, y. O. (1987)]. Trad . de GB.

184

~d

d

~c

c b

b

Tiempo



Figura 11. Diagramas de Lo de dos son idos diferenr es (Lo, Y. 0. , 1987)

sobre sonidos complejos prop ios de la vida cot idian a. Co me n taremos breve­ mente cuatro de ellos. 1. D. ]. Freed estud io los soni dos producidos po r diferentes baquetas al golpear cuatr o cacerolas de distinto tama fio (Freed, D. ] ., 1990) . A islo cuatro para metros de "prevision de timbre": la energia global, la distribuci6n espectral, la velocidad de evoluci6nespectral y la rapidez de alteraci6n del evento. Las eva lua­ ciones de los sujetos sobre el tipo (dureza) de la baquera emp leada se mantu­ viero n to ta lmente independ ient es del tip o de cacero la golpeada, a pesa r de que los estfmulos contenian informacion tanto sobre el excitador como sobre el resonador. Los pa rametres de pre vision de timbre de Freed se corre laciona ­ ron bien con las eva luacio nes de la du reza de la baqueta. Actualmente se co n­ tinua investigando co n el fin de individualizar los Indice s invariantes que pe rmiten a los oyentes ca racte rizar y reconocer a l excitador y al reson ador de forma sepa rada . 2. B. H. Repp estudio los son idos que producen las mane s al aplaud ir, En ­ ce ntro que los oye n tes co inc idfan al juzgar el sexo de l "ap laudidor", aunq ue los juicios no siemp re co rrespo nd fan al sexo rea l de la Fuente (Repp, B. H., 1987). Seg un el a uto r este estud io refleja la influencia de los estereot ipos cul­ tu rales auditivos. 3. Wa rren y Verbrugge ana lizaron las respuestas aud it ivas frente a ob jetos de vidrio que rebotaban 0 se rornpia n (Wa rren y Verbru gge, 1984). A na lizo la correspondencia entre patrones ritrnicos, la intensidad y las envolventes es­ pectrales y los juicios aud it ivos asociad os. 4. N. ]. Vanderveer estudio la identificac ion libre y la clasificacion de \ eventos acusticos complejos como el tintine o de llaves, el crep ita r del papel , ~c . (Vanderveer, N . ]., 1979). Segu n S. Handel , serfa natural indicar los so­ nidos a partir del evento mecan ico que los engendra, sin duda a partir de in­ variantes transformacionales (Han del , S., 1989 ). Los grupos esta rian parcialmente determinados a partir de las pro piedades acusticas de los mate­ riales utilizados (es decir, las invariantes estr ucturales) . 185

A los estudios an te rio res les cabe, poten ciada, la crit ica que se le h ace a casi todos los estudios sobre el timbre: dependen fuertemente del conjunto de son idos escogidos. Resumen y conclusiones Los resultados de los estudios mencionados, y de otros similares, son muchas ve­ ces contrad ict or ies. En general, todos acepta n que la percepci6n del timbr e de ­ pende de la forma de onda en su conjunto, pe ra discrepan sobre cual es de sus caracteristicas debe n considerarse relev antes. A modo de resumen, podemos es­ tablecer una serie de elementos, aceptados por la rnavorfa de los investigadore s, que intervienen en la discriminaci6n de los timbres instrumen tales aislad os. • La informaci6n pre sente en el ataque de la sefial. • La informaci6n rel ati va a la evoluci6n de la envoivente espectral, pri n ­ c ipalme n te en el cuerpo d e la serial. • La presenci a de pequerias variac ione s alea to rias de frecuencia en los componentes discret os de la serial. Otras ca rac terfsticas se discriminan co n mayor d ificultad: • El grado de coherencia de la variaci6n en frec uen cia de los co mpo n en ­ tes discretos. • El grado de simplificacion en las variaci on es de amplitud y frecuencia (valido sobr e tod o para los modelos de analisis po r sin tesis). Esta en ume rac i6n es valid a sola mente co mo refer en cia ya que deben agregar ­ se numerosas sing ularidades y excepciones. En la lista qu e sigue men cionam os algunas de ellas. • Las var iables sign ifica tivas par a la percepci6n del timbre musical exis­ ten en, al menos, dos ni veles tempor ales d iferen tes: un nivel se asien ta en los cambios que oc urren en algunos milis egundos y el otro registra las variaciones mas lentas, del orde n del segundo. • C uando el estud io permite que part ic ipen las caracterfsticas de ataque de los sonidos, estas dominan por sobre los otros factores presentes en la sefial acu stica. So larnen te el bril lo, determinado por la distribucion espectral, pe r­ manece presente co mo un factor tirnbrico de importan cia . Un erro r sist em a­ tico co me t ido por mu chos in vesti gad ores qu e pretenden eliminar el ataq ue de la serial aparece al seccionarlo abruptam ente : lejos de eliminar el ataque, se 10 reemplaza por otro de banda ancha.!? Algo similar ocurre en los experimen­ tos de resta urac ion fon ernica, en los q ue ciertas silabas de una Frase son sup ri­ 17 Este

186

efecro es consecuencia del principi o de indeterm inacion aciistico (Basso, G., 2001a).

mid as. El reconocimiento es mayor cuando se reemplazan las stlabas ausent es por silencios que cuando se enmascara n las mismas silab as por un ruido . En el segundo caso se reemplaza un a silaba por otra cosa, en el primera no. • El brillo del sonido Figura com o un parametro significative en todos los estud ios mencionados. La gran discusi6n gira en torno a la n atu ral eza de la en­ vol vente espectral. Algunos auto res co nsi deran que su imp ort an cia guarda es­ tr echa relac i6n co n la frecu en cia fun damental de la seria l, rnientras que otros sost ien en qu e las band as de frecu encia (e n algunos casos las forrnantes) deben ocu pa r regiones espectrale s absoluras. La ma yor parte de la evi dencia ex pe ri­ mental co nfirma la segun da h ipote sis. • C uan do sonidos de un mismo genera se hallan situados en co n tex tos mu­ sicales de cierta complejidad, en particular en texturas isorrftmicas, los indices de n aturaleza temporal pare cen perde r irnportancia desde el punto de vista de la discrim in aci6n, en beneficio de los indice s ligados a la envolv ente espectral. Pa­ rece ser que, cuando la complejidad aume n ta (complejidad arm6 n ica 0 cantidad de voces) las d iferencias temporales finas n o son tan bien preservadas como las diferen cias espectrales. Un buen ejemplo se puede encontrar en los co rales pa­ ra maderas en algunas sinfon fas rornanticas. En esos fragmentos, los transitorios de las not as aisladas son men os impo rtantes que la informaci6n presente en la parte del cuerpo de la serial, ligada a la en voivente espectral. • C iertos sonidos par ecen poseer caracteristicas 0 dimensiones timbricas exclusivas, no comparables co n las usuales en la mavorfa de los instrumen tos. La pree m in en c ia de arm6nicos impares en el clarinete -cuya sola apa rici6n so­ brepasa en importancia a las dern as ca rac terlst icas de la sefial-, el particular tra nsito rio de ataq ue de la trornpeta, la presencia de ruid o rosa en el son ido de un plat illo , la envoi vente de amp litud en el tromb6n y en la flau ta, son bue­ nos eje mplos de dimensiones tfmbricas particulares no ex trapo lables a la tora­ lidad de los instrurnentos de musica,

3. PROPIEDADES PARTlCULARES DEL TIMBRE A co n t in uac ion describir em os algunas de las prapiedade s pa rtic ulates de la percepcion auditiva que fu era n analizadas, y en algunos casos descubiertas, a p'artir de las investi gaciones sobre el timbre de los sonidos.

\

Constancia del timbre Es evidente que existe alguna form a de invariancia 0 de co nsta nc ia tfrnbrica, que se comprueba en el h echo de que una Fuente acustica puede reconocerse

187

en un a gran varieda d de circunstancias. Por ejern plo , un saxo se identifica co­ mo tal al margen de la altura tonal 0 de la d inarnic a que este gene rando . Se 10 reconoce sin di ficuirad aun si 10 ofmos a craves de un medi o tan distorsivo co­ mo un a pequefia rad io po rtatil 0 a tr aves de un a puerta de madera. La voz de una perso na co nocida se identifica en una hab itacion silenc iosa 0 en un a reu ­ n ion mu y con curr ida , en la que se mezcla con otras voces, co n la musica y co n los ruid os de propios de la fiesta . Los espectros que nos llegan son mu y dife ­ rentes en todos estos casos . S in embargo , la no cion de constan c ia tfmbrica n o se co mp ren de bien a part ir de los estud ios clasicos de d iscriminacion. lEx iste n co rrela tos ffsicos que den cuen ta de esta co ns tan cia tfmbrica en di fere n tes co n tex tos? Para reconocer e l timbre uni co de un a voz se deben ele­ gir, aislar y ana lizar las partes de la sefial qu e aporta n la informaci6 n adec ua ­ da . Una mala eleccion imp lica ta un ca mb io en el ti mb re pe rcibido y una ide n tificac ion equivocada. En este punto resul ta in te resa n te destacar que la envoivente espectral de una seria l acustica sufre, inev ita blemente, modifica­ ciones importantes entre la ernision y la rec ep cion. Ya sea par la accion de fil­ tr ado en el medi o de propagacion , 0 por d istors ion en las refle xiones y refracciones qu e pu edan oc urrir, el espec tro qu e le llega al oye nte depend e de la geo metrfa lImite del espac io ac ust ico y de la ubicac ion de la fuente y el re­ ce ptor en d icho espacio (expresado co n mayor prec ision, la alterac ion del es­ pectro depende de la impe da ncia co mp leja que encue nt ra la seria l en el tr ayecto emisor-receptor l.l f Las variaciones tempora les, en espec ial las de pe ­ quefia escala pres entes en el ataque, preservan mucho mejor el patron est ruc­ tur al origin al luego de transformaciones como las an te riores. Se sup one que estos parrones tem porales invariantes cumplen un a func ion destacada en la pe rcepc ion de la co nstancia t fmbri ca. H abitualmente reconocem os sin erro r el timbre de los son idos, 10 que sig­ ni fica que elegimos los e lemen tos d e informacion adecuados en contextos en­ ter am ente d ifer en tes. Como en el caso de las constancias visua les, la co ns ta nc ia del t im bre so lo puede ser exp licada en func ion de co mp licados procesos en las etapas superiores del tratami en to n eural. El tratamiento de las sefiales de entrada al siste ma aud it ive , 0 de las repr esentaciones auditivas pr i­ rnarias, no alcanza pa ra dar cuenta del fenomeno, Como ocurre en el recon ocimiento v isua l de los rostros , se supon e que la apa ricio n de cie rtos rasgos especificos a lcanza para situar un son ido en un a ca­ tegor fa tfmbri ca particul ar - por ejernp lo, para reconocerl o co mo sonido de sa­ De aquf surge la fragilidad de la altura espectral an re la meno r mod ificac i6n de la seii.al aciisrica. Esra propiedad , opuesra a la solidez que presenta la altura conaL fren re a modiftca­ ciones sirnilares 0 super iores, se desa rrolla en Basso, G. (200 1a) . L8

188

xo fon-, al margen de la exis te nc ia 0 no de otras ca racterfsticas menos signi fi­ cativas. Lo interesante en el caso de l timbre es que el conj un to de rasgos im­ prescind ibles n o es el m ismo para tod os los sonidos, co mo ya v imos en el apa rta do an te rior.

lTimb~es metarnericos? El sen tido de la audicion es clar amente analitico con rel acion a las alturas to ­ n ales, relacion ad as co n la frecuenc ia fundamental de la serial acustica, Es de­ cir, en prese n cia de un a mezc!a espectral distin guimos ca da un o de los co mp one ntes de la mezcla. Por eje mp lo, cuando co mbi na mos un Do y un M i ofmos tanto la ter cer a mayor (la co rnbinacion) co mo cada un a de las notas in­ d iv idu ales. En co nt ras te, el sentido de la vista no es analftico co n relaci6n a los co lores, rela cionados co n la longitud de las on das lumfnicas: al mezc lar azu l y ama rillo vemos el co lor ver de (Ia cornbin ac ion), pero ya no percibimos e l azul y el amarillo que 10 forman . Esta caracterfstica de la vision perm ite crea r co lares metarnericos, causado s por espectr os diferentes pero indistingui ­ b les a la v ista. lEx isten los timbres metarnericos 0, 10 que es equivalente, dos sefia les ffsicas difer en tes que se o igan exacta rnen te igual? De ac uerdo con los estud ios realizados h asta aho ra, la respuest a es no (a l menos en un sen tido es­ tr ict o, pues se pued en h allar dos seriales d iferen tes que curnp lan un a misma func ion t fmbri ca -par eje mp lo en un a fusio n de objetos aud itiv os- aunq ue se los pu ed a discriminar). Por otro lado lex iste un "unisono tfmbrico", mas alla del caso tri vial de dos son idos de igual in ten sidad y altura tonal? Es decir, dos sonidos de diferen­ re alt ura tonal e identi co timbre (l n o serfa este el ideal de un constru cto r de pianos?) . A lgunos auto res cree n qu e sf, a unq ue sus argume ntos n o son plena­ mente co nv incentes (Va n N oord en, L., 197 5; Erickson, R., 197 5). O tra ca rac­ te rfst ica de la audicion, rel acion ada co n 10 ante rio r, es la inexistencia de algun a cosa parecida a una "octava t fmbrica": no es posi ble obte ne r un cic lo de t imb res a partir de l cual co nst ruir una "esca la timbr ica", a semej anza de la esca la de alturas tonales. Por supuesto , 10 anteri or n o es mas que otra form a de dec ir que el timbre es un rasgo multidimensional. \

. El timbre eomo un medi o morfoforico En el ca pitulo V mencionamos la posib ilid ad de clasifica r los rasgos aciisticos en morfofori cos, cap aces de po rtar formas invariantes, y no rnorfofor icos. Co­ me n ta mos que la alt ura to nal y el tiempo constituyen rnedi os rnorfoforicos po­ derosos. Sin embargo, tanto A ttn eave y Olson, como mas adelante M ichael

189

Kubovy y Roger She pa rd, cons ideraron el t imb re como un medio no rnorfo­ forico. Es eviden te que a partir del timbre no se pued e codificar la misma cla­ se de inform acion est ructural q ue se obt iene operando con la altura tona l. Sin embargo, descar tar tod a ca pacidad de o rgan izacion est ruc tural cimenta­ da en la modul acion tfmbrica no parece razon able. La codificac ion fon et ica de l habla se asien ta prin cipalmente en las va riac iones del ti mbre en func ion del ticmp o, y la arrnonia musical puede ser cons iderada como un a pa rticular cod ificac ion de l timbre de los son idos {cada funci on tonal posee un ','co lor" particu lar ).'?

Capitulo VII

Percepci6n auditiva del espacio

Timbre y at enc i6n Para ana lizar la percepcion auditiva del espacio es usual distinguir en tre loca­ lizacio n y lareral izacion. El terrnino Ioca lizaci6n se refiere a los juicios vert idos sobre la d ireccion y disran cia a la que se enc uen tra una fuente ac ustica, que puede n 0 no co inc idir co n su ubicacion ffsica. El terrnino laceralizaci6n se usa para descri bir la localizacion apa ren te de un sonido "en la cabeza" del oyen te. La lat eralizacion puede verse como una version de laborat orio de la localiza­ cion y es un co rnpo ne n te ce nt ral en e1 disefio de campos ac ust icos virtuales. Para caracte rizar al espacio acustico vamos a emplear coo rden adas esferi­ cas cuyos param etr es son cl angulo de azirnut e, el angulo de elevacion 8 y la distan cia r a la fuente, tal como se ve en la figura 1. Co menzaremos nuestro estud io de la percepcion espaci al con el caso par­ ticu lar de los estfmu los sinusoida les estac iona rios. Mas adelan re veremo s 10 que ocurre con las sefiales genc rallzadas,'variables en el tiemp o y de espec tro comp uesto.

Una carac rerist ica destacada de la percepcion auditi va se relacion a con la atenc ion. Si co mparamos las propiedade s de los event os y rasgos acusticos que nos permiten rnantcne r la atencion select iva, veremo s que son (casi) las rnis­ mas que se ernplcan para discrimin ar y preservar el timb re de un son ido ante ca mbios de con tex te . En ambos casos el acenro esta puesto sobre el esfuerzo para identificar y seguir auditivamen te un obje to acustico part icular.

4. COMENTARIO FINAL Lo visto en este capftulo vale solamente para ca racter izar el t imbre de un iin i­ co objeto audit ive . Tod avfa no con side ramos las caract er fsticas que de be po­ seer un a serial acust ica para que percibamo s un o 0 un a mult iplicidad de obje tos ac ust icos, terna que sera desarro llado en el cap itul o VIII. La conclusion logica de este capftu lo esta ria dada por el ana lisis de los usos musicales de l timbre, quiza o rdenados de acuerdo con su progresion h is­ torica. Pero tal empresa ocupa ria, por 10 men os, un libro similar a este. As f que 10 dejamos para mas adelan te.

Plano

frontal

\

-, Plano

horizontal

19 En la rmisica conre rnporan ea la d istinci6n entre armon ia y tim bre resulta muchas veces desd ibuiada, co mo puede co mprobarse en piezas co mo Avenrures de Ligeti l' Modulations de G risey,

190

Figu ra 1. S istema de coordena das esfericas: e, azirnu t; 0, elevaci6n; r, dista nc ia

191

30 ,-,.......,---,.---.,..--,---,-...,-.,.-.,-,.......,---,.---.,..--,---,---,----,---,

1. LOCALIZACI6 N DE SINUSO IDES 6000

En la localizacion de sefiales que poseen una sola linea en su espectro -corno ocurre con una sinusoide- los factores espectr ales no aportan informacion es­ pacial relevante. Per este mot ivo los datos empleados en la localizacion de si­ nusoides son prin eipalmen te bina urales. De todos ellos se destacan claramente la diferencia interaural de inrensidad (110) y la diferenciainteraural de tiempo (lTD).

5000

~

'"

'(; c

3000

:J

2500

U

(1)

1800

Diferencia interaural de tiempo Para fuent es acusti cas ubicadas fuera del plano medio del oyen te, la diferen ­ cia int eraural de tiempo ( ITO) aparece com o cons ecuenc ia de la diferen cia en

192

ai

E

~

co ~ Qj

<:

LL

1000

C uando la fuent e aciistica se ubica fuera del plan o medio del oyente, la in ten­ sidad de las seriales que llegan a cada uno de sus oidos es ligerarnente diferen­ teoEn la mayorfa de los casos, esta diferen cia de int ensidad no es provoeada por la desigualdad de reeorr ido entre la fuent e y cada ofdo, sino por la sombra acus­ tica que causa la cabeza al interpon erse en tre la fuent e y el oido mas alejado. En la figura 2 se puede ver la difere ncia interaural de intensidad (110) en funcion del azimut 8. La frecuencia de la sefial sin usoidal generada por la fuen te se ernplea com o pararnetro de la familia de curvas. Una cabeza hu man a promedio se pued e aproximar a una esfera de alrede­ dor de 20 ern de diarnetro, A causa del fen6me no de difraccion la cabeza no va a provoca r una sombra aciistica n ftida por debajo de 1.700 Hz, y va a resul­ tar acusticamente transparente por debajo de 500 Hz. Co mo pued e verse con clar idad en la figura 2, la 110 es Infima a frecuencias por debajo de los 500 Hz, pero puede llegar h asta 20 dB a frecuen cias elevadas, En otros terrni nos, la di­ fracc ion de las ond as en la cabeza lirnita la eficacia del mecanismo de detec­ cion de diferencias int eraur ales de intensidad a la parte superior del espectro audible. En cuanto al min imo camb io detectab le en la lID, se h a compro bado que llega a 1 dB para seriales frontales siempre que la frecueneia de la serial supe­ re los 1.000 Hz. U n buen ejernplo relacion ado con la 110 10 provee la reproduccion este­ reofon ica bicanal, en la que casi toda la informaci6n espac ial esta codificada unica mente en terrninos de diferencias de int ensidad (esto no es asi, debemos aclarar, en los registros de audio bien cuid ados en los que se conternpla tam­ bien la informacion de fase) .

~

500 200

~

·c · ·c · · ;

" C"

o ~---+----;-____==::;::=;.....;~,..;.....;.;;;±-.;-;...-..;---+----;-----,-----"

10

"0

'"

4000

(1)

Diferencia interaural de intensidad

~ -

· ·i.. c·;;.;·'-'-"-.i.:.;.;.....;-~.;.....;~ · · c

"C"

20 10

:

:

:

0 10

.

~

_

,

,

.. - .. _

.

0 10 · ·c ·· c· · 0

10

.. "C"

:

:

C " ~"

._... • . ~

~.

,:

~ ~-

.. ­

0 ~c:::.._;___+___;__----:----___;____;_-:-_:___;----;____;____;__----:----___;_---:----::'!'_1

....

10 -- .;. -· .:. · -- --7 ··­

:: ~ 0 1""': -;--;----;-----;----;----;----;--+- -+- ---;----;----;----;-- ;--,---"'" 1

10 --';-" ';- " ';' -.;._ . .:.

- ~ . -~ . . ~ .. ~ . . ~ .. ~ . ~. .;. -.;---.;.. . : ;-,.....; ~ ,

11 ~ ,'c" c" c .~ ..: .c..i ..;..~ ..;..~ ..c..: .. ~ .~ c ..

'C

..

10 " ~" c·· c , , c · ~ · ·~ · ·~ · ·: · ·~ · · ~ · · - · · c · · ~·· ~ · ·c-·c ' C"

o

0"

30"

60'

90"

120"

150'

180'

Angulo horizontal desde el frente (azimut)

Figura 2. Diferencia interaural de imensidad (tro) en funci6n del azimut 8 y de la frecuenc ia

el tiempo que le lleva a la onda alcanz ar cada uno de los otdos. La ITO varfa entre a y 690 ms para sefiales euyos angulos de azimut eo rrespo nden a 0 0 y 90°, respect ivament e. Como una onda ac ustica que se propaga en el aire tar­ da 30 us en recorrer 1 em , para ir de un ofdo al otro necesita aproximada­ mente 700 us. Si las sefiales son estr ictamen te sinu soidales, una diferencia de tiempo equiva le a una diferencia de fase. A bajas frecuenc ias la infor macion co nte ­ n ida en la diferencia de fase es sign ificativa, pero a altas frecuencias la longi­ tud de onda es men or que la dista ncia entre otdos y la diferen cia de fase provee datos ambiguos. A una longitud de onda de Z3 em, similar a la distan ­ c ia pro medio en tre ofdos, le corresponde una frecue ncia de 1.500 Hz. Si la serial posee 10 kH z en tr an varios ciclos completos en esa distan cia y la fase deja de aportar inform acion espacial un ivoca. En la figura 3 se puede n apre­ ciar estas dos situ acion es. \ Los movimientos de la cabeza reducen en parte la arnbiguedad de fase, pe­ ro\esta resulta muy grande para frecuencias por enc ima de los 1.500 Hz y el rnecanis mo de ITO pierde toda efectividad. -, En la figura 4 se ap recia la diferen cia de recorr ido en funei6n de l angulo de ent rada de las seriales que llegan a los oidos , Si denominamos r al radio de la cabe za, la diferenc ia de recorr ido des :

d = r e + r sen e

193

En la Figura 5 se puede ver el grafico de his diferencias temporales de lle­ gada en funci6n del angulo 8. La curva se quiebra a 90 °por simetria bilateral. Tan importante como la ITO es el mfnimo cambia de cingula perceptible (MAA). Cuando el azimut 8 es cera los umbrales de detecci6n para cambios en el angulo de llegada son muy pequefios, del orden de lOa 2° -que correspon­ den a una diferencia temporal de 10 us. Para otras angulos horizontales de lle­ gada el MAA varia sensiblemente con la frecuencia (figura 6). A 1.800 Hz y un azimut de 60° el MAA no puede discemirse.

u;­

.s

/".,

0,6

/V

0

E 0,5
""~

V

0,4

(5

0,0

1/

'u

~ 0,1

2

/ ~

a)

\

v

~

1\ 1\ ~

~

~1W1~1~1~1~

Angulo horizontal desde el frente (azimut)

~
Baja frecuencia

\

/

~ 0,3

Qj

02 '

\

V

~

:sro

"'\

Figura 5. Dtferencia interaural de tiempo lTD en funcion del azirnut

14

I

I

I

I

rt

, i

I

u;­ b)

~


2?

~

10

'6

OJ

ro .2

OJ

~
.\>'

8

OJ c;

= 180 0

·ro
u .9

Alta frecuencia

.n

E o E

Figura 3. Perdida de efectividad de la lTD a alta frecuencia par confusion de fase. El mecanismo no puede distinguir entre la locacion de las fuentes Fl y FZ si erniten a alta frecuencia

'c ~

b

75'

_1:<"

f>

6 4

rl

0 60' 4

2

I

i

n " ,,, ,,, ,,, ,,, ,, ,, ,,, ,,, ,, ,, ,, ,, 0" ,

...

o

~ 12

0

I

30'

// ...

.

0------0---0--0

....

0'

500

, ,0

...'

--- -----­ 1000

2000

5000

10000

Frecuencia (Hz)

Figura 6. Minima cambia de angulo perceptible (MAA) en funci6n de la frecuencia. El parametro variable es el azirnut El

"~ .....'

rse~"

Figura 4. Calculo de la diferencia de recorrido entre las sefiales que llegan a ambos oidos

194

El cono,de confusion y los movimientos de la cabeza

\ Como la d iferencia interaural de tiempo depende de la diferencia de recorri­ do de las ondas entre ambos oidos, la linea que va de un tfrnpano al otro de­ fine un eje de simetria axial alrededor del cual se encuentran lugares

195

Batidos binaurales Arriba

Figura 7. Cono de confusion lateral

geo rnetricos co n el m ismo ITO. Ap arecen asf los de norninados cones de confu­ sion a cada lado de la cabeza tal como se aprec ia en la figura 7. Las arnbiguedades relacionadas con este co no de confusion, al igual q ue las vinc uladas co n el plano med io, puede n ser resueltas moviendo la cabeza. S i la ro­ tarnos 20° a la izquierda y la imagen aud itiva se desplaza 20° en su posicion late­ ral aparen te, en tonc es uno tiende a supo ne r que la fue n te se sinia en el plan o horizont al. S i, en carnbio, el movimi en to de la cabeza no es aco rnpariado por un cambio en la imagen percept ual, la fuen te de son ido se localiza directamente arr i­ ba 0 abajo del oyente . La vision y el sentido del equilibrio juegan un pape l im­ port ante en este proceso, pues ayudan a definir la posicion de la cabeza en el espacio. A n iveles elevados de procesa rnien to neural la represen tacion espac ial involucra la integracion de la inform acion proveni ente de d iferent es sent idos, Co mo resumen - y solarnen te pa ra sefiales sin uso idales-, es posible soste ­ ner que los dato s ffsicos apo rt ados po r la !DO son uti les a alms frecuencias, mien tras que los proveni en tes de la ITO 10 son para bajas frecu encias. Este re­ leva en los mecan ismos de pe rcepc ion espacia l rue denominado en 1907 teo­ na doble por Lord Rayleigh , pero no se verifica de rnan era aca bada para sefiales de espectro co mp lejo . Los umbr ales de ca mbio en la percep cio n de las d iferenc ias de t iempo son rnen ores cuand o la ITO es ce ra , co n la fuen te ubicad a en el plan o med ic . El umbral de variacio n para la [DO ta mbien es menor cuando la !DO es cera . En defin it iva, la resolucion espacial es mejor para sonidos qu e llegan de [rente 0 de sde algun lugar en el plano medi o, con 0° de azimu t. En algunos casos la loca lizacio n rnono aural es tan buen a co mo la binau­ ral, heche qu e sugiere el uso de algun mecanismo ad iciona l no co n te mplado en la [DO n i en la [TO, ta l co mo ve remos mas ade lan te .

196

Una notab le caracterfst ica de nu estra aud icion, en la q ue se com prue ba la sub­ sistencia de la informaci6n de fase mas alla de l sistema aud it ivo per iferico, se revela con la aparicion de batid os binaura les. Estos se manifiestan al presen­ tar dos sefiales sin usoidales de frecuencias apenas difere n tes (M < 20 Hz), un a en cada ofdo , La ex istenc ia de los batidos binaurales dep ende de la in terac­ cion de la informac ion de las sefiales qu e part en de ambos o fdos a n iveles su­ peri ores de procesarni ento neu ral. Pro veen una dernostracion irrefutable de que la descarga de las neuronas preserva la informac ion de fase del estirn ulo. Los batidos binaurales son menos ni t idos que los bat idos monoa urales, con las dos sin uso ides de l estirnulo presen tes en un solo ofdo. Se los per cibe solo por deb ajo de los 1,000 Hz, a diferen cia de los mon oaurales que se oven en tod o el rango de frec uenc ias audibles. Adernas, estos iilt imos se perciben mej or cuando las in tensidades de las dos sin usoides son sim ilares. Los bar idos binaurales, por el co n trario, se oyen aun co n grandes d iferenc ias de inten sidad entre los estimulos (Ia sensi bilidad a la fase ex iste den tro de un gran ran go de inten sidades), y un auto r bas ta sostuvo qu e un a de las sefiales puede qu edar par d ebajo del umbral de audibi lida d. Estudi os recien tes no han corroborado esra afirrnacio n .

2. LOCAUZACION DE SEN ALES NO SINUSO!DALES Los son idos reales, a d iferencia de las sin uso ides teori cas, tiene n co mienzo y fin. C omo sabe mos, tod o ca mbio te mpo ral en un a sefial ac iist ica va asociado a cambios en su espec tro , tan to mas profund os cuan to mas rapido ocurre la transicion temp oral. Precisarnente, estas irregularidad es espectrales apo rta n n ueva informac i6n ut il para localizar fuen res acusricas. EI sistem a aud itivo las aprovecha de dos mane ras diferentes: un primer mecanismo cornpara el espec­ tro presente a la en trada del siste ma aud it ive con espectros pre vios 0 con es­ pectros almacenados en la memoria de largo te rrnino . Co mo esta operac ion puede real izarse con un solo ofdo inv olucr a un proceso monoaural, EI segun­ do mecan ismo compara las ca racte rfsticas espec trales de las seriales qu e llegan a ambos o fdos y es, obvia rnen te , binaural.

~

Localizacion monoaural: el rol del pab ell6n au ricular En 1969 Butle r sugiri6 qu e el pabellon auricular provee informacion sobre la localizacion vert ica l y sobre la d iscrirninacion entre los ca mpos acust icos an­

197

teri or y posterior. Es decir, permite loc alizar Fuentes ubicadas en el plan o me­ dio , impos ibles de resol ver co n la 110 y la ITO (Butl er, D., 1969) . Hoy est a aceptado que el pabellon auricular rnod ifica el espectro de l esti ­ mulo en funci6n del ang ulo de incidencia de la onda en relaci6n con el eje medio de la cab eza. La acc i6n del filtro se mide co mpa ran do el espectro del estfrnulo exterior co n el espe ctro de la serial en la entrada del canal auditive ex tern o. La razon , exp resada en dB, se conoce com o la funci6n de transferen ­ cia de la cabe za (HRTF)l y se puede apreciar en la figura 8. La informacion provista por el pabe llon au ricular, da do su tam afio - un os Z7 cm z- , es efec t iva a frecu en ci as por e nc ima de los 6 kH z. Entre 500 H z y 6 kHz la ca beza, ac t uan do co mo pantall a, fun ci ona de rnanera simila r. En experirnentos con ruido de ban da angosta, la ele vacion apa rente deri­ va de la coinciden cia entre los picos de la HRTF y la frec uen cia central del rui­ do. Por ejernplo , un ruid o di6tico centrado en 8 kHz se oye "arriba" al ma rgen de su ubicacion real, pues en esa posicion la func ion de transferencia posee un pico de am plitud .? Si el oyente desea hacer un uso efici ente de los dat os espectrales asoc ia­ dos co n la dir ecci6n de la Fuente ac ust ica, es n ecesario qu e distinga en tre los picos y valles rel acionados co n la direcci6n (fil tro s HRTF) y los propi os de la Fuente y de las reflexiones gen eradas en las superficies ce rca n as, Esto sign ifica que el conocim iento previo de la fuen te y de las condiciones acu sticas del am­ biente es rel evante. S in embargo , como cada pabe llon aur icular pro vee filtros diferentes y conocidos , se los puede separ ar de los datos espectrales ext ernos.I G. Plenge presento evid encia de que cu an do un sujeto no esta famili arizado con las car acterfst icas de la fuente y del am bien te acust ico la localiz aci6n rna­ noaural se deg rada (P lenge, G., 1974) . Pero en compensaci6n se req uieren mu y pocos segu ndos para en trar en la nu eva situa ci6n . Est a acomodm:i6n espa­ cial es de gran irnportan cia en la aud ic i6n y ejecuc i6n de rnusica en v ivo. Empleo de datos espectrales en la localizaci6n binaural En seriales de espectros de banda las di fer encias interaurales de ti empo pro­ veen informaci on pa ra localizar la fuente que no esta sujeta a las arnb igue -

Del Ingles Head related transfer functions. 2 C uando las sefia les q ue Ilegan a los dos o fdos son ide n ticas se dice q ue el esnrnulo es di6­ tico y cuando son d iferenr es se 10 llam a dic6rico. 3 Un ejercicio inr eresan te con sisre en "apl ast ar" los pabellones co n tra la cab eza y salir a dar una cam inata. Es no table co mo se altera nue srra perc epc i6n ac usrica del espaci o al rnodifi­ car levemenr e los filrros HRTF. I

198

Amplitud 10dB

0° 1----.

18°

~

36°

72°

126° 144° 162°

l/\\

/!

/ V\\ 1/\\1/

~

I---- ..----' f--..-­ ~

/\"--- VA

h\ 1 /

--------- --- 1/'\\~\\ /f\ V \\ -------

/

---

180°

0.2

0.5

0° 18° 36°

A

»>

90°

:r: 106°

.:~\ j ~'\

r------­ V V\\ V" Vr lr----/ V\'\ VI' J..----. ./ ~

00'
e

./'

./

54°

'8

[

»>

2

\\ j

54° 72°

r: 90°

'I' 106° r-; 126°

144°

1/

~

I

\l/

/

5

10 15

162° 180°

Frecuencia (kHz) Figura 8. Funciones de tran sferen ci a desde el campo extemo h ast a la entrada del canal aud itivo ex tem o (HRTF) con el angulo h orizontal e como paramerro

dad es de fase ti pic as de las sinu so ides. S i el espectro cu bre un gran range de frecuencias, las arnb iguedades de fase pu eden ser superadas a traves de cornp a­ raciones ent re los ca na les del filtro aud itivo involu cr ados. D. W. Grantham consider6 que la diferencia in teraural de tiempo debe definirse a partir de se­ fiales de espectro de banda y pro puso llamarla verdadera ITO (G ran th am, G., 1995 ). A continuaci6n men cion arnos algunos experimentos en los que se desta­ ca la aplicacion de datos espe ctrales en la localizaci6n bin aural.

LocaliZCKi~ seiioies transitorias <.

Klump y Ead y rnidi eron los um brales para la discriminaci6n de la ITO para tres t ipos de estfrnulos co rtos. Fueron ne cesarios 9 us para detec ta r lin ca mb io en el ITO an te un estfrnul o de ruido de banda an gosta de 1,4 s de duraci6n; 11 us 199

para sinusoides de 1.000 Hz recortadas por una ventana rectangular de 1,4 s; y 28 !-1s para dics de 1 ms de duraci6n (tengase en cuenta que 10 us corres­ ponden a un desplazamiento lateral de 1°). Los umbrales de ITO para trenes de impulsos repetidos fueron del orden de los 10 us (Klumpp y Eady, 1956).

Localizaci6n en funci6n de la frecuencia La discriminaci6n de la posici6n lateral sobre la base de los retardos tempera­ les entre los dos oidos depende principalmente del contenido de baja frecuen­ cia de sefiales de banda ancha, por ejernplo clics, Por debajo de 1.500 Hz las fases de las oscilaciones de decaimiento en la onda de los dos oidos pueden compararse, proveyendo informaci6n sobre los tiempos de llegada relativos de los clics. Para frecuencias por encima de 1.500 Hz la informaci6n de la estruc­ tura fina del decaimiento se pierde. S610 queda la referida a la envoivente de decaimiento.

Importancia de las disparidades en el cuerpo de la serial Las disparidades en el cuerpo de una serial compleja (que implican la percep­ ci6n de la diferencia entre fases) son mas importantes que las del ataque, aun para puis os de 10 us de duracion, S610 para impulsos muy cortos prevalece la disparidad del ataque (que en este caso es la unica disponible, pues el cuerpo queda enmascarado bajo el ruido de banda ancha provocado por la interven­ ci6n del principio de indeterminaci6n acustico).

Correspondencia tiempo-intensidad Si se presentan dics identicos por medio de auriculares, la imagen se percibe "en el centro" de la cabeza, Si a continuaci6n se retarda el clic del ofdo dere­ cho, por ejemplo 100 1-lS, la imagen se desplaza hacia la izquierda. Pero si la in­ tensidad de la serial en el ofdo derecho aumenta, es posible colocar la imagen nuevamente en el centro de la cabeza. La cantidad de tiempo necesario para compensar 1 dB de diferencia interaural se denomina razOO de correspondencia. Este fen6meno apoya la teorfa que establece que las diferencias en tiempo y en intensidad son codificadas en el sistema nervioso de manera similar, y es de gran importancia para la implementaci6n de sistemas virtuales de espacializaci6n.

Adaptaci6nbinaural

tren de pulsos. Los dics luego del primero aportan poca informaci6n para la localizaci6n. E. R. Hatter present6 evidencia de que un disparo adecuado -un pulso de ruido de baja intensidad 0 un hueco (gap) en el tren de clics- puede desactivar la adaptacion binaural. En su experimento los clics que aparecen luego de la perturbaci6n son mas efectivos que los anteriores -adaptados- pa­ ra localizar espacialmente la fuente. Hafter y Buell dicen: "[...] El sistema au­ ditivo se vuelve insensible a los datos interaurales luego del ataque, a la vez que monitorea el entomo a la espera de nuevas condiciones. Cuando algo inesperado ocurre, el entomo espacial es nuevamente examinado" (Hafter y Buell, 1990).

Interferencia binaural Los ruidos de baja frecuencia degradan fuertemente la lateralizaci6n de las se­ fiales de alta frecuencia, mientras que la recfproca no es cierta. Una interpre­ tacion de la interferencia binaural establece que esta resulta de la fusi6n de la serial y del ruido en una imagen auditiva unica, no jerarquizada.

3. MODELOS DE PROCESAMIENTO ESPACIAL Se han propuesto gran cantidad de modelos que intentan dar cuenta de la multiplicidad de mecanismos presentes en la percepci6n espacial. En la Figura 9 se puede apreciar el esquema de Blauert, que incluye todos los bloques que aparecen en los modelos mas detallados (Blauert, J., 1997). En cuanto a los modelos de aplicacion, uno de los mas interesantes es el propuesto por Yoichi Ando a fines de la decada de 1980. Su esquema se pue­ de ver en la Figura 33 del capitulo l. El modelo de Ando postula la existencia de un mecanismo precortical de extracci6n de la autocorrelaci6n de las sefiales que provienen de ambos of­ dos, la posterior correlaci6n cruzada interaural entre las vias derecha e iz­ quierda, y la especializaci6n de los hemisferios cerebrales para el proceso de factores espaciales 0 temporales. Para ciertas tareas complejas (como la pro­ pia del efecto "cocktail party") es necesaria la interacci6n de ambos hernisfe­ rios: el izq~~do -temporal- tiene a su cargo el procesamiento de la palabra, mientras que elderecho -espacial- procesa la localizaci6n de las fuentes. Es­ te modelo fue utilizado con exito en el disefio de salas para musica no arnpli­ ficada, entre elias el celebre auditorio de Kirishima, en Jap6n.

El sistema auditivo binaural parece procesar s610 el ataque del conjunto en un

200

201

'"

'iii

2

,

'0 0.

II

1

:c

a ~o.

'

I ln fu r~a~i6~ s-;;n~oria l- I no auditiva

Cognici6n

I

eJecta f1ass .

.Q.

eo

0

ro"O

ro 2

.D C "C

~

Q)

~ .~

II

t--- ,

li olio

ReaHmonlaci6n

roPI~ E Q) ro'" 6 ro «0.

o

"0

2

,.

--

I

o

L--

I

/

",""

~

--I

--"- -

-

Procesador monoaural

C

,~

0

0

0

0

0

,

Patr6n de actividad binaural

·ro ~

.D O

Procesador binaural

T

r I

-" - ' - -

Filtro del

"_

-,

l __ . _

.,:lo.

Procesador monoaural

..

I

I

1

I

~. Figura 9. Modelo esquerna tico de Blauert para la audicion espacial

4. EL EFECTO DE PRECEDENCIA Sa bemos que el sent ido de la aud icion, a diferenc ia de la vista, se co nce ntra en las fuentes ac ust icas antes que en las reflexiones provocadas por los obje­ tos de l entorno. U n ejemplo cotidian o ocu rre al localizar la ub icacion de una fu ente ac ust ica en un a sala reverberan te donde la mayor part e de la ene rgia proviene de reflexi on es. Wallach (1949) y Ha s.') (1951) in vesti garon este fe­ nom en o co n dos sefiales asincron icas y los result ados pueden sinteti zarse en las siguientes reglas. • Dos son idos sucesivos se perciben como uno solo si el in tervalo te mpo­ ral entre ellos es 10 suficienternen re corto. EI limite superior es de 5 ms para clics y de 40 ms para sonid os de carac ter co mplejo, como palabr a y musica.

202

• C uando ocur re 10 ante rior, la locac ion de la fuente esta det erm inada por la de l primer soni do. Este fen ornen o se den om ina eiecto de precedencia, 0

.

• EI efecto de preced encia aparece solo para sonidos de caracter d iscon ­ tinuo 0 transito rio. • EI segundo estfrnulo puede te ne r alguna influencia en la localizacion de la fuente (su maxim o aporte es un ca rnbio de 7° en la loca lizaci6n aparen te). • S i el interv ale entre est imulos es de 1 ms 0 menor, el efecto de pre ­ cedencia no actiia : se obt iene a lgun tip o de co mpro m iso entre las ubicac io­ nes espacia les de las dos fuentes, Este hecho se denom ina suma de lacaciones (Blauert,]., 1997 ). • Si el estfrnu lo retr asado es 10 suficiente intense, entre 10 y 15 dB po r encima de l prime ro, el efecto no oc urre. • Se asume co rriente rnen te qu e el efecto trabaja mas efectivamente cuan­ do ambo s estirnulos se pare cen . P. Divenyi dern ostro, sin embargo, que las di ­ ferencias espectrales no cuen ta n si se man t iene la envo Ivente temporal (Di venyi, P., 1992 ). Esta co ncl usi6n es razona ble, pue s las reflex iones pueden mod ificar el espectro de la sefial por disto rsion arm6 n ica. • EI efecto es mas not orio en el plan o horizontal , aunq ue tarnbien apar e­ ce en el plan o medi o. • EI efecto de preceden cia puede tornar algun tiempo en aparecer (muy , importante en grandes salas e iglesias) . • C iert as modific acion es en las co ndiciones aciist icas de l arnbiente pue­ den destruir temp orariamente el efecto de precedencia. • La h abilidad para detectar carnbi os en e l intervale te mporal del estfrnu ­ 10 retras ado puede mej orar no tableme n te con la practica. EI efecto de prec edencia no involuc ra un a cornplet a supresi6n de la infer ­ ma ci6n de los "ecos". EI oyente puede distin guir cualita t ivamente cua lquier cambio en el patron temporal de los esn rnulos. Es mas, este pa tr6 n aporta in­ formaci on sobre la sala y la posicion de los objetos y paredes en ella. EI efec ­ to de precedencia segur arnente aparece en un nivel relati varnen te alto del proceso cogn it ivo. Parece que los posib le "ecos" son suprim idos despues de h a­ ber sido evaluados co mo con sisten tes COil las exp ectati vas del oyen te en rela­ ci6\ con la fuente aciistica y al arnbien te. Cu ando oc urre un carnb io inesperado la mascara del efecto de precedencia puede ret irarse momentanea­ mente . En el grafico de la figura 10 se puede ver con claridad la regi6n de va­ lidez del efect o de preced encia. En la region super ior las reflexion es super an los lim ites del efecto de pre ­ cedencia y se las percibe co mo ecos aislados, en la parte intermedia las refle­ xiones aportan informa ci6n espac ial del ento rno aciist ico, y en la region

203

20

I

i

I

I

I

i

I

I

10

Altavoz 2

Eco

rn

//1\"'­

~

.§ 'x Ol

g

0 E:r}Sqr}Ch

0=

q0ier}1.

~ -10

a E:s qCiq,· ". P •••• • 'I(jq(j

-'"

Ol U

(je

I.

q i0

c

qPer)

~ -20

Posici6n deloyente

Altavoz 1

~

'/

Figura 11. Sistema de refuerzo electroacustico con dos altavoces distantes entre sf

Z

Reflexi6n inaudible

-30

B

A -40 0

rn 10

20

30

40

50

60

70

80

Retardo de la reflexi6n (ms)

Figura 10. Region de validez del efecto de precedencia

~

c

'0

'u o,

Altavoz 2

Ol

u ~

Altavoz 1

-'"

Ol

U

inferior las reflexiones se vuelven inaudibles, Cuando las reflexiones poseen retardos iguales 0 menores a Lrns aparece el fen6meno de fi/era en peine, que se oye como una especie de coloraci6n espectral."

u cc u 'iii c

2

c

Tiempo de recepci6n (ms)

Refuerzo electroacustico en grandes espacios El. efecto de precedencia se emplea para preservar la localizaci6n espacial de la fuente fisica cuando se emplean varios altavoces separados por distancias significativas, Por ejemplo, en el sistema de dos fuentes electroacusticas de la figura 11, el oyente percibiria antes y con mayor intensidad al altavoz 2. El al­ tavoz 1, cercano a la fuente fisica, se manifestarta como un eco. La secuencia temporal que le llega al oyente se aprecia e la figura 12. Es evidente que percibira como fuente acustica primaria al altavoz 2. La soluci6n a este problema consiste en retardar la serial del segundo al­ tavoz hasta ubicarla dentro del limite de Hass. El esquema del dispositivo se muestra en la figura 13. El resultado final se puede evaluar en el grafico temporal de la figura 14. Ahora se recibe primero la sefial del altavoz 1. La serial del altavoz 2 ocu­ pa una posici6n que cae dentro de los lfrnites establecidos por el efecto de pre­ cedencia. Para el oyente la locaci6n de la fuente queda establecida por el primer sonido que le llega, que es el que emite el altavoz 1. 4 Comb filter

204

en ingles (Basso, 200Ia).

Figura 12. Diagrama temporal en el punto de recepcion a partir del sistema de refuerzo electroacustico con dos fuenres

_._ ..... _---­ Micr6fo no

-.

// I\""-

Altavoz 2 retrasado 0, + 20 ms



Altavoz 1 sin retardo

-0

-

~

7

deloyente

Figura 13. Aplicacion del efecto de precedencia a un sistema de refuerzo electroacusrico

205

Rango del etecto Hass 0 de preeedeneia

I ~ Allavoz 2

lD

:s -0 -0 '" .u;

Altavoz 1

con retardo de senal

.i->:

c

2

oS

Tiem po (ms)

Figura 14. Diagrama tem po ral en el punro de recepc ion luego de insralar el d isposi rivo de rerardo

5. PERCEPCION

DE LA DISTANC IA

Figura 15 . Co nsta nc ia visual de tarnafio. La ca beza mas cerca na al observador tien e el m ismo tam afio que la "gran cabeza" alejada

H asta ahora ana lizamos los rneca nis mos empleados para de term in ar la d irec­

cion de llegada de las ondas ac ust icas desde una fuente externa. N os qu ed a po r ver de q ue rnane ra eva lua mos la distanc ia a la q ue se encuen tra d icha fue nte . En e l sis te ma de coordenadas esfericas de la figura 1, al comienzo de este ca­ pi t ulo, nos fa ltar ia deterrninar la di st anci a r a la que se encuen tr a la fuen te.

Pe rspectiva auditiva La perspec ti va ac ust ica , al igual q ue su co n traparte visual, es un a imp or tan te fue n te de in for m ac ion ambien ta l. Las imageries acu sticas de gran desarroll o en azim ut se red ucen a un pun to a gra n des d istanc ias, Por ejemp lo , e l an cho actis­ tico aparente de un a o rques ta sin fon ica , m uy gran de en las prim eras butacas de la platea, d ism in uye a unos poco s grado s al o frla en un parq ue a 300 m de d is­ ta nc ia.! El efec to es eq uivalen te al de las lin eas paralel as q ue co nvergen en e l in fini te. S i contin uarn os d esarr o llando la an alogia con el sent ido de la vista, se pod rfa dec ir q ue la son o ridad d ism in uye co n la d istanc ia ta l como oc urre co n e l ta rnafio apa rente de los ob jeto s y que la defin ic ion t fmbrica se ateruia de modo sim ila r al grad ien te de co lor en la v ision. 6 Aunqu e no siem pre estu­

5 El pararn etro subjer ivo emp lead o en acust ica de salas se den om in a "anch o apar enre de la fuente" (AWS), bien co rrelac ion ado con el fact or objetivo de espacialidad (I -IACC). 6 La ana logfa co n el sentido de la vista , aunque inexact a, resulra ut il pa ra eje mp lificar los diferentes aspecro s irnp licados en la percepc i6n de la pe rspecti va auditiv e.

206

d iad a en de talle, la d istancia apa rente de la fuente ac ustica que defin e la pers­ pectiva auditiva cornp one una impo rtante d ime nsion psicoac ustica . Los in ves­ t igad ores que desarroll an d isposit ivos acust icos para el ci n e y siste m as multimed ia ha n conc cntrado gra n pa rte de su in teres en el perfecc ion amien­ to de mod elos vi rt ua les de perspectiva auditiva. La sonor id ad, cuan do inte rv ien e co mo un pa rarnetro de en trada pa ra ev a­ luar la d istanc ia de las fuen tes ac iist icas , deja de ser un correlato un idi mens io­ n al de la in tensid ad fisica pa ra co n vc rtirse en un rasgo co mplejo que in vo lucra m as de un a di mension. Los objetos en e l mundo son, en gen eral, de tarnafio constance, pe ro la im agen de un o bje to en la retin a c rec e y decrece cu ando es­ te se acerca 0 se aleja de n oso tros. Este heche es co nocido co mo constancia de tamano. En la figura 15 se puede aprec iar un a ilust rac ion c lasica de la constan ­ c ia visua l de tarnafio. En e l dorn in io de la audicion la constancia de fa sonoridad funciona de mo­ do ana logo a la co ns ta ncia de tarnafio pa ra e l sen t ido de la vista . S i un a fuen­ te acu stic a de in te n sidad cons ta n te se aleja de n oso t ros a campo libre, la inten sidad ffsica que nos llega d ism inuye prop orc ion a lmen te con el cu adrado de la d istanc ia. N o de be sorprendernos en to nces q ue un a fuente cuya intensi­ dad decrece parezca aleja rse. Es dec ir, tarnbien podemos exp erimen tar la sen­ sac ion de ofr una fue n te aciistica que d ismi nuy e de in tens idad sin alejarse - un in str urnen to m usical en decrescendo-, cuyo eq uiva len te en el ca mpo v isua l po­ d rfa ser un globo que se de sinfl a. 207

............

'I

Imaginemos un experimento: un oyente observa a dos cantantes, una cerca­ na y la otra alejada. La cantante "cercana produce un son ido pp, mientras que la otra ernite el mismo son ido pero en ff. Los sonidos poseen la misma altura ton al y dur acion. Si al oyente se le pide que evalue la son oridad de amb as cantan tes, dira que la mas alejada supera a la cercana. Supon iendo que la intensidad del pp sea 1/128 de la intensidad del ff, y que por estar a 50 m la intensidad de la can­ tante alejada llega con 1/2.500 (l/d 2 = 1/50 2) de la emit ida, la onda cercana po­ see alrededor de 20 veces mas energia que la alejada. Sin embargo, el oyente insistira con su afirmacion. En la figura 16 se puede ver este experirn ento. El experimento anterior muestra que ex isten otros datos no to mados en cuenta, diferentes de la son or idad , que nos aportan informacion sobre la in­ ten sidad fisica y la distan cia de las fuentes acust icas. H asta aquf no to mamos en cuen ta el ca mbio espe ctral operado en las sefiales de las cantan tes en fun­ cion del esfuerzo vocal. En gene ral, la en volvente espect ral cambia de forma -para favorecer a los armonicos mas agudos- a medida que la inten sidad y el esfuerzo vocal aume nta n, La figura 17 sinte t iza los trabajos de John Chowning en una can tidad de experimentos sim ilares al expu esto (Chowning, J., 1999). Represents una ge­ neralizacion del cambio de la cornposicion espectral en funcion de la altura tonal, la dinarnica y la distan cia, A cau sa de la gran ca ntidad de dimensiones necesarias para describir los datos ffsicos se han incluido espacios bidimensio­ nales (espectros de potencia) de n tro de un espacio tridimensional cerrado . Es posible ahora comprender al oyente del experimento: no juzgaba la dis­ tancia y la sonorid ad de la fuente unicamente a partir de la int ensidad que per­ cibia. En la figura 18 se esquematiza una situac ion simetri ca a la de la figura 16. Una fuente de inform acion ad iciona l la proporciona la reverberad6n del recinto. La relacion entre la in tensidad de la reverberacion y la onda directa es interpretada por el oyente como un indice de distancia, En un espacio ce­ rrad o tlpi co la in tensidad del ca mpo reverberante no varia co n la distan cia a la fuente, mientras que el son ido directo sf 10 hace . Sabemos, por experiencias previas, que el n ivel del cam po reverberan te depende de la intensidad de la fuente que 10 excita y usamos este conocimiento para evalu ar la intensidad y distan cia de las fuen tes acust icas en recintos cerrados. En la figura 19 se comparan dos sena les inrner sas en el mismo ca mpo re­ verb erante. La serial A se ubica a cinco unidades de distancia del oyente y po­ see un a intensidad relativa seis veces menor que la serial B, a una distancia de dos un idades. Ambas llegan al pun to de recepcion con la misma intensidad di­ rect a. S in emb argo, la relaci on co n el cam po reverberante aporta la inform a­ cion necesaria para ev irar la confusion de distanc ias sin ne cesidad de apelar a diferencias espectrales. 208

i-Cual de ellos se percibe con mayor intensidad ?

Figura 16. Co nstancia de sonoridad

I.Ja intensid ad decrece cuand o la distancia aument aO IJI cambia de la envalvente espectral es minim a

if "' 0

">! t::!

E '"

"'" CUi::>

o ~

pp

Oltura

Menos parciales y cambios en la envolvente espectral debidos al cambro de altura

Figura 17. Espacio disranc ia-inrensidad-frecuencia segun Chowning

209

Debe cantar muy fuerte para producir la misma intensida~

Canta

Figura 18. Pcrccpci6n de la d istancia: los son idos de ambas can tan tes poseen para el oyen re la rn isma in tens idad, pero la composici6n especrralle perm ite al oyen re saber que la mas alejada canta en ff

Si amplifica mos seis vec es

la serial a 5 m, obtene mos

el mism o nivel qu e a 2 m

ro

'0

'iii

Selia ! directa

t:



E

,'(' J ] ) ······1

~

,:

,,,

:

,/ "

/ ......'

ZOOM / 6X

~

A

~

.

2

I

~

3

4

I

6. PERCEPCl6 N DEL MOVIMIENTO .

~

/ ,"

B '0

,/ ,,

Pero la reverb eraci6n ha aum ent ado su nivel seis vece s, indicando que si la se iia l es mas intensa , no por eso la fuente es mas ce rcana

J

...­ 5

Reverb eraci6n ....

~ 6

Oistancia de la fuente

Figura 19. Raz6n serial direcra/carnpo reverberante en funci6n de la distancia

2 10

A unque la analogfa co n el sent ido de la vista nos ha resultad o ut il hasta ahora, deb e serialarse qu e la co ns ta nc ia de sono ridad es mas compleja qu e la co nstanc ia de caman o: pocos obje tos visuales varian de ta rnafio ante nuestros ojos (com o en el ejemplo de un globe qu e se desinfla), pero las fuentes acus­ ticas varian norrn almenr e de int ensidad en lapsos muy bre ves, espec ialmente en miisica. Por eso quiza el mecan ismo de percepcion asociado a la constan­ cia de son orid ad necesite informacion relacion ada co n indices espectrales y con la interpret acion de la relacion sefial direct a/senal reverberant e, La eva­ luacion aislada de la inten sidad parece no alcanzar. En gen eral, los juicios audit ivos sob re la distancia a la que se encuen tra una fuente aciistica son relati varnen te imp recisos, y los erro res con relac ion a la d istancia ffsica son del orden del 20 % en situaciones normales . Es in teresan te descri bir 10 que ocurre cuando los oyentes son pri vados de alguno s de los dat os men cionados. Por ejernplo , en el campo libre no acnia el sistema de eva luacion de la pe rspec tiva relacionado co n la reverbe raci on y la precision de los juicios con relacion a la d istan cia se reduce sign ifica tiva men ­ te o Estas sit uac iones se han estud iado en exp erienc ias de laborarorio , co n fuentes sin usoidales ubicadas en ca rnaras ane coicas, en las se preserva sola­ men te la informacion relacion ada co n la in ten sidad ffsica.

La habilidad para percibi r e l mov imiento lateral de una fuente aciistica se mi­ de em pleando el mfnima cingula de mavimienta audible (MAMA). Los experimen­ tos han mostr ado que el sistema audit ivo es poco sensi ble al rnovirniento de las fuentes aciis t icas, aunq ue se co rnporta mejor ante movimientos len ros. Pa­ ra desp lazami en tos angulares del orden de los 15°/s, el MAMA es de 5°. Pero pa­ ra movimi entos angulares veloces, del orde n de los 900/s, el MAMA crece hast a llegar a 21 0. El eJecta Doppler, responsabl e del cambio de altura en las siren as de las ambulancias cuando pasan a nu estr o lado, es una importante fuente de infor ­ maci on sobre el carnbio en el sen tido del movimien to relati ve entre el emi sor acustico y el oyen te. Es un fen orneno ffsico que hace qu e la frecuen cia aparen­ te en el punto de recep cion aurnen te si este se acerca a la fuente y que dismi­ nuya si se aleja de ella. En la figura 20 se ilustra el caso con una fuen te aciistica en movimiento hacia un receptor en reposo. S i la fuente se encuen tra qu ieta la onda acustica llen ara la distan c ia FR que la sepa ra de l receptor en un tiempo ~t == FRIc. con c com o la veloci dad del sonido en el aire. La longitud de onda en este caso es A = FR / J~t. Pero 21 1

.......

Espac io acustico virtual

si la Fuente se desplaza hacia el receptor a velocidad VF la onda aciis tica reco­ rrera en el mismo tiemp o un a disran c ia menor F'R. La Fuente se h abra movi­ do en ese lapso un a d istancia F'R - FR = VF 6.t y la nueva longitud de onda sera 'A ' = F'R / I 6.t. Tom ando en cuen ta la relaci6n general v = 'AI y luego de algu­ nas operac iones algebra icas senc illas se tiene que :

f'=

c - VF

c-

I

Fuentes acusticas \\

~"~~"

En la ecuac i6n anterior I es la frecuencia de la seria l emitida por la Fuente y i' es la frecuen cia aparen te en el punto de recepc ion . S i se cons idera tam bien la posibilid ad de movimi ent o de l receptor a veloc idad VR la ecu aci6n se modifi­ ca levernente:

~

f' = ~ 1 c - VR EI efect o Dopp ler se emplea desde h ace tiempo en rnusic a elec troac ust ica a part ir de modu le s espec fficos de proce sarnie nto. Casi no es necesario co rnen­ tar la impor tan c ia que tiene un a buen a simulaci6n Doppler en el caso de los efec ros espec iales para c ine y multimedia. En cuan to a la percepcion del efecro, se reduce a la percep cion de una va ­ riaci6 n co n ti n ua de frecue nc ia, qu e ya examinamos en el capitulo Il l.

7. CAMPOS A CUST ICOS VIRTU A LES En un ca mpo ac iistico habitual, con el oye n te inmerso en su interi or, la in ­ formacion espacial depende de los con ocidos datos espec t rales, tem por ales

F

D \/\/\ R V C~V I I

)

~f\

v, F'

f\

f\

V\J\J\J R

reales

Espacio acustico real

F igur a 2 1. Camp os acusticos definidos por un sistema estereofo nico bicanal

(ITO) Y de inten sidad (lID) que apo rt an las seriales qu e Ie llegan a ambos of­ dos . En un sistem a elec troac iist ico de reproducci6n, sin embargo, a la infor ­ mac ion anterior se suman las referencias espac iales cod ificadas en la serial grabada. Por ejemp lo, el registr o de un co nc ierto en un gran audito rio contiene in­ formaci6n sobre la reverb eraci6n y las ca rac terfst icas espectro-ternporales de la sala. A simismo , es funcion de los vfnc ulos espac iales entre cada insrrumen­ to y cad a uno de los microfon os ut ilizados. C uando esta grabac ion se reprodu­ ce en otro recin to a traves de un sistema estereofon ico bican al, el campo acustico qu e pe rcibe el oye n te se desdob la en tre: a) un campo acUstico real, que es en el que esta inmerso y qu e detect a a partir de los son idos que el mismo pro duce -com o voz hab lada, ruidos de pisadas, etc .- y b) un campo (U;ustico vir­ tual generado por la Fue nt e elec troac ust ica a part ir de las referencias cod ifica­ das en el registro origina l. En la Figura 21 se puede ver un esquema que ilustr a d icha situ acion.? Por supuesto qu e el ter rnino "real" esta cmpleado aqu f co mo una euqueta pracuca, sin connotaciones episte rnologicas. En cierto scnt ido, por supuesto, ambos campos aciisticos son "reales" a su rnane ra. 7

Figura 20. Efecto Doppl er con una fuente Fen rnovimien to a velocid ad ceptor R en reposo

212

VF

hacia un re­

213

La situac ion ideal serta q ue el ca mpo acu st ico real no in te rfiriese negat i­ varnen te co n el espac io ac ustico vi rt ual q ue defin e la grabacion . Pero esto ocurre po r 10 gene ra l en salas de aud ic ion cuidad osam ente diseriadas, por eje mp lo un a sala de co ntrol de un estu d io de grabaci6n . Lo h ab itu al es que el camp o acust ico de la sala real degrad e la informacion espaci al que con t ienen las senales elec t roaciisticas . Aunque en el ejemplo n os referimos a un siste ma este reofon ico bicanal, 10 m ismo oc urre ca n los de mas sistemas de espacializa­ ci6 n elect roacust icos que ex iste n en el mercado, tales com o las diferentes ve r­ sione s co nocidas co mo surround 0 las que se derivan de la codifi cacion Blumlei n

Capitulo VI n Percepci6n de objetos auditivos

original.'

8. RESUMEN N uest ra habilidad pa ra local izar sonidos es muy buena en el plano hori zontal , algo men or en el p lano vert ica l (elevacion ) y regul ar para la d istan cia, La locali zacion espacial es el res ultado del procesam iento comb ina do de da to s. Para Fuentes acus t icas co rrien tes los dat os descrip tos en este capitulo son accesibles simul ta nea rnente, al menos en circun stan cias no rrn ales. Es esta riq ueza de informacion, muchas veces redu nd ant e y refo rzada par da tos visua­ les, 10 q ue hace la local izacion mas prec isa y co nfi ab le. Un capitulo apa rte po d na dedica rse al disefio de ca mpos ac iist icos vi rtua­ les. Todos los irnplernenrados h asta ah ora , de sde los disposit ivos rnonofon icos h ast a los ac tua les algoritmos de espa cializacion para cine y mu lti med ia, pasan­ do pa r la estereofonla bica na l, h acen usa de las citadas capac idades aud itivas . En algunos casas , la contrad icc ion entre datos de entrada (p ar eje rnp lo, un a [[ 0 q ue corresponde a una Fue n te a la izquierda del oyen te con un a de ITO re­ lacion ada can la rnisrna Fuen te ubicada a la izquie rda) puede degrad ar e inclu­ so destruir la loca lizacion audi t iva .

Desde A rist6t eles, la pe rcepci6n se ent iende co mo el proceso a traves del cual util izamos la informacion provista par nu estros sentidos para ar mar represen ta­ ciones me ntales del mundo q ue nos rodea. En gen era l, desde una per spec tiva realista (la de Aristoteles 10 era ) la tarea de la percepc i6n es tamar los da tos de los sentidos y ded ucir de ellos un a representacion util del arnbien te exteri or. En la vida di aria n o percib imos los rasgos del son ido - alt ura, sonorida d, ti mbre, dura cion- de modo aislado , sin o q ue los in tegra mos en la representaci on de Fuentes acu sticas u obje tos audi tivos . U na pa rte importante en el proceso es decid ir q ue partes de la est irnulac ion sensorial co rrespo nden al mismo objeto a even to ambien ta l. La for ma final de ca da represen taci on mental de un ob­ jew - visual 0 aud it ivo- for mado a part ir de un cie rto agrupa m ien to de da tos senso riales, es un a propieda d eme rgen te . Esta pro p iedad n o corresp onde a n in ­ guno de los dato s to rnados de manera individu al y surg e a partir de nu estr a capacidad de organ izaci6n psiquica de los datos. La c ita de Helmholtz repro­ ducida en el capitu lo [[ ("[...] esta mos muy bien entrena dos para evaluar los objetos q ue n os ro dea n , pero fallamos com p let arnente cuan do interitarnos ob­ servar las sensaciones per se [...]") alcanza aquf p lena signi ficacion .

1. ECOLOGiA ACUST ICA Y ANA uSIS AUDlTIVO DEL ENTORNO

8

Pa r eje mplo, Do lby-Surround, Dolbv-Digira l, T HX, Ambisoni cs y muchos orros.

A lbert Bregman llama aruilisis awlitivo de escenas al proceso q ue pe rm ite reu­ n ir en una un idad perceptiva el co n jun to de datos provenientes de un a fuen­ te aciistica ex tern a (Bregman, A. , 1994 ). Estric tarnen te , ca da oido no recoge mas que los camb ios temporales de la pres ion ac ustica en el timpano que le corresponde. U n agregado awlitivo es, segiin Bregman, la asoc iacion de las par­ tes del espectr ograma ne uronal (conjunto de dat os senso riales) que parecen pertenec er a un mismo evento pe rceptual. U na Fuen te ac iistica es una entid ad ffsica que gene ra o nda s en el aire. Un agrega do auditivo es un percepto ca u­ 215

214

->:

--sado por un grupo de elemen tos sonoros que se exp erimenta como un to do y que parece em an ar de una unica Fuente ac ust ica ext erna.! Normalmente, las propiedade s em ergentes que definen cada agregado estan co rrelac ion adas con las propiedade s de los obje tos fisicos asoc iados. En vision se pued e describir el probl em a del analisis opti co del am biente en terrninos del co rrec to agrupa mien to de las regiones estimuladas en la ima­ gen retinian a. En nu est ro caso [que elem entos se deben agrupa r para ensa m­ blar un son ido 0 , me jor aun , un obje to ac ust ico? N o es pos ible co mpa rar las estrategias de agrupam iento de ambos sen tidos pu es existe un a diferencia cru­ cial en el modo en que usam os la energia ac ustica y la lumfn ica para obten er informacion del mundo ex terior. En audicion, h acemos uso de la energfa erni­ tida por los objetos (las Fuentes acusticas) y cas i n o to rnamos en cuenta la energfa reflej ada en otros objetos fisicos. Se podrla afirma r que existen al me­ nos tantas Fuentes ac ust icas co mo objetos sonoros en una situacion normal. Las reflexiones - qu e carnbian en funcion del contexto espac ial- degradan la informacion que n os llega de cada una de las Fuentes. En co nsec uenc ia, ne ce­ sita rnos aten uar la informacion que llega por reflexi6n y co locar en primer pla­ no la qu e nos llega dir ectamente (en una sala de co nc ierros situ arnos a ud it ivame nte el piano en el escenario , aun cuan do gran parte de su energfa n os llega por reflex ion desde las paredes y el c ielo rraso de la sala ). Por el con­ trario, la informaci6n visu al esta causada princip almente por la reflexi6n de la luz en los objetos de in teres. Encendemos un a larnpara n o porque nos intere­ se mirada, sin o para ver por reflex ion los objetos de la sala. A diferencia de la gran cantidad de Fuentes ac iist icas que nos aco rnpafian desde siempre, hubo una sola Fuente de luz a la vez a 10 largo de gran par te de nues tro recorrido evo­ lutivo, En resum en, los dat os auditivos y visuales son dife re n tes y se comple­ mentan para brindarnos un pan or ama ve ros irnil del mundo ex terior.

z. lNFORMACl6 N UTILlZA DA PARA SEPARAR LOS OBJETOS AUDlTlVOS La fusion 0 fision simu ltanea de la informaci6n aud it iva y la co nstrucc i6n de agregados son ejemplos de organ izacion perceptual. A partir de ellos analiza­ mos el entomo ac ust ico al distribuir los datos sensoriales entre los diferentes objetos auditivos po ten ciales. Podemos ilustrar la distinci6n en tre los concep­ tos de Fuente ac ustica y de agregado acustico a part ir de las sefiales de la Figura 1. En ella se yen varias on das aciisticas aisladas que se h an reunido en el ulti Es una rraducci6n (q uiza no muy feliz) de auditory stream ("corrien te", "flujo ''} , C reernos, sin embargo, que el terrnino "agregado" describe acepra blernenre la idea de Bregman . I

mo grafico. Es mu y diftcil distinguir cada compone nte en la mezcla fina l, pero realizam os esta operaci6n inmediatamente con el ofdo (si pud ierarnos rep rodu ­ cir las sefiales en un equipo de audio) grac ias al proceso de agrupamiento per­ cept ual. Cada un a de las Fuentes co rresponde a un solo agregado ac iist ico. Pare ce hab er di ferentes mecanismos de segregac i6n audit iva qu e respon­ den en func i6n de la tarea a realizar. C uan do los oyentes intentan mantener int egrada en un solo agregado una secuenc ia de sonidos, la segre gaci6n es in ­ voluntaria y opuest a a sus intenciones. Pero cu ando los sujetos se esfuerzan en separar los sonidos la segregaci6n apare ce co mo un proceso de sele cci 6n pr o­ vocado po r la ate n cion . La existencia de estos dos mecanismos explica los di­ ferentes resultados que se obtienen en las pru ebas experimentales cuand o se vari a alguna ca rac te rfstica aciistica en la sefia l de entrada. Las diferenc ias ti m­ bric as entre son idos musicales, por ejernplo, faci liran mucho la segregac i6n . Pero si la sec uenc ia se basa en otro facto r de agru pam ien to d ifere n te, co mo puede ser la vari aci 6n de la altura to na l, las diferencias tirnbricas no provocan necesari am ente la segregac i6n. El sistema aud itivo emplea diferentes datos para separar los obje tos aud iti­ vos. En 10 que sigue describiremos los masdestacados. Debe tenerse en cuenta que n o siemp re se util izan todos los datos en todos los casos: el agrup amien to per cep tu al n o es un proceso a "todo 0 n ada". En un a situacion complej a se ob ­ serva con frecuencia que el dato saliente en masca ra y oscurece a los menos acentuados, mecanismo que nos permite man tener la eficiencia perceptual aiin cuando no este presente toda la informacion esperada . En el caso del t imbre, que depende de un a gran cantidad de entr adas audit ivas co n currentes, el con ­ texto juega un papel determin ante a la h ora de dec idir cual dat o es sign ificat i­ vo , y cual no 10 es. El "efecto de cafete ria" (0 "cockta il part y") pon e de rnanifiesto la eficac ia de nu estra capac ida d para separa r los di ferentes obje tos aud it ivos , Podemos manten er una co nve rsacion sin in convenientes en un arnb ienre co n gran con­ tarninacion por ruido . Si n embargo, si registrarnos con un microfono di ch a conversaci6n y la reproducimos mas tard e h ab rem os perdido algunos dato s esenciales para sep arar la Figura acustica del fondo de ruido y el discurso se vuelve ininteligibl e. A conti n uaci6n describiremos los rasgos de la in for mac i6n acustica q ue permiten agrupa r 0 separar los diferentes objetos ac iisticos entre sf.

Armonicidad y fr ecuencia fundamental Un co njun to de parc iales perfectamente arm6n icos t ienden a fusionarse en un so lo artefac to perceptu al, pues com part en la misma altura tonal , defini da por

Z17

216

->

~

1

~2

Voz humana

1 -6 ~

III

~9

-12

~ ~n

-g

::=

-0,

Q.

-21 ·15


-12 ~9

E

MMMvWNMAMMAM

~6

4 ~3

~2

",

I 0,005 0001 0 0,015 0,020 0.025

co»

0.Q:l5 O,CMO 0.00 Qt.6:] 0,lY.:6 O.ettl 0,((6 O.G1O

o.o ~

O,CfI)

coes

O,COO 0.(9$ 0.,

Tiempo (segu ndos)

la componente fund am ental de la ser ie. De acuerdo con este criterio, si dos es­ tfmul os sirnultaneos de espectros perfe ctarnente arrnonicos tien en diferentes frecuencias fund amenrales, se ove n separa dos.! U na desafin acion del 3% es suficiente para que un arrnonico se perc iba segregado del co mplejo (siernpre que su dur acion exce da los 400 ms), Para el sonido co mplejo restante, el efec­ to de la desafin ac ion del arrnon ico es sim ilar al que oc urre cuando se reduce el ni vel del arrnon ico en cuestion hasta vo lverlo ina ud ible. La fusion par ar­ monicidad fue uti lizada desde el med ioevo para combinar los registros de or­ gano y constituye un recurso clasico en orquestacion .

I

~

~2

Disparidades en el ataque

Impresora

1 -6

i

iD E


~~i~ I'V~~,'V\~"14r/1'~V~

WW'\;l_l" \i\f/\t.h~ft"W/VWV

-12 ~9

-6

-4

-a ~2 ~

1 0.005 0.010 0,015 0,020 0 .025 0030

cess ooeo

0.045 0.050 o.CC6 0.000 O.o:l> 0,011,)

O,07~

0,00(1 0,065

oosc

0.095

0.1

Tiemp o (seg undos) ~

1

~2

Alarma

1 -6

~I~~I

It"
~9

-6 4

~3

~2

-1,

I 0,005 0,010 0,015 0,020 0.0250,0300,035 O.G«l

O .~5

0,1%'0 0,0500,00J 0,1:65 0,070 0,075

o .~

0,085

o,COJ

0005

0,1

Tiernpo (seg undos) ~

1

~2

Rasch investigo la h abilidad para ofr un sonido complejo en presencia de otro semejante (Rasch, R . A., 1978). Cu and o la unic a diferencia entre ambos es la frecuencia fund amental, la serial debe estar por enc ima de los -20 dB respec­ to del sonido enmascarante . Pero si la sefial com ienza 30 ms antes del enrnas­ ca rante, se la percibe aun cuand o su n iveillega a apenas -60 dB (figura 2). La serial puede seguir percibiendose aunque cese de inmed iato despues del ataque del son ido enmasca ran te (este efecto se relacion a con el fen orne no de conti­ nuidad que veremos mas adelan te).' El valor de 30 ms corresponde aprox ima­ damente a las imprecisiones de ataque que se enc uen tran co n frecuencia en la musica instrumental. Esta capac idad de agrupamiento par disparidad en el ataque refuerza la idea trad icional de que las asinc ron fas son un factor irnpor­ tante en la percepcion separada de las voces en la musica polifonica. En un expe rimento relacionado co n las dispar idades temporales en el ata ­ que , Robert s y Moore dernostraron que sin usoides ex trafias agregadas a un a vocal puede n influir en su calidad t frnbrica, pero que esta influencia se redu ­ ce not ab lemen te si el elemen to extrafio apa rece ant es 0 despues del inicio de la vocal - se segrega de ella (Moore, B., 1997).

Mezcla

1

i~· ~~NW~N~~','~~"

Contraste con sonidos prcvios La percepcion de un est fmul o es afectada por los estirnulos inmediatamente precedentes. En gene ra l, al nue vo est fmulo se le resta algo asf como el "nega­ tivo espectral" de los an teriores.

-4

~ 3

~2

~1~~~. 0.005 O()1()

O.O1 ~

c.~

O,uz. O.DX

1:~

QOW O,().l5 O.D50 0.056 a,ClEO OJ1i5 0,010 o,OTS O.OOCI o.e:a-- O]:J JJ 0);1..e

Tiernpo (segundos)

Figura 1. C uatro sefiales separadas reun idas en eI ultimo grafico

218

(),1

Las relaciones entre espectro arrnon ico , period icid ad y ton icid ad se exponen en el Apendi ce 1.

J Alg unos cantantes 10 util izan para co nseguir pianissimos sorprende nres (y, estrictarnen te

hablando, inaudibles a no ser por el mecan isme cirado).

Z

219

,

Enmascarante "0

:ec.

III \ I \

E

<{

,

Enmascaranle "0

.~ C.

IlL

E

<{

"

III ~ ~

Enmascarante

,

"0

,?

c. ~

:

Frecuencia

: Senal Tiempo

Figura 3 . Espectro de poren c ia de dos sen a tes sucesivas. EI tercer grafico representa

Fi gura 2. Expe rirnen ro de Rasch

especrro percibid o por el oyen re

Tarnbi en se verifica un efect o sim ilar cuando ocurre un ca mb io en el est i­ mu lo, que puede ser interpret ado com o que el esrfrnulo de part ida se sustra e del estfrnulo fin al. El rasgo modificado se separa percep tualmente del resto y la par ­ te del est fmulo q ue perrn anece estab le se reduc e h asta su niv el de adap tac ion , U n ejemp lo n ot ab le de 10 an terior se da al ofr un est irnulo co n un a estruc­ tu ra espec tra l part icular, segu ido inmed iatarnente por ruid o b lanco (espectro p lan o) . El ruido blanco aislado puede ser descrito com o "n o co loreado ", Sin embargo , en la secuen cia comp leta se oye un a estructura espectral "co lore a­ da", que corresponde al espectro de la primera serial invertido (figur a 3 ).

Localizaci on de la fu ente

Correlac ion de los ca mbios en amplitud y fr ecu en cia Ra sch tarnbi en noto qu e , aun cuando do s sin usoides com iencen en sinc ron ia, es posible ac recen ta r la sepa racion perc ep tu al modu lando en frecuen cia la mas aguda (Rasch, R. A., 1978) . Este proced irniento permite reduc ir el umbral de pe rcepcion de 1a serial de mayor frecuenc ia en 17 dB . En real idad , el expe ri­ menta de Rasch no es mas q ue un caso particular de un a caract erfst ica gen e­ ral de la percepc i6n a udi tiva: los son idos que presentan camb ios "co here n tes" tienden a fusionarse per ceptualmen te , mientras los que presentan variac ion es in coh eren tes ent re sf t iend en a segregarse.

220

\

el

M uchas veces las diferen cias espac iales jue gan un papel importante en el an a­ lisis auditivo de l entomo al fac ilitar 0 dificu ltar la segregac ion basada en otros factores." Sabem os, por ejemp lo, que un a serial se detecta co n mayor fac ilidad cua ndo su ubic aci 6n espaci al difiere de la de l ruido enrnascarante. Shackleton y sus co legas in vesti garon la h abi lidad para identificar cada vocal en un conjunto de dos voca les concurrentes. Encontraron que una dife­ rencia de frec uen c ia fund am ental entre las dos mejora la identificacion en un 22% , mientras que un retard o de 400 us-correspond ienees a un a d iferencia en azim ut de 45°-la mejo ra s610 7% (Shack leton, T. M. et al., 1992). En resum en, el mecani smo de segregac i6n espectral parece scr mas poderoso que el espaci al. La preg unea es, en to nc es, !po r que los humanos no le dan pr ioridad absoluta al ind ice espac ial? Y la respuesta se enc uentra en la base de n uestra estr at egia au­ d it iva , centrada en la percepci6n de fuentes y no de reflex ion es acu sticas. Las sen ales provenientes de la fuente pueden h aber sido reflejados muchas veces en Recordemos que la localizacion de la fuente se refiere al rnundo fisico mientras que la la­ ter alizacion de l son ido pertenece at un iverse de las represenracion es men tales (ve ase el ca­ pftulo vu).

4

221

fari zar parte de la in formaci on c uando e l co n texto - 0 la tare a impuest a- se 10 demanda. En a lguna s ocas iones la local izac ion (0 la lar eral izacion) del so n ido ocupa un lugar fund am enta l en la seg regacion de los o bjeto s audi ti vos. U n buen ejernplo 10 brinda n uestra ca pacida d pa ra rnan te n er una conve rsacion en amb ien tes mu y ruid osos.?

Periodicidad y fusion perc eptual

Directo Prim eras reflexiones

CD ~

"0

co

"0

'in

Reverberaci6n

c w

E

o

Tiempo (ms)

Figura 4. Patron de ref1e xiones en una sala median a y grafico te mporal de la ener gfa que

llega a un secto r de la platea

e l amb ien te , 0 pu eden haber sido at enuados por la presencia de un o bje to ce r­ cano, hechos que deforman la informacion relativa a su posic io n . En la Figura 4 se ilust ra esta a paren te co n fusion de Fuen tes rea les y v irtua les. El eiecio de precedencia (0 efec to H ass) nace de la n ecesidad de locali zar un fvocam ente cad a Fuente ac ustica a un en pre senc ia de un gran mirn e ro de re­ flex ion es ternpran as.l En e l experimen ro de S h ackle ton y M ed d is las refle­ x ion es n o mo d ific an la frecu encia fund amenta l n i las relaci ones arrno n icas de cada voca l. De heche , en un con tex te normal las sefiales no arm on icas y de banda anc ha son las q ue ap ort an la ma yor parte de la in formaci on espa c ia l. A unq ue la n ecesidad de a te n uar e l efec to de las reflexiones ex pliq ue la menor importan cia relat iva de los dat os espaci ales frente a o tros mas es tables, es n e­ ces ario recor dar la ca pa c ida d q ue pose e el sistem a audi tivo pa ra aren ua r 0 en ­

Un pa tron tem por a l perfec tamente regular, qu e repite ex ac tarne n te igual en tiempos iguales, es peri6dica, mi entras qu e uno que pr esen ta pequefi as va ria ­ c iones en su perfod o 0 arnplitud se defin e co mo cuasi peviodico. En la Figur a 5 se apreci an las d ifer enc ias en sus co rrespond ien res graficos temporales. Las sefiales q ue se ernplean en los ex peri men tos psicoac iisticos rradicio­ n ale s son, a los efec tos practicos, razonablernente period icas. Est an gene radas por medios elec tr on icos y es practicam en te im posible h all arl as en la n aturale ­ za 0 en las o ndas de los ins trurne n to s de rnusica no elec tron icos, Las se riales cu asi pe riodi ca s, por o tra par te, so n tfpi cas en estos ultirn os casos.? El sistema aud it ivo es muy sens ible a las sefia les cuasi pe riodi cas a l se r ca paz de de tect ar pequefi as varia c iones de l o rden de un a fraccion de periodo . Est as va riac ione s so n impuest as po r las a lin ea lida des de las Fuen tes acustic as. En el caso de la rmisica, apa rec en ta nto en el inst rum ento co mo e n su ejecuc ion y a veces se las ag rega intenc ionalmen te en la for ma de vibra to 0 tr em olo . El sistema au­ ditivo ernplea de mane ra pro vechosa las pequ efias aperiodic idades menc ion a ­ das par a fun d ir pe rceptual mente los es tirnulos q ue le llegan . C uando recib e pequefias variac io n es sin cro n izadas en para lelo tien de a o irlas co mo si estuv ie­ ran ori ginad as en la mi sma fuenre, feno me no rel acionad o co n la ley de destina comun de la te o rfa de la Ges ta lt. Tomemos por eje mplo la ernisio n vocal en un can tante . Si empre existen peq uefias irregu laridade s en e l flujo de a ire q ue llega desde los pul mones; hay vibraciones no co n rro ladas en los mu scul os de las cue rdas vocales; aparec en turbule ncias no lin eales en el tract o voca l y co nc urren desaju stes en la ada pra­ cion de imped an c ias en tre el co mplejo buc on asal y el ex te rio r. C omo con se­ cu en c ia de este s facto res e l con jun to de a rrnon icos es modulado irregularm en te en frecue nc ia ("jitter") ye n arnp lirud ("sh immer"). A l aplicarse ambas mod u­ laciones al total de la serial, el efec ro fin al es la pe rcepc ion de un solo objeto aud itive , la voz de tal 0 cu al ca n ran te en part icula r, Tal es el caso del "efecro de cafeter fa" C'cockratl party") .

En la ac rualidad se sabe q ue poseen un co rnportamien to caotico y no esrocastico, como

se erda hace un riernpo.

6

5

Tema desarro llado en el capitu lo

VII.

7

222

223

-.

-~

+ c "Vi

'0

e

n,

+

:2~ r rl:

!

I

"

I!

!

I

" !,

\

J

\

rfl,

Ii

I'(l

,



.;

I

II

r



Figura 5. Comparaci6n ent re una serial periodica y una serial cuasi periodica

+ c

Es muy sencillo realizar el siguiente experimento: se gen eran digitalmen­ te tres series arm 6n icas con la misma fundamental, qu e se funden perceptual­ mente en un solo objeto ac ustico -se oven como si est uvieran origina das en la misma fuente. Si a cada serie arm6 n ica se le agregan peq uefias fluctuaciones no co rrelac iona das (que pueden ser tres v ibratos diferentes), cada serie se se­ par a de las restantes y se las oye co mo si provinieran de tres fuentes distintas em it iendo en unisono. Los sistemas aud itivo y visua l parecen trat ar la period icidad y la sime trfa de una manera simi lar, pero con diferente grado de resoluc i6n . Por ejemplo, la vista no det ect a co n faci lidad la aperiod ic idad de la segunda serial de la fi­ gura 6, al no contar con la ayuda de las lIneas que ind ican los perfodos que aparecfan en la figur a 5. Tampoco nos percatamos inmedi at amen te de que tres de los edificios son rnen os simetricos respecto del eje cen tral q ue los otros dos. El sistema auditivo, en co n trapa rt ida , detecta inmediat amente un grado simi­ lar de disparidad, Tanto el sistema visua l co mo el audit ivo pierden parte de su capac idad de ate nc i6n - se podrfa decir que se "desco nectan"- cuando apa rece n simetrfas 0 periodicidades perfect as, aun duran te un tiempo breve, y fallan al intentar ex­ traerl es informaci6n relevanre.

0()

"w

e

n,

+ c

'0

"Vi

e

n,

Figura 6. Percepcion visual de la periodicidad y de la simetria . Las ondas son las mismas que en 1afigura 5, pew sin llneas de referend a

224

P ercepci6n de secuencias ritmicas N umerosas experiencias co mprobaron que la fusion y fision perc eptual de eve ntos repetitivos dep enden del intervalo de tiempo qu e media en tre cada oc urrencia. En una escala temp oral media, del orden de las decimas de segun­ do, se habla de secuencias n tmicas. En un contexte aciist ico cotidiano much as sec uenc ias de sonidos son rftmicas, y es de esper ar que exis tan mecan ismos pe rce ptua les espectficos que las conternplen. Par ejemplo, si un patron auditi­ vo es rftmico, entonces ciertos aspectos del mismo resultan temporalm en te re­ dundantes. Una vez qu e los eleme n tos tempran os que defin en el patron so n adve rt idos, los subsiguien tes pueden ser an t icipados . Handel dernostro , en se­ cuenc ias repetit ivas segmentadas po r pausas, que el principio de agr upa rnien ­ to perc eptual predominante se basa en la estru ctura temporal ; otros parametres, como la altu ra to na l, pasan a segundo plano (H andel , S ., 1989). En otras palabras, la est ructura temporal -Handel la llam6 timing- de los ele­ mentos es mas importante para det erminar el ritmo subj etivo qu e la estruct u­ ra interna de cada grup o. Por el contrario, cuando ofmos sec uencias rapidas (m as de 10 eve n tos par segundo) los son idos no se agrupan de acuerdo con su ar den tem poral ffsico, sino de ac uerdo con c iertas carac te risticas co munes co mo la altura tona l 0 el

225

]

f

'I

1,111 1

timbre. S, I, secuenc ia se percibe como un todo se produ ce [",iOn ,ilm'ca, y c uando aparec e dividida en vario s patrones dife rentes se produce fisi6n rftmi­ ca. Bregman sugi ri6 que ca da agruparnien to produc ido por la fision rit rnica co­ rre sp ond e a un ob je to a ud it ive d iferenre. Dow ling de m ostr6 qu e la segregaci6n oc urre ta mbi en cuando las sefiales sucesivas difieren en intensi­ dad 0 en ubicac i6n espac ial.f A lgun os co mposito res - no tablemente Bach- han apr ovech ad o la segre ­ gaci6n pro d uc ida en sonidos muy sep ar ad os en frecuenc ia - po r ejemplo en las partitas para v iolin so lo- , 0 la fusi6n de los so n idos de dos inst rumentos en un a so la me lodia (p ara qu e e l efecto tenga luga r los instrumentos deb en ten er ti m­ bres y locac ion es simi lares) . P e rcepci6 n del orden temporal Pue de ser dift cil est abl ecer e l o rden tempora l de son ido s q ue parecen provenir de diferentes fuent es aciist icas. Las person as no entrenad as necesit an du raci o­ ne s de 200 ms par a esta blec er e l orden de cua t ro eventos no rel acionad os y mu y d iferentes, Este resul tad o qu iza pr o venga de la segregaci6n en diferen tes corrientes aud it ivas, do nde los so nidos pare cen flo ta r un os co n respec to a o tros en el tiemp o subjetivo . Giovann i Vica rio demost ro q ue no es pos ible orderiar ternpora lrnen te d os co rrientes de so n idos de a lta y baja frecuencia cu ando la sepa rac ion excede las tre s oc tavas.? En su ex per irnento, c uan do los sonidos suces ivo s se unieron co n glisados en frecu en c ia la tendencia a sep ar arse en d iferentes co rrientes se re­ du jo, a un c ua ndo los glisados no fuer an co rnp letos. La co n tin uidad perfecta ent re tonos no es ne ce sar ia pa ra reduc ir la fision entre las dos sec ue nc ias: si un ca mbio en frecuenc ia "apunta" hacia e l proximo sonido, e l oye n te pu ed e se­ guir el pat ro n de co nt in uidad mas facilmente. Las transiciones bruscas ta m­ bien ayuda n a ev ita r la segregac io n en difere n tes co rr ientes a ud itivas e intervienen co ns ide rab lerne n te en la percepcion de la palabr a,

Regularidad en los datos fisicos Los te 6ri cos qu e proponen el modelo frsi co para describir la representacion mental de un objeto aud itivo , co mo C laude Cadoz, sost ierien qu e aprovecha­ mos c iertas ca rac terf sticas de las fuentes ffsicas pa ra co mpo n er e l ana lisis au­ ditivo de esc enas (C ad oz, C. et al., 1993). Este mec anismo serla luego 8 9

Dowling (I 968), en Moore, B. (I 997) .

Vease este terna en el punt a 4 del capitulo

226

IV.

I

intern ali zado y ope rarfa aun si el a ud ito r no esta familiari zado con la seria l fi­ sica en un caso par ticul ar. Q ue e l siste ma aud it ive interpreta una transforrn a­ c i6n subita de las pro p iedad es ac ust icas co mo e l ini c io de una nu eva seria l, 0 que haber o ido previa me nte un sc ni do potencia la pe rce pc i6n de su OCU1Ten­ c ia fu tura, son h echos qu e n adie c uest iona, Aunque n oso tro s nos in cl in am os po r el modelo acustico, la pr opu est a de Cadoz n o dej a de tene r c ierto atrac tiv o. Las regularidades ffsicas h an sido corrobo radas experirne n ta lmen te y son una buena gu fa pra ctica , a unq ue q uizas no de riven de una corn pren sion perceptu al profunda de la n atura leza de los procesos ftsicos inv o luc rados. De ac ue rdo co n el modelo ffsico , las regu larid ade s qu e pueden emplearse pa ra agrupar e leme ntos en un unico o bje to a ud itivo so n : • Regula ridad 1: es ext rernada rne n te raro que dos so n idos, que co rnien ­ cen y rer rnine n e xac ta rne n te a l mism o tie mp o , no posean a lguna relacion en ­ tre sf. • Regularidad 2: progresion de un a tr an sforrn acion: a ) las pr opiedades de un sonido a islado ti enden a rnodificarse de rnanera co n t in ua y lenta: b) las prop iedades de un a sec uencia de sonidos to rnados de la m isma fuente tienden a m od ificarse lentamen re . • Re gul aridad 3 : cuan do un c uerpo vibra pe riod ica men te, sus vibrac ion es dan nac imi ento a un patron ac ust ico donde las frecu en cias de las co rnponen ­ tes son mu ltip les de un a misma frecu enc ia fund amen tal. • R egul aridad 4: la rnayor ia de las mod ific ac ion es qu e afec tan a un a fuen­ te ac ust ica afec ta a todos los cornpone ntes del so n ido resultante, de rnane ra ide ntica y sirnultanea. El fen 6rn en o de red ucc ion de l e n rnasca rarnien to po r co mo d ula c ion co ns­ tit uye un bu en eje rnplo de regu laridad del tip o 4 . 10 En e l experirnento c lasico de Donald H all se emite una seria l sin uso ida l supe rp uesta a un ruid o de ban­ das mu ltiples. S i e l ruido se manriene esta t ico el son ido de prueba es en rnas­ carado, pe ro si e l ruido e nrnasc aran te flucni a sin cron ica rnen te en arnplit ud, la percepcion de la seria l se rest abl ece. El oyente agrupa a las d iferentes bandas de ru ido en un so lo obje to aud it ivo a part ir de su mo vim ien to co rmin . El so­ n ido de prueba , estatic o , se segrega de l resro. Redundancia de la in fo r macio n C omo hemos v ista , exi st en rnuch as est ra teg ias de agrupa rnien to e interpreta­ c ion de los da tos se nso riales. Est a mu lt ipli cid ad es necesaria porque cada un a 10 Vease

este terna en el punt a 5 del capitulo 111.

227

.......

de elias, par sepa rado, esta sujeta al erro r. Por ejemp]o, la estra teg ia que agru­ pa los soni dos por su o rigen espacia l puede ser ineficaz en arnbien tes muy re­ verb erantes. La q ue se basa en re lacion es arrnonicas puede fallar si se enc uen tra co n son idos inarrnonicos 0 ruidos de banda. Las qu e buscan sim ili­ tud es sec uenc iales pueden ser burl adas an te sonidos d iscontinuos 0 ca rnbian­ res. La utilizac ion en para lelo de varias relaciones de agruparniento co nst ituye habitualmente un a prot eccion co n tra e l fallo de una de e lias. C uando la in ­ form aci6n que rec ibe es co n trad icto ria, e l audit or sirnplernen te se puede de­ c larar incapaz de penetra r los co mplejos sono ros. La extrema rareza de tales casos testim onia la pot en cia de ana lisis de l sistema aud it ivo humano.

3. PRl NCIPIOS GENERALF.5 DE ORGAN IZA CI6 N

PERCEPTU A L

Y T EORfA DE LA GESTALT

Junto a sus descubrim ien tos fund acionales en ffsica y fisio logfa de la pe rcep­ c ion , H elmh o ltz es co nocido tam bien co mo un precursor de la psicologfa cog­ ni ti va. Forrnu lo el princ ipio de la inferencia inconsciente, que esta blece que nu est ro siste ma visual "construye" obje tos trid imension ales a partir de los da­ tos presen tes en el espac io bid imens iona l de la reti na. A part ir del principio de H elmho ltz se desa rro llo la teorfa de la Gestalt. Esta se in icia en 1912 con un artic ulo de Max W ertheim er sob re el rnovim iento aparen te , que exp lica la ilu­ sion que posibil ita la ex istenc ia del cine. El auto r deduj o que la percepci6n de un todo (el mov irnien ro) era radicalmenre difererite de la percepci6n de sus co mpo ne ntes (las imageries esta t icas), La teoria tu vo un gran desarro llo du ­ ran te los siguien tes 50 afios. Sin embargo , aunque la descripci6n de los fen o­ men os per ceptu ales pos tulada por los gestaltist as no ofrecfa rep ar os importan tes, la argumen tacion te6ri ca se mos tr6 insufi cienre para funda rnen­ tar sus leyes y la esc uela cay6 en c ierto de scredito en la decada de 1970. En la ac tua lidad, se han ret ornado sus princ ipios generales de organ izac ion percep­ tu al, que descr iben a grandes rasgos las caracterist icas de la percepcion, pero se han dejado de lado los modelos exp lica tivos originales. Cas i todos los psi­ co logos especializados en la percepci6n aceptan hoy la ope rativi dad de las le­ yes de la Ges ta lt, aunque las justifican a part ir de procesos y mecan ismos diferentes, Los gesta ltistas, a d iferenc ia de los estructuralisras, entendfan q ue la per­ ce pc ion no pod fa redu cirse a un a mer a suma 0 serie de sensaciones, sino que respond fa a la configurac ion tot al de la que aq uellas form an part e. "El to do es distinto que la suma de sus part es" sin tet iza uno de sus axio mas basicos, en el qu e las pro pieda des ernergen tes ilustr an el concepto gesta lt ico de organ izacion

228

ne cesario para ex plica r por q ue los se res human os ve mos el mundo co rnpues­ to de obje tos d isrinros, La ca pacidad de pe rcibi r obje tos - piedras, arboles, la­ dr idos 0 vien rc-- deb la esta r o rigina da en o perac iones efectuadas po r el siste ma ne rvioso centra l. A dve rt ir qu e la percepcion de objetos se parados no es s610 prod ucro de las sensa c iones periferi cas fue una de las mas importantes con tri­ buciones d e la esc uela de la Ges ta lt. Segun la teori a de la Ges ta lt los hechos psfquicos son forrn as, un idades or­ gan icas q ue se indi vidu alizan en e l ca mpo espac ial y te mpo ral de pe rcepc i6n o de represenracion. Las form as dependen , en e l caso de la percep c i6n, de un conj unt o de fac tor es senso riales obje tivos. La pe rcepci6n de las dife rent es c la­ ses de elem entos y de las d iferenres clases de relaciones co rresponde a dete r­ minados modos de organizaci6 n de un to do , qu e depende a la vez de condicion es objerivas y subje rivas. La co rresponde ncia qu e se puede estab le­ cer entre las part es de un red o artic ulado y ciertos eleme n tos objetivos no se mantiene, en gene ra l, cu and o esos mismos elementos perten ecen a otro con ­ junto obje tivo. En ot ras palabras, un a part e en un todo es algo d ist into a esa part e a islada 0 en o tro to do, a causa de las propiedades q ue debe a su lugar y funci on en cada uno de ellos. El ca mbio de una cond icion objet iva puede pro­ duc ir un ca mbio local en la for ma perc ibida, 0 traduci rse en un cambio rad i­ cal de la form a eme rgen ce. El objet ivo in ic ial de la teorfa de la Ges ta lt cons iste en esta blecer, por med io de la expe rienc ia, un conj un ro de cond iciones de ex istenc ia de las for­ mas perceptuales y de leyes de tran sforrn acion de dich as formas. Para que es­ tas se mue str en eficaces no es necesar io q ue exis ta una correspondencia rigurosa entre los elemen tos del estfrnulo objet ivo y los eleme ntos de la forma - de heche, la co rrespo nde nc ia direct a gene ralmen te n o existe y, en tod os los casos, no se man t iene co nsta n te. Los te6ricos de la escue la afirma ron que el proceso fisio logico que resulra de un co n jun to de exci tac ione s tien de a organ izarse espo n ta neamen te si­ guiendo cie rtas leyes de estructura, independ ien tes en prin cipio de las sign ifi­ cac iones agregadas por la educaci6n. En la act ualidad ex isten teorias sobre la percepc ion que co n tradice n tal afirrnac ion . Se ran comentadas mas adela n te . Los tr ab ajos de los psicologos gesta ltis tas lIevaron a en un c iar ci nco le­ yes y dos princi pios gene ra les q ue pe rrnite n agrupar los estfmu los que pro ­ v ienen de un a mi sm a fuen te , y seg rega r los q ue no 10 h ace n , En gene ral, un a regia a islada no sie mpre perm ite la fusi6n 0 fision perceptua l y varias de eli as d eb en act ua r juntas pa ra que e me rja la forma final (Kohle r, Koffk a y S ander, 1962). En 10 que sigue describirernos brevernente las leyes y los princ ipios gene­ rales de organ izacio n q ue propon e la teo rfa de la Ges ta lt.

229

~-

III Leyes de la Gestalt 1111

'c"

'(3

Los psicologos de la Ge stalt centraron sus estudios en el sen tido de la vista . Co n algun as ada pta cion es, sus cinco leyes y dos principios de organizac i6n sc aplican tarnbien a la audicion.!'

OJ

::J

o

OJ

u:

••••

• ••• Tiempo

Ley de proximidad La ley de proximidad expresa que los elemen tos ce rca nos tienden a percibirse como un a unid ad . En la Figura 7 se aprec ian pares de c irculos agrupados por proximidad cspac ial. En audici6n la proximidad pued e darse en diferentes di mensiones . Los so­ n idos se agrupan po r pro ximidad de altu ra, de tiem po, de timbre a de espacio.

Circulos no ag rupados

•••••• •• • ••

Clrculos agrupados por proximidad

F igura 9. Agrupa mienr o de son idos par pro xim idad temp oral

Ley de semejanza La ley de semejanza esta blece que elem entos iden ticos a semeja ntes (en color, tarnafio 0 forma para el sentido de la vista) t ienden a percibirse agrupad os. En aud ic i6n , la semej anza implica sim ilitud de timbre, altu ra, sono ridad 0 locali­ zaci6n espac ial. EI rasgo que determina la agrupacion percep tual por semejan­ za depende de l co ntex te 0 de la rarea impuesta al oyen te. Van No orden demostr6 que la sirnilitud de timbre puede impone rse a la similitud de alt ura tonal, al men os bajo ciertas circunstancias (Van N oorden, L., 1975) . En la Figura 10 se observa la ley de semeja nza aplicada a la vista y en la fi­ gura 11 se puede ver el espectrogram a de dos corrientes perc eptuales agrupa ­ das par semejanza tfmbrica.

Figura 7. Ley de prox imidad Agrupa miento por seme janza

'c"

'(3

c

OJ

~

Fig ura 10. Ley de se me janza

OJ

::J

lL

• •• •

'"

' (3

eeD DeeD D

::J

o

•• • • •• ••• •• • • • • • ~ u,

Tiempo

Tiempo

Figura 8. A grupamienro de son idos po r proxi rnidad de alt ura

'c"

'(3 OJ ::J

~ lL

..

_-=LJ .. ~

~

Ll • . Ll

~

• ••• ~

~

Ll

Tlernpo

El o rde n y aun el ruirnero de leyes varfa segun el aura r q ue se consulre. El que ex pon e­ mos aq ul es el mas frecuenre en la lit eratura so bre el terna. II

230

F igura 11. A grupam ienro de sonidos par se rnejanza de tim bre

231

1,;[

Ley de cierre La ley de cierre esta blece que las figur as incornpletas tienden a cornpletarse y a ser percibidas como una unidad cerra da. En la Figura 12 se ve un a serie de rect angulos. Bajo ciertas condiciones un son ido enmascarado puede oirse como si fue­ ra continuo aun sin serl o (en to do caso, no existe evidenci a senso rial de su co ntin uidad), Se 10 sigue "oyen do" aiin cuando ha cesado. En la Figura 13a per cibim os que la serial de banda an gosta no pr esenta ninguna solucion de continuidad . Puede ocurr ir, sin embargo, que result e disc ontinua en los tr am os en mascarados (figur a 13b) .

Ley de continuidnd 0 de buena [onna La ley de co n tin uida d esta blece que los elementos que forman parte de un pa­ tr on co ntin uo tienden a percib irse co mo una unidad . En la Figura 14 ve mos dos line as qu e se cru zan , aunque son posibl es ot ras con figurac iones. Esta ley, aplicada a la audici on, h ace uso de nuestro co noc imien to de las pro ­ piedades fisicas de las Fuentes aciisticas que modifican sus parametres de manera

suave y continua. Los cambios bruscos indican que una nueva Fuente se ha acti­ vade . Par ejemplo, si la alternancia entre son idos agudos y graves se intercala con los glisados en la dire ccion adecu ada , se redu ce la segregacion en dos corrien tes perceptuales. En la Figura 15 se puede apreciar el correlato auditivo de esta ley. En la voz hablada, gran des cam bios ine sperados en la frecuencia funda­ mental dan la impresion de que un nuevo hab lante se ha incorp orad o. Este efecto requiere un "conocimiento" de las reglas normales de en to n ac ion . La segregac ion aud itiva produce silencios ilusori os en cad a corriente durante la parte de la serial atribuida a la otra co rrierite.

Ley de destino cormzn Por la ley de de stino corruin los objeto s que presentan un patron de movi ­ miento co rmin ti enden a percibirse como una unidad. Ejemplos clasicos son las bandadas de pajaros 0 los grupos de mar atonistas. Esta ley es de enorme impartan cia en audicion. Los diferentes co rnpon en ­ res en frecuencia provenientes de la misrna Fuente aciistica varian usualm ente de un a rnanera coherenre. Tienden a co rnenzar y terminar juntos, ca rnbian de intensidad a la par y alteran sus frecu encias de manera asocia da. Por eso si dos

Agrupamiento por cierre

Continuidad A·D Y CoB

:><

A

[ ] [ ] [ ] [ ] [ ]

C

Figura 12 . Ley de cierre

B

0

Figura 14. Ley de continu idad

'"

"0

.

I'"

"

~

1/\

c;


::>

o

2'

LL

rv

"

)i

fo\

I~

-~

V

1\

v

v

'"

\

Tiempo b) Sin enma scaramiento

Figura 13. Ley de cierre para una secuencia de son idos

Z3Z

@ eL

Tiempo a) Con enmascaramiento

"g . • • •



••

••

•••• ••





Tiempo

Figura 15. Ley de contin uidad en dos secuenc ias de soni dos

233

Cl rculos agrupados por movimiento cornun

--------

-8 -8

-8-8

~~

~

'-.:::::/ '-.:::::/

~

'-.:::::/ '-.:::::/

Figur a 16. Ley de destine co rrni n (las ondas dobles representan rnovirnient os en paralelo)

• • • • • • • • • • • • • • • • • ••• • • • •

C1l

'0

c

OJ

OJ

U

~

LL

...

. ... ..: ". • • •• ". ••• .. 0.. .... . •....: .....

. .. ••• •• ••

• • • • • •

Tiernpo

Figur a 17. Agrupam iemo de sonidos por movimien to co rrui n

o mas co rnpone ntes de un son ido complejo experimen tan el mismo tipo de carnb ios al mismo tiempo, son agrupados y percibidos como proveni entes de la misma Fuent e. En la Figura 17 las dos lineas melodicas que se rnueven en para­ lelo tiende n a agrupa rse entre sf. Con relaci6n a la ley de destin o co miin, hay dos fact ores q ue se destacan a la hora de sin tet izar sonidos para crear nue vos obje tos audit ivos. El primero t ien e que ver co n la forma y sinc ron ismo del ataq ue, y el segundo co n la sin­ cro nfa de las mod ulaeiones (de amplitud 0 frecuencia) en el desarrollo tem ­ poral de los cornpon en tes que se preten den agrupa r.

Principia de figura yIundo Ten emos la capaeidad visual de distinguir una Figura del fond o contra el cual aparece. Tambien somos capaees de distinguir la melod ia que ejecuta un solista destacada por sobre la masa orquestal y de comprender el discurso de locutor de radio a pesar del ruido de fond o. Sin embargo, todos estos estfmulos nos llegan desde el cam po pereept ivo periferico sin jerarquizaci6n alguna. En la conoe ida imagen de la Figura 18 se pueden ver alterna tivarnen te dos rostros 0 una copa, segun cual de los campos visuales cons ideremos como Figura y cual como fond o.

234

Figura 18. Figura y fondo

G rac ias al pr incipio de Figura y fon do se esta blece una jera rqufa ent re los obietos de interes y el medio neutro que, aunque pueda estar constituido por exc itac iones co mplejas y heterogeneas, es desplazado a un grado infer ior de di­ feren ciaci6n. La segregac i6n perceptu al entre Figura y fondo no ocurre de rna­ nera rnecan ica. A l ofr una conversacion 0 una melod ia en un arnbiente co n un gran ruido de fondo , seguimos al objeto aud itivo q ue co nte nga mayor sen­ tido en funci6n del co ntex te 0 de nu estro interes parti cular. Cuando los Indi­ ces de diferenciacion no son ev identes se producen figuras amb iguas 0 ilusion es figura-fondo, situac iones q ue se aprovechan en el mimet ismo y en el camuflaje. El principia de pertenencia (t arnbien conoc ido co mo principio de cortes­ ponden cia ) expresa que si un compo ne n te simple es usado para la form aci6n de una corrien te perceptual, no puede emplearse en la formaci6 n de una se­ gunda co rrien te . En la Figura 18 no pueden verse a la vez la copa y los rostros. Parece que ate ndernos a una corrien te perceptual a un tiernpo, y el resto for­ ma part e del fondo. A lgunos autores han ace prado, no obs tan te, que el prin­ cipio de per te nenc ia auditive puede debilitarse en ciertas ocas iones: un elemento sono ro puede oirse co mo part e de mas de una corrien te perceptiva. En el caso de las texturas polifon icas se ha propuesto la posibilidad de perc i­ bir mas de una Figura a la vez. El pape l de la atencion cs determ inant e en la selecc i6n de los elemen tos que van a form ar parte del objeto ac ustico que ocupara la funci6n de Figura. La atenc i6n ac nia sobre la en trada auditiva para seleccionar ciertos rasgos del son ido para su ana lisis conscie nce. Emp leamos nu estra sensibilidad a los ca m­ bios en la sefial aciistica para dirigir la at encion hacia n uevo s y pot encialmen ­ te import ant es eventos del entorno . C uan do un aspec to del sonido ca mbia,

235

rnientras el resto se manti en e constante, llama la atenc ion de l oyent e: se con­ vierte en Figura. El efecto "cocktail part y" 0 la audicion de un a voz que se des­ raca del resto en una pieza polifonica son buen os ejernplos de eleccio nes atenc ionales. Neisser sugirio que la atencion aparece un a vez realizado un ami­ lisis preatentivo de las diferentes cor rientes percept ivas (Neisse r, U ., 1967). Sin embargo, este proceso no es de un solo sen tido: se sabe que la atencion puede influi r en la forrnacion de co rrientes perceptivas .

L~

Principia de pregnancia El princip io de pregnancia fue formulado por Koffka del siguien te modo: "la or­ ganizacion psicologica sera siempre tan excelente como las condiciones domi­ nant es 10 permitan" (G uillaume, P , 1975). Se entiende aquf por "excelencia" a la interveneion de propiedades como regularidad, simetrfa, armon ia de conjun ­ to, homogeneidad, equilibrio, maxima senc illez,etc. En otras palabras, para agru­ par el campo perceptu al recurrimos a la menor cantid ad posible de informacion. Este principio opera empleando simultanea men te varias leyes de la Gestalt. En la Figura 19 se ha dibujado el triangulo de Kani zsa. La interpretacion mas eco nomica en terrninos de inform acion es supone r que ex iste un triangu­ 10 blanco que se superpone a tres circulos y al triangulo delinea do, y no la rnu­ cho mas compleja e improba ble alineacion de tres angu los y tres pacman . En el en mascaramiento por ruido ocurre algo similar. Es mas eco norni co en terrn inos de informacio n supone r que el son ido en mascarado con tin ua en presen cia de l ruido , que in terpretar una compleja operacion sincr6n ica de ac­ t ivacion -desact ivac ion . Se puede aprecia r un ejemp lo notable de agrupamien to , en el que int er­ viene n varios princ ipios gesta lticos a la vez, al comienzo del movimie n to fin al de la sexta sinfonfa de Tchaikovsky. En el sistema superior de la Figura 20 se yen las partes de los violines I y II tal como figuran en la parti tura, mientras que en el segundo sistema esta escrito 10 que casi todos los oyentes percibe n , cn-esre caso se oponen ent re sf algunas de las leyes de agrupa miento exa m i­ nadas. Por semejanza tim brica y de alturas se fusion an los son idos provenie n­ tes de ambos grupos instrumentales y luego se reagrupan de acuerdo con el prin cipio de pregnanc ia. En esta segunda fase inte rviene n las leyes de con ti­ nuidad y cierre junt o a un principio de cohes ion estructural llarnado ilusi6n de escala por Dian a Deutsch (1975). Es posible ace n tuar la arnbigueda d perceptua l del pasaje agregand o un compone nte espacial si se dispone la orquesta en el escena rio de ta l modo que los primeros y los segundos violines queden alejados entre sf, a ambos lados del director, como ocurre en la forrnacion orques ta l "a la alernana" .

236

,

e /\ Figura 19. Triang ulo de Kanizsa

"

Como se escribio;

-. -Violin I

-----

Violin II

Como se percibe:

Violin I

Violin II

-

-----

~--

Figura 20. Reagrupam ienr o melod ico en el cuarto mo vimien to de la sexta sinfonfa ("Pa­ te tica") de Tcha ikovskv

237

Isomorf ismo Los creadores de la escuela de la Ges talt trataron de fundam entar su teona en term inos fisioiogicos. Postularon una conexi6n muy directa entre la expe rienc ia percep tiva, la fisiologfa y el mundo ffsico a traves del principio de isomorfismo, que afirma que una experie ncia subje tiv a y el dispositivo neura l asociado tie ­ n en estruct uras formales similares. Se trat a clarame nte de una postur a monista en la que los procesos fisicos, fisio16gicos, psico logicos y culturales t ienen la misma base rea l: la forma ftsi­ ca. La ffsica se convierte aqu f en la ciencia fun da mental a tamar como refe­ renci a explicat iva ultima. Esta con cep ci6n se man ifiesta, por ejernplo, en las numerosas comparacio nes ent re el mundo ftsico y el psicologico a las que re­ curre Kohl er: "[...] del mismo modo que en el camp o ffsico (pe r ejernplo el campo elect rico) , en el campo psico16gico hay tambien una estructuracion es­ pont anea que obedece a principios dinarnicos" (Kohler, W., 1972).12 Para estos investigado res la teoria de las formas ffsicas y el isomorfismo psicoffsico constituyero n el asien to te6rico de la doc trina . A l afirrnar que en la natural eza inorgan ica se en cuentran mod os de ser del tip o "formal", libera­ ron la barrera que separa los procesos no organi cos de los procesos fisiologicos en el sistema n ervioso central. El marco te6rico fue to rnado de la teor fa del campo electrornagnetic o vigente a principi os del siglo xx . Citernos n ueva ­ mente a Koh ler: "[...] los proc esos fisiologicos neu rales con que se asoc ian los he chos percep tuales esta n en cada caso localizados en un medio cont inuo , y los hechos que ocurren en una parte de ese rned io influyen sobre los que tie ­ nen lugar en otras region es, en la med ida direcra en que las prop iedades de ambos se ha llan relacion adas mutuamente [...] a un percept o aislado en medio de un arnbie n te ho rnogeneo, le atribuimos su campo". Introduce entonces el princip io de isomo rfisrno: "las propi edade s estructurales de las exper ienc ias --'-sen al mismo tiempo las pro piedades estruct urales de sus correla tos biologicos y, en ult ima instan cia, del mund o ffsico" (Koh ler, w., 1972).13 En la actualidad ya no se cree en el princip io de isornorfismo , y hace tiern­ po que han sido dejados de lado los fund amentos teo ricos originales de la psi­ cologfa de la G esta lt. Sin embargo, las leyes de agrupamiento todavfa son empleadas para describir el modo en que percib imos el mun do exterio r. De to­ dos los in tentos realizados para int egrar estas leyes a un modelo reorico gene­ ral, qu iza el mas interesante sea el que pro ponen los creadores de la teona de la percepci6 n caotica. 12 Trad. IJ

de Julio Gu illen .

Trad. de Julio G uillen .

238

Capitulo IX Percepc i6n del habla

Resulta evidente que la percepci6n del habla no depen de simplemente de ele­ mentos invariantes accesibles directa rnente en la ond a aciistica. Por ejernplo, los patrones de la sefial acustica que corresponden a una palabra se rnod ifican de man era compleja en funcio n de los son idos que la preceden y que la suceden , y un fone ma que resulta alta rnente probable en determinado contexte lingufst i­ co va a ser "ofdo", aun en ausencia de los dat os acusticos correspon dient es. EI recono cimiento de la palabra depend e tambien de indicadores sernanticos, sin­ tacti cos y circunstanciales, La import anci a de estos indicado res se potenc ia a medida que aumen ta el ruido presente en el cana l de comun icac i6n. Au nq ue este capitu lo trata sobre la percepcion de l hab la, conviene repa­ sar primero brevemente el mecanismo de fonac i6n hu mano.

1. EL

APARATO VOCAL Y LA FONA CrON

Las menores unid ades del ha bla son los fonemas. EI idioma espanol posee a l­ rededor de 24 fon emas diferentes que se definen a partir de los sonidos que es capaz de producir el aparato vocal.' En esencia, proclucimos tres clases basicas de son idos diferentes: las consonantes plosivas , que son sefiales tra nsitorias que se produc en al bloque ar y luego abrir repentinarnente el tracto vocal; las con­ sonantes fricativas, que depen den de la tur bulencia en el aire cuand o pasa a tra­ ves de una pequefia abe rtur a, y las vow les, cuyas ondas son periodicas y que poseen altura tonal definida. Veamos primero, de manera muy sint et ica, como y con que produc imos esta gran cantid ad de son idos diferentes. I La can ridad de fonemas del espariol depende de cada region IingL ifsrica y varia levernen­ te, por ejemplo, en tre Madrid, Buenos Ai res y La Ha bana. Co mo referencia cornparat iva, el Ingles posee alrededor de 40 fone mas.

239

---El aparato vocal

I

II

a)

E[ apa rato vocal hu man o se puede di vidir en tres partes principa les que son: un a reserva de a ire a mayor presi6n que [a atmosferica, un cana l de salida do n­ de el a ire puede ser interrumpido 0 modulado, y una cav ida d reson ante q ue filtra las sefia les que se erniten al exterior. La rese rva de aire a presion, llamada presi6n subglot ica, se local iza en los pulmones. Su capac idad prom ed io es de tres a cuatro litros y puede llegar has­ ta seis durante una inspirac i6n profunda . Mov emos alrededo r de med io litr o durante la respiraci6n pausada , pero un cantante entrena do es capaz de ut ili­ zar hasta c inco lit ros en una sola exha laci6n. En el borde supe rior de la traqu ea se ubica una espec ie de cav idad ca rt i­ laginosa llamada lar inge, que la co mu nica co n el tracto voca l, terrn ino que in­ c luye la gargan ta y la cav idad naso bucal. Dentro de la lar inge se hallan las cuerdas (0 mem bran as) voca les, encargadas de estrech ar u ocl uir el paso de ai­ re a pa rti r de la acci6n de va rios peq uefios rruisculos. La ape rtura co n form a de V entre las cuerdas voca les se denomina glotis. La gloris mide aproximada­ mente 2 cm de largo y 1 c m de anc ho cu ando esta tot alm ente ab ierta, En la figura 1 se puede ve r e l co rte lat eral de la pa rte superior del apa rato voca l, y en la figura 2 se yen dos co rtes esque rnat icos de la laringe.

Paladar blando

I '~ '."

i

Cuerda s vocales falsas

Carti lago 1iroides

Carti lago

Cuerdas vocales verdaderas

Tlroldes Cuerdas voca les verdaderas

b)

Cartilago Aritenoides

Figura 2. Vista front al y superior de una laringe hurnana

En fonac i6n, la caja toraxica ap lica una presi6n subg lot ica un poco ma­ yor que la presi6n armosfe rica - entre 1,005 y 1,04 atm6sferas- qu e fuer za al a ire a pasar por la glotis y que hace vibrar las cuerdas voca les, cu ya apert ura estatica es regulada por el ca rti lage arite no ides. Las cue rda s vocales, a su vez, vibran a un a frecu en cia co n tro lada por la presi6n subglotica y por la ten si6n aplicada a sus pequefios rmisculos. Para el habla norm al, las frecuencias se ex­ tienden en un ran go que va de 140 a 400 Hz en las muj eres y de 70 a 200 Hz en los hom bres. Estos ran gos puede n extende rse una oc tava 0 mas en el can to.

'II

Faringe

Epiglolis

Producei6n del sonido Cuerdas vocales

Figura 1. C ort e lat eral de la parte superior del aparato voca l hurnano

240

Cuerdas vocales falsas

En la fona ci6 n par tic ipan varios mecani smos diferentes dura n te la producc i6n de ondas. Las consonantes plosivas, que son seriales trans itor ias que se produ cen al bloquear y luego abrir repenti nam ente el tracto voca l, tienen un desarrollo temporal en el que pr imero aparece un ataque similar a un impulso de gran pre­ sion, seguido por un breve int ervalo en el que la vibraci6 n se aten ua rapida­ mente. En la figura 3 se ve el grafico tem poral de la co nso na n te plosiva /k/· Esta serial , transitori a y no pe riodica, pose e un espec tro de banda anc ha y, por supuesto, carece de altura to nal. Las plosivas se div iden en sordas ({pi , 241

---+ +

I

"0

.-e a.

"0

.a.e

E


E


Tlernpo Tiempo

Figura 3. G rafico temp oral de la conson ante Ikl

/t/ y /k/) y sonoras (lb/, /d/ y /g/). En estas ultimas, las cuerd as vocales se po­ nen en vibraci6n y una vocal suena inmed iatamente despues - unos 30 ms- de la conson ante, Como el ca rac ter transitor io de las plosivas hace q ue co n ten­ gan poca energfa, los can tan tes generalmente las exageran para equilibrarlas en sonor idad con respect o a las vocales. Las consonantes fricativas (ls/, [z], /sh/, /j/, /f/, /v/, etc.) producen un a tur ­ bulencia en el aire que fluye a traves de una pequena abertu ra a mayor velo­ cidad que la veloc idad crftica. Aunque se pued e sostener est a clase de seriales en el tiemp o, son estaciona rias solarnente en el sen t ido que 10 es el ruido blan ­ co. S us ondas son no peri 6dic as y el espect ro es de band a anc ha . En la figura 4 se aprec ia el grafico tem por al aislado de la consonante fricativ a /sh/. Aunque el tract o voca l pueda enfat izar alguna s frecuencias de la banda total gene rada por una con son ante fricati va (por ejernplo, 6 kH z para la /s/ 0 3 kH z para la /sh/ ) no se destaca ninguna frecu encia en part icular y el sonido resultan te es no t6ni co. Existen otros son idos como las consonantes tiasoles (lm/, /n/, /n!), las vibratues (lr/ , /rr/ ), erc., pero los modos de producci6 n no di­ fieren en esen cia de los ya vistos.? A diferencia de las conso nantes, las vocales se manrienen estables en el tiemp o, sus formas de onda son practi carnenre peri6dicas y sus espec tros son 1 N o prerende rnos cub rir aquf el pan orama cornplero de los fonemas del espanol. Tampoco ernpleamos los sfmbo los recornendados por la Inr ernatlonal Phonetic Associati on (IPA), q ue exig irfan una desc ripci6n de rallada. Q uien desee ampliar en el tema debera recurrir a text os especfficos de fon erica y fono logfa.

242

Figura 4. G rafico te mporal de la conson ance Ishl

aproximadamente arm6ni cos. En otras palabras, las voca les sf poseen altura tonal definid a. Se producen por la modulaci6n peri6dica de la apertura glot i­ ca. Tanto la frecuencia de vibrac i6n de las cuerdas voca les co mo la forma de onda resultante estan determina das casi co rnpleta rnen te por la laringe. La fre­ cuencia fund amental, que define la per iodicidad y la altura tonal, dep end e de la presi6n subgl6tica y de la ten si6n y apertura de las cuerdas voca les. El trac­ to voca l, tapizado de tejido blando, casi no devuelve energ fa hacia la laring e.' Las diferentes posiciones de la lengu a, por ejem plo, modifican la acci6n de fil­ trado y determ inan cual vocal se va a emitir, pero no alt eran la periodicidad base de la serial que emiten las cuerdas vocales. En la figura 5 se pueden observar las formas de onda que parten de la la­ ring e para tres ni veles de intensidad diferentes. A mayor intens idad aumen ta sign ifica tivamen te la cantidad de arm6nicos en el espectro. De la laringe surgen ondas aproxirnada rnen te periodicas que se parecen, segiin el caso, a una onda trian gular 0 una onda dienre de sierra con gran can­ t idad de arrnon icos. El sonid o que se registra en la laringe se sien te como un zumbido con altura tona l defin ida, no como los son idos mucho mas agradables que ofmos cuand o el locutor emite por la boca . Esta gran diferencia acustica se debe a la acci6n de los filtros de resonancia de l tracto voca l. Aquf Fa lla la difundi da ana logfa en tre el apa rato vocal humano y los insrrumenr os de viento del grupo de los bronc es: la carn pana de estos ultirnos de vuelve hacia la boquill a un gran po rcen taje de energfa en cada ciclo. Asf se esrablecen las ondas estacionarias necesa­ rias para su funcion arnienr o. 3

243

........

a)

:t~· it. ---- - -

-..

<{·U

Tiempo

I

I

lib '"t1 " ~ "b

..

Frecuencia

200 AA~~

"0

.€

a. <{

Ii!

E

Tiempo

c)

I

Figura 6. Con figuraciones del rracto vocal para las vocales Iii, l ui, /e/ y /a/

Qt

b)

f

(f)

Frecuen cia

Q

~

Frecu en cia (kHz )

"0

~

a. <{ E

Tiempo

I. Frecue ncia

o~

·' 0

: ;~

III I I1 I! !11 I I!1 I! !1 !11!!!!1 ' , ~

o 1 2 3 Frecu en cia (kHz)

lal

~ ~~ ' ~ ~ >

D !:J .~

Z

Figura 5. Formas de onda y espectr os tornados en la laringe. a) serial debil, b) serial de me­ diana inrensidad y c) serial muy intensa

0

1

2

J

~

.

I

IIII 0

1

2

3

Frecuen cia (kHz )

luI Fo rma ntes El traeto voca l se puede aproximar a un tuba de 17 ern de largo, cerrado en un ex­ tremo por las cuerdas voca les y abierto en el otro a craves de la cavidad naso bucal. C ada voca l d efine una geom et rfa particu lar de l trac to voc al , como se pue ­ de ver en la figura 6. Cada co nfigurac ion particu lar de l tracro voca l, a su vez, modifica las ca ­ racterfst icas espectra les del filrro ac ust ico co rrespond ien te. Lo que ofmos es, en definitiva, un a serial peri odi ca gene rada en la laringe y filtrada par e l tr ac­ to voca l. En la figura 7 se pu ede ver co mo la misma onda, ernitida por la fa­ rin ge, ado pta envo lven tes espec trales d iferentes para cada voca l. En este ejernplo se oye siempre la misma alt ura tonal, pero co n tre s alturas espectrales d iferentes (las voc ales /ii, /a/ y /u/). La cav ida d n aso bucal posee resona n c ia de banda medi a porque el tej ido blando qu e la tap iza absorbe gra n cantidad de energfa ac ust ica , Cada un a de estas zonas de resonanc ia, en las que se refuerza la arnplit ud de los cornponen­ tes espectrales, se denomina [omviiue. Cada vocal co rrespo nde a un a corn bi­

244

~ Frecue ncia (kHz )

Figu ra 7. Efecto de filtro del tracto vocal sobre una serial periodica proven ience de las cuerdas vocales

na cion parti cu lar de forrnantes, tres 0 cuatro segiin el caso . S in embargo, es posib le distingui rlas con cl aridad a part ir un icam ente de las do s primeras. Si se cons truye un grafico cartesiano qu e posea la frec uenc ia de la prime ra for­ rnante en abscisas y la de la segunda forrn ante en orden adas, se obt iene un es­ paci o bidimensional en el que cada punta co rrespo nde - idealmente- a un a vocal. En la vida rea l, por supu est o, ex iste gran variabilidad no solo entre un hablante y otro, sin o hasta en la misma per sona en diferentes mornentos del

245

a)

3000 2500 . 2000

----r----~----;' -' '

: E

~- --~

~ -- -! _ I

N

E.

:e® L _ I

1500

-

1000

",

U .

:

,,

-----,---­-

- -T-----' , ' - --­

--~,

:--

:

500

0

Caracterfst icas gen era les de la ernision voca l

~: - ---

-----iG}D---, ., __ ~0:

N

LL

,-'' - - --­

:__

:

''

,

0 0

200

400

600 800 Fl (Hz)

1000

1200

1400

b) 3000

, "-£.-~E - J----+ , . -,----­ .~ ~ : ' . - ..;­

250 0

~ j-_.- ~-- ---i-( ----; 9. ---­ ---~--~--' ; ----:;:

2000

••<,

N

E. N

'

1500

LL

1000

--':

500

:

- - - "l " -

"

,

-

~-~ -- - - ,;-

-, •

ejemplo, en la figura 8 se co mpara n las regiones de reconoc imiento voca l pa­ ra voces mascu linas y·feme n inas.

" A-- ­

­

La voz hum an a genera un espectro de pot en cia que alcanza un maxim o de energfa alrededo r de los 500 Hz en los hombres y de los 1.000 Hz en las mu­ jere s, para luego decaer a razon de -8 d B por oc tava hasta un a frecuencia co m­ pren did a entre 4.000 y 5.000 Hz. En la figura 9 se puede vel' el n ivel med io de ernision de un a voz mascul ina tomado a im del locutor. El ran ge dina rnico uti ] para la palabra es del orden de los 30 dB. Las crestas mas potentes se en­ cuen tran a alreded or de + 12 dB por enc irna y las mas debiles a -18 dB por de­ bajo de l n ivel medi o. En la region de sobreca rga el oido no puede discr irninar entre d iferentes fonemas y la int el igibilidad cae bruscarnente. POl' supuesto, la voz hurn an a no emite de rnanera ornn idirecciona l a to­ das las frecue nci as. Es marcadarnente d ireccional por enci ma de los 1.000 Hz. En la figura 10 se muestr an los d iagramas de d irectividad en el plan o ve rtical correspond ientes a cinco frecuencias diferen tes.

:- - -- T- ----,

~'

t

110

:

l

0 0

200

400

600 800 Fl (Hz)

100 1000

1200

1400

90

CD

80

~

70

~

Figura 8. Regiones de reconoc imiento vocal para las dos prirneras forrnan tes de l espafiol riop larense, a ) voces masculinas, b) voces femen inas

0

c: 0

60

-0

50

a.

40

'" c:

'in ~

dia. POl' 10 tanto hay un ran go de valores para cada par de form antes (una re­ gion en el grafico de la figura 8) que co n tie ne informacion sobre la misma vo­ cal (Aronso n , L. et aI., 2005). Los ran gos se superponen en algunos casos y los mismos son idos puede n percibirse en dos fonn as diferenres. POl' 10 general, solo una de las interpr et a­ ciones tien e sentido en su co ntexto y la ado ptamos auto ma tica rnente de rna­ nera preconsciente. Una de las razones de la gran ext en sion de las areas para cada voca l es que las mujeres, los hombres y los nifios no poseen el mismo ta ­ rnafio de tracto vocal y no pueden producir exactarnente las mismas forma n­ tes. Los oye ntes eval uan las ca racte rfs t icas acusticas gene rales del locutor antes de decidir las forrnantes que le va n a corre sponder a ca da voca l. Co mo 246

Region de sa brecarga

<])

'0

30

~

20

(J

M vel de cres la de la P11abra M vel media de la

pa lab r~

I

Nivel minima de la pa/abra

<])

a.

'"

10

<])

Qi

0

Z

·10

>

-20 ·30

Nivel efi ca z total de la palabra: 69 dB a 1 metro Umbra l de audibilidad para

so nidos de espectro co ntinuo

270380 490 630 770 9201070 1230 1400 1570 1740 1920 2 ' 30 2370 2660 3000 3400 39504650 5600

Frecuencias ce ntrales de las bandas ~e igua l cantribuci 6n allndice de articulacio n

Figur a 9. Ni veles espectrales de em isi6n para una voz masculina

247

270'

a)

270'

5.000

180'

1 II

(?K 1 \ a O'

' 1\1

(*\

1' 0'

N

;s co

'(3

c:

2.500

<1l :J

90' 100 Hz

U

90'

~ u,

400 Hz

1.000 270'

0 180'

I l

I a O'

(')+()

I

I 1 'Ii

*

I

1

2 Tiempo (5)

3

4

2 Tiempo (5)

3

4

I 1 0' b)

5,000 90'

90'

1.000 Hz

4.000 Hz

N

;s

270'

180'

I I

f\?K

j,

I /I

O'

®~~

'~ 2.500 c:

<1l :J U

~

u,

1.000

o

90' 10.000 Hz

Figura 10. Direcrividad de voz hurnan a en el plano vertica l

Figura 11. Sonogramas de band a anc ha y de banda angosta

2. REPRESENTACI 6N GRAFICA IDE LOS SONlDOS DEL HABLA

lor que proporciona una buena resoluci6n tem poral 0/300 s) , pero que no permite observa r los arm6nicos individuales de una serial periodica. Los sono­ gramas de ban da angosta poseen no rrnalmente bandas de 45 Hz, suficiente pa­ ra dist inguir los armo nicos , pero no para diferencia r ind ividualrnente los rapidos impulsos gl6ticos. En la figura l 1 se pueden ver dos sonogramas de di­ ferente ancho de banda. N uestro ofdo puede resolver con gran deta lle y (casi) simulta nearnente los aspectos te mporales y espectrales de un a serial acustica, como ocurre cua ndo ofmos una sucesi6n rapida de acordes . Sin emba rgo, no viola el principio acus­ tico de indete rminacion porque posee la capaci dad de activar y desactivar ra­

\

Como los espect ros de los sonidos del habla varfan en eI tiempo -no son estati _ cos-, para estudiarlos se usan tradiciona lmente graficos cartesianos tiemp o/fre­ cuencia que se denorninan sonogramas. EI problema con estas formas de represen tacion es que, como todo sistema pasivo de analisis de ondas, depe n­ den del lfrnite impuesto por el principio acustico de indete rminaci6 n. Resulta imposible obrener sirnulta nea mente gran resoluci6n en el tiempo y la frecuen­ cia . Una soluci6n de comp'romiso consiste en alte rnar son ogramas de banda anc ha y de banda angosta . En los primeros la band a tipica abarca 300 Hz, va­

248

249

N

E-

m 2.500 'u c: OJ ::J U

i':'

LL

1000

o

3

2

4

Tiernpo (s)

Figura 12. Espectrogr ama auditivo

pida men te los. sens or es de la membran a basilar, corr igiendo asf eI an cho de ban da efec t ivo de acuerdo a la tarea impuesta ." Co mo ninguno de los sonog ram as tradicionales representa 10 que eI ofdo detecta realmente, algunos autores crearon los espectrogm mas awlitivos, en los que eI anc ho de banda de cada frecuencia de ana lisis iguala a la banda cri tica que correspon de a su frecuen cia ce ntral (C arlson, Granstrom y Hunnicutt , 1982) . En la figura 12 se muestra el espect rogram a aud it ivo del registro de V Ol habl ada de la figura 11. En este caso se pu eden observa r a la vez los arrnon i­ cos en baja s frecue nc ias y las transi ciones rapid as a altas frecue nc ias. C uando se compara un registr o aciistico de voz hablada con su represen ­ tac ion grafica 10 primero que llama la ate nc ion es que los silencios gene ral­ mente no co rresponden a los espac ios entre palab ras. Una de las mayores dificu ltades a la hor a de ana lizar graficarnente esta c lase de sefia les es determi ­ nar el modo en q ue la secuencia de son idos se segme n ts en sflabas y pa labras .

Existe evidencia de espe cializaci on cerebral rel ac iona da con la per cep ciori del hab la. Por ejernplo, se ha pro bado q ue intervienen diferen tes re giones del cerebro en la percepcion de los son ido s del habla y en la de los son idos ambientales en general. Si se apl ican sim ultan eamen te a los dos ofd os esti ­ mulos diferentes -por eje mp lo dos frases distintas- eI esurnulo h ablado pre­ sente en eI ofdo derecho - que se procesa en eI h emisferio cer ebr al izquier do­ es comprend ido con ma yor facilidad . Lo co ntrario ocurre en el caso de la rnusica. Experiencias con tom ografia cornputada y resona nc ia magnetica dem os­ traron que, mientras que los sonid os ambientales y musicales son procesados en am bos hemisferios cerebr ales, los sonid os del hab la est imulan casi exclusi­ vamente el he misferio izqu ierdo. Esta caracterfstica esta na basada en la nece ­ sidad de rnan tener ce rcanos todos los centros involu crados en eI trat arniento de las sefiales del habla, a fin de per mitir la detecc ion de sus pequefias transi­ ciones -del orden del rnilisegundo. De otro modo, si la informacion tu viera que viajar entre hemisferios, estas transi cione s se perde rian debido al excesi­ vo t iempo invo lucrado en la cornun icacion. A continuacion nos referimos a algunas de las caracteristicas particulares de la percepcion del habla, que nos perrniten decodificar con eficacia los fo­ nemas en una amplia variedad de situ ac iones y contextos.

Tasa de ocunencia de [os sonidos del habla En eI ha blar rap ido pueden oc urrir 30 fonemas por segundo. Liberman espe ­ culo que esta rasa supera la resolu c ion temporal del siste ma aud it ivo (Liber­ man, A. et aL, 1967). Sin embargo, la ev idencia recien te ind ica que es posib le ide ntifica r secuencias donde cada fon ema dura apena s 10 ms, a una rasa de oc urrencia de 100 fone mas por segu ndo . A esa ve loc idad no se perc j, be cada eve n to por separado , pero se pue de seguir aud it iva me n te eI patro n sonoro globa l.

Variaci6n de [os datos acttsticos

3. C A RACTERISTICAS PARTICULARE S DE LA

PERCEPCrON DEL HABLA

A un que eI tema sigue siendo mo ti vo de co nt roversia en tr e neurologos y lin guist as, es probable que en eI ser hu mano h ayan evoluc ion ado mecanis­ mos espec iales dedicados a la percepci6n de los sonidos propios del habla.

La percepcion del mismo fonema puede estar de ter mi na da por d iferen tes da­ ros acust icos. Por ejernplo, un a consorian te fricat iva "acomoda" sus bandas de ruido de acuerdo con la voca l que la sucede: vocales diferentes dan lugar, inevitablemente, a difer en tes tr an sicion es en tre formantes. Una sola tran si­ c ion de la serial acu st ica puede con tener informac ion sobre varios fon emas vec inos.

4 EI control activo de la membrana basilar se via en el capitulo I, puma 4.

250

251

Modo lingiiJstico N o h ay un continuum en la percep ci6n de los son idos del h abla , la percep ­ cio n es dic ot6m ica. En gene ral, los son idos son pe rc ibidos co mo lingu isti­ cos 0 como no lin gufsticos, Se pu ed e activar el mod o lingu fsrico dandole cie rtas instru cciones a l oyen te, pero un a vez ac t ivado es mu y d iffcil rever ­ t ir el pr oceso. Una de las co ns ecue ncias de esta caract eristica de la percepci6n del h abla es nu estra incapac idad par a oir los sonidos propios de l lenguaje en terrninos de sus parametres acust icos . Los perc ibimos co mo un a corriente unica d e pa la bras y las de scr ipciones "a ciist icas" son , cas i siempr e, confusas. Pa ra lograr un a audic i6n limpia de los dato s ac ust icos es ne cesar io a islar ca­ d a fonema y sacarl o de co ntex te . S6 10 a partir de ese momen to se desacti­ va el mod o lingufsti co. Results cas i in necesa rio menc ionar la impo rta ncia qu e tie ne esta ca ­ racteristi ca en la percepc i6n de canc iones y piezas lfricas, en las que coex is­ ten elementos pr opios del mo do linguistico (e l te xt o ) y no linguistico (la rnusica ). ___

Tran siciones

de las forrnante s

:

.~

~

"u u:

Una de estas

Q)

: Regimen estacio nario : • de la voca l : :........,, ' , ~ : : Form ante 3 { ,, '' .

,

:



. Forrnante 2

d

, Formante

1

T1empo Presentaci6n normal (di6tica)

~

"'--: :~

{~

''­

~

Percepci6n dual En la decada de 1970 Rand realiz6 por primera vez un experimen to qu e de­ mos tr6 la existencia de 10 qu e se con oce co mo percepci6n dual (Ra nd , T. c., 1974). Mas adelante, Liberm an perfeccion 6 la ex per ienc ia de Rand de la si­ guiente man era: se presenta a un o fdo la parte de la sefial prop ia de una sfla­ ba a la cual se Ie ha q uitado la transicion del tercer forrnante, y al ot ro la parte esta t ica del tercer forma n te mas los dos prim eros forman res co mpletos (Libe r­ ma n , A. , 1995). Los oyentes dicen percibir la silaba co mp leta en el primer 01­ do y s610 un corto zumbido en el otro, En la figura 13 se ap rec ia la de scripcion esq uernat ica de d ich o ex perirne n to . Segun Liberman , los resultados ob ten idos indican qu e existen m6dulos separados qu e pro cesan , por un lado, los sonidos del habl a y, par otro, los de­ mas sonido s. Est a co ncl usion co ncuerda co n los dat os ob te n idos a partir de la obse rvac i6n directa de la actividad co rtical dur ante la aud icion. Una de las con secuencias in teresa n tes asociadas a este fen 6m eno es qu e se viola el principi o de separaci6n espaciol que sostiene qu e un elemento ac us­ t ico dad o no pued e ser asign ado a mas de un a fuente a la vez. Pare ce que el meca n ismo de per cepci6n lin guistico es tan poderoso que, bajo ciertas cir­ cunsta ncias, permite agrupar ele me ntos ac iisticos aun cuando estos pro ven­ gan , 0 aparenten pro ven ir, de fuentes diferen tes .

252

Base (a un oido)

Transicion es aisladas (al otro oldo)

Presentaci6n dic6tica

Figura 13. Esquema del experirnento de Liberman sobre la percepcion dual

Integraci6n audiovisual A l decod ificar un mensaje habl ado Ie presta rnos ate nci6 n a un a gra n ca n t i­ dad de d ato s no aciis t icos . Los mov imientos de la cabeza, de las manos y, en particular, de los labios del hablante puede n influir sign ifica tiva men te en la percep ci6n del habla . Es in te resan te mencionar aqu f un experi rnen to en el que se presen ta un vid eo co n el a ud io modificado a un gru po de espec tadores (M cGurk y MacD o nald, 1976 ). En la image n apa rece un locu tor di c ien do "t a ta" jun ­ to al audio del mismo locu tor pronunciando la pa labra " ma ma". Los ove n ­ res di cen ofr "n ana", sin expresar riin guna d ud a -oyen "nana" con cla ridad-, y se so rpr e nde n a l o ir el aud io aislado, libr e de toda in formaci6n visual.

253

Percepci6n cQteg6ricQ U n a consecuencia de la percepc ion en mod o linguisti co es nu estr a capacidad par a ubicar cada fonema en un a dererrnin ada cat egorfa ind ividu al. C ua ndo varia de man era cont in ua algun par ametro acust ico de la sefial, por ejernp lo la frecuenc ia de una formante, n o oimos un a serie de pequefios cambios grad ua­ les, sino que pe rci bimos saltos "cuan t icos" en tre un fonem a y otro. Este fen o­ meno se denom in a percepci6n cQteg6ricQ y no oc urre usualm en te con los son idos arnbienta les. No se d ist in guen los ca mb ios aciisticos de la sefia l cuan­ do estes caen en la misrna categorfa, pero se percib en com o mu y grandes si provocan un salto de ca tegorfa. La percepc ion categ6rica se nos present a co ­ mo evide n te c uando trat arnos de co mprender un discur so en un a lengua qu e no dorninarnos co mpleta rnen te: las con fusion es frec uentes se deben a un a in ­ suficien te co rnpete nc ia respecto de las ca teg orfas fon ernicas de esa lengua, La percep c ion de vocales est aci onarias es m uy d iferente pues los peq ue­ fios ca rnb ios ffsicos son perc ibidos con faci lida d . Segun Liber man, est o oc urre porq ue las vocales ais ladas estan mu cho menos cod ificadas y se las oye co mo son idos co rr ien tes, no ca tego rizados lingufsticam en te. N o obsta nte, las voca­ les de n tro de un a sec uenc ia del ha bla se comportan de mane ra sim ilar a las co nso na n tes, es decir , de rnan er a a ltarnen te cod ificad a. U n ejern plo de percepci6n codificada y categorizada de son idos n o pe rt e ­ nec ien tes al h abla es la percepci on de las alt uras musicales en un siste ma es­ ca list ico dete rrninado . En rnusica to nal, las funciones arrnon icas tarn bien esta n a lta rnen te ca tegorizadas . Ex isten tr es hi potesis principales elaboradas para ex plica r la percepci6n ca teg6 rica . En la prirn era, P isoni co ns idera que la me moria aud itiva para los patrones acust icos de las co nsona ntes decae rap idam ente y que cuando debe­ rian ser p rocesados en la iden t ificac ion acust ica del fon ema ya se h an per d i­ do : la discr iminacion fina de l est frnulo dentro de est a categorfa de fon em as es imp osib le (Pison i, D. B., 1973). Par a fonemas mas largos e in tensos, como los de las voca les prolong adas, los pa trones ac ust icos pueden ret enerse en la me­ mor ia aud it iva por perfodos mayores, pud ien do reali zarse sobre ellos operac io­ n es de discrim in acion similares a las ope radas en los son idos en gene ral. En la segunda h ipot esis K. S te vens sugiere que las ca tego rfas y los lim ites en el h abla han evo luc ionado co n el fin de ex plota r la sens ibilidad natural del sistem a aud itivo (Steven s y Blumste in , 1981) . Esta hipotesis n o da cuen ta de mu chas de las operac ion es carac terist icas necesarias para la apa rici6n de la percepcion categ 6rica. U na tercer a h ip6tesis, formulada por Kuhl, conside ra que la percep c i6n ca teg6rica surge de la expe rienc ia co n el prop io len guaje (Kuh l, P. K., 1993 ).

254

C uand o aprendemos a en tende r las palab ras de un lenguaje part icular, presta­ mos atencion a las diferencias ac usticas que afecta n su sign ificado e ign oramos las que no 10 afecta n . U na vez que ap rendernos a distinguir en tre ambos gm­ pos, n os c uesta o fr las diferen cias ac usticas que no atafien al sign ificado . Esta explicacion da cuenta de la dificu ltad para ofr diferencias en tre fon emas en un len guaje no fam iliar. Kuh l enco n tro que los n ifios n acen con h abi lidades rele­ van tes respect o dellenguaje que parecen depender de me cani smos gen erales de la percepcion aud it iva: no responden de man era espec ffica a una lengua en par­ ticular. Pero a los seis meses la percepci6n de los bebes ya esta polar izada por la exposicion a un a lengua espec ffica. Kuh l propu so la teorfa del magne tismo del l.enguaje nativo, en la que la ex pos ic ion a un a lengua en particular resulta en la form acion de representaciones almace na das de catego rias foneticas, que gene ­ ran "prototipos" de cada ca tego rfa. Los prot otipos acni an com o ima ne s percep­ tua les: la percepc ion cat egorizada es un a co nsec uen cia n atural. La teorfa de Kuhl es co mpa tible con la hi pot esis de que el cerebro funciona co mo un siste­ ma qu e opera en la Frontera del caos .

4. M ODELOS DE PERCEPCI6N

DEL H A BLA

Teorfa mot ora Esta teorla estab lece que los obje tos de la percepc ion de la palabra son trata­ dos com o gesto s fon eti cos del h ablante, repr esentados en el cerebro como co­ mandos de movi miento in variantes relacionados con ciertas configurac ione s ling uisticas sign ificativas (Liberman y Matti ngly, 1985) . Este s gestos no se rnanifiestan d irect arnente en la serial aciistica. El modelo es in completo pues no especifica co mo se logra la tr ansforrna­ cion ent re la serial ac ust ica y los gestos percibidos. Seg un Klatt, "es mas un a filosofla que un a teori a de la percepc ion del h ab la" (Klatt, D. H ., 1989) . Teorfa de los ra sgos in variantes A su vez, Stevens y Klatt defienden un a teoria en la que la percepci on se da en un a serie de etapas que incluyen un conjun to de det ectores fon et icos (Klatt, D. H., 1989). La primera eta pa oc urre en el sistema audit ive perifer ico (filtrado, su­ presion lat eral, adaptacion y sens ibilidad a la fase) . La segunda con sta de un a ba­ teria de detect ores aciisticos (det ec tores de ataque, de cambio espectral, de formantes y de period icidad) . La tercera etapa la for man un a serie de det ect ores de rasgos foneticos y sus decision es son especfficas de un a len gua deterrninada. 255

Finalrnente, aparece n eta pas de ana lisis de segmen tos y busqueda de lexico . Este mod elo esta basa do en la suposicio n de que es posibl e encon trar un mapeo relati vam ente in vari ante en tre los patrones ac usticos y los soni dos de l h abl a. S us det ract ores sefialan el caracter in evitabl emente sec uenc ial de las operac iones inv olu cradas. Modelo de red n euronal EI mod elo de McClell and y Elma n es co nexionis ta y esta basado en las teor fas de las redes ne uro na les (McClella nd y Elman, 1986) . Asum e q ue existen tres n iveles de represen tacion , cada un o de los cuale s co ntiene unidades de proce­ samiento alta rnente interco nectadas llamadas nod os. En el nivel mas bajo, los nodos represen tan rasgos foneticos, en el siguiente representan segmentos fo­ n et icos, yen el ultimo nivel representan palabr as. Por eje rnplo, el nodo corres­ pondiente a un fonem a especffico puede d isparar h acia dos 0 tres nodos correspon dientes al nivel de los rasgos asocia do s normalrnente co n di chos fone mas. La ac tivaci6n excitato ria 0 inhibitor ia puede f1uir en ambas direccio­ nes, desde niveles mas bajos h ac ia otros mas elevado s, 0 viceversa. Este modelo perrnite ex plica r varios aspectos de la percepc i6n de l h abla, tales co mo la resta uraci6n percep tiva de fonemas "perd idos", la percepci6n ca­ tegor izada y la armon izacion de dat os. Es un o de los mod elos compatibles co n la teor ia de la percepcion caot ica ,

5. LA BUSQUEDA DE

INDICADORES ACUSTICOS INYARIANTES

Cole y Sco tt nota ron que la percepcion del habl a in volucra la identificaci6n sim ultanea de , al menos, tres tip os de datos cua lita tiva rnen te diferen tes: indi­ cadores aciisticos invarian tes, indicad ores de pendientes del contexte e indica­ do res asentados en la envolve n re dinamica de la onda (Cole y SCOtt, 1974). En o tras palabras, cada sflaba contiene da tos in variantes y datos depe nd ientes del co n texte. Ex iste ev ide ncia de qu e la envoiven te dinarni ca de la on da pro­ vee in formacion sob re la co rnposicion fonernica de la serial y de que, en cier­ to grado, el siste ma auditive esta capaci tado para decodifi car los estirn ulos de l h abl a basa ndose un icam ente en las varia cio nes de la amplitud en el tiernpo. La naturaleza mul tidimensional de la informacion aciistica permi te un alto ni­ vel de redundan cia en la seria l del habl a. C oex iste n diferentes datos q ue per­ m iten la iden tificac ion de un fonem a determinado , aunque co n uno so lo de ellos se 10 pueda reco noce r. La redundancia sirve para supera r las arnbigueda­ des inherentes a l disc urso hablad o, para minimizar la inf1uenci a del ruid o y de 256

las interferencias, para compensa r las d isto rsiones de la sena l (por ejernplo en un a linea tel efonica) y par a supera r la ma la articulaci6 n de un locu tor. R esistencia del habla fr cnte al deterioro de la serial Es remarcabl e la resistencia del habla fre nte a varias forrn as de distorsion se­ vera. Los met odos de testeo de artic ulac ion las h an ca raloga do en : cantidad de ruid o de fondo , ca mb ios en el espectro d e frec uencia y recorte de picos. Cantidad de ruuio de fonda. La inteligibilidad de sflabas aisladas resulta sa­ tisfactoria co n un a relac ion sena l/ruido (SiR) de +6 dB. Sin emba rgo, las pala­ bras resultan inteli gibles aun para rel aciones SiR negativas si integran sente nc ias bien fonnadas, en particul a r si el oye n te esta farniliarizado co n el tem a, 0 si el h abl a y el ruido prov iene n de lugares diferentes. Cambios en el espectro de frecUencia. Se ha dem ostrado qu e, co n tra la afir­ maci6n tradi cion al, no h ay co m pone n tes en frec uencia esen ciale s para la co­ municaci6n. Se puede cortar un a serial de habla co n un filtr o de banda pasante de a 1.800 H z, de 1.800 a 20 .000 H z 0 de 1.000 :J. 2.000 Hz, y no per ­ der mucho en intel igibilidad . Recotte de picos. S i se coloca un ci rcuito que reco rte la sefial de entrada al 2% de su arnp litud pro med io queda un a onda casi rect an gular de per iodo varia­ b�e y se pierd e la infonnaci6n aportada por la forma de on da origina l. Sin em ­ bargo, se ob tiene n tasas de articu lacio n ent re el80 y el 90%: son necesar ios solo dos bits para cod ificar la amplitud sin perde r casi nada de inteligibilidad, Por su­ puesto que el son ido no result a "na tu ral" y es imposible reconocer al locuto r. En resum en, el siste ma de co municaci6n human o ha evo lucio nado de tal forma que pued e operar bajo un a gran variedad de con diciones adversas. Sin es­ tas capacidades el telefon o n o ex istiria, 0 serla ext rao rdina riame n te complejo.

a

6. INTELIGIBILIDAD DE LA PALABRA La inteligibilid ad del disc urso se refiere a la exactitud con que un oyen te pro­ medio puede entende r un a palabra 0 un a frase h abl ada. En un a situac ion n or­ mal parte de la informacion se ex trae de l co ntexto y de las sefiales visua les que acompafian a la fon aci6n y, po r 10 tan to, es posible entender el sign ificado in­ clus o si solamente un a fracci6n de las un idades ac usticas d iscretas se oye co­ rrectamen te. En otros casos el oye nte queda limitado a valerse unicamente de la informaci 6n ac ust ica, co mo oc urre en los siste mas de co rnunicacio n no pre­ senc iales, por eje mp lo el telefono 0 las gra ndes salas en las que se emplea re­ fuer zo electroacustico. 257

Un fonema es inteligible cuando se 10 oye de forma clar a y puede ser di­ feren ciado de l resto de los fonemas de la misma lengu a. La misma definicion puede aplicarse a un discur so art iculad o, aunque aqui acnian factores contex­ tuale s de irnportancia. Veamos prim ero que ocurre con los fon emas a islados. En este caso el pun­ to crftico en cuanto a la inteligibilidad son las consona n tes, pues al ser mas debil es que las voca les se pueden enmascarar con mayor facilid ad.

100 Silencioso •

90
l"

.0

'" '"

80

-o

70

'iii

Ruidoso .

..



-0

C

'(3

'"

:; o t

Ensayos de articulaci6n

''"" '" ~ '"

60

-0

La in vestigaci 6n en esta area com enzo con el desarroll o de los sistemas telefo­ nicos a fines del siglo XIX y de la radiofon ia a princip ios del xx. Los primero s intentos para definir numericarnente la inteligibilidad fueron los ensayosdear­ ticuiacum, que cons isten en pruebas de ca mpo en las que un locutor lee un conjunto de fonemas 0 palabras de una lista confeccionada al azar. Para evitar la influencia de elem entos no fone ticos, las secuencias ca rece n de sentido lin­ gufst ico y las sflabas estan ordenadas de manera estocastica. Es habitual el uso de listas estandarizadas para permitir la comparaci6n entre en savos.t Los oven­ res, distribuidos en la sala de una manera prede terminada, an otan los fonemas o pal abras que creen ofr, El result ado del test es el porcentaje de pal abras co­ rrect as -que coinciden con la lista original- para cada oyente. Ademas de los factores acust icos especific os que analiz aremos mas adelante, los en sayos de articulaci6n son muy sensibles a las caracteristicas par ticulares de cada locu ­ tor y de cad a oyen te. En las figuras 14 y 15 se pueden ver los resultados obte­ nidos a partir de dos grupos de locutores y oyen tes (Beranek, L., 1954). Una caractenstica a destacar de los ejemplos an teriores es la not able dis­ paridad en la resistencia al ruido que presentan las voces de los diferentes 10­ cutores. En las mismas condiciones de ruido intense, el prim er locutor de la figura 14 se comprende correctamente, mientras que el ultimo de la lista re­ sulta absoluta mente ininteligible. La rasa de art iculaci6n se puede con siderar una med ida valida de la inte­ ligibilid ad , que es aplicable iinicarnente a cada caso parti cular. El valor es re­ presentative de la sala en la que se reali z6 el en sayo y de las caracteristicas del locutor y de los oyentes que participaron en el, En condicio nes acusticas 6ptimas la art iculac i6n cas i nunca supera el 95% de respue stas correctas. Afortunadamente, un discurso art iculad o puede comprenderse aunque algunas silabas resulren ininteligibles porque el oyen te extrae el sent ido del contexte. Por esta razon, una rasa de articulaci6n del 5 En idioma ingles se util iza la lisra de fin ida en

258

el "H arvard P.B.50 word score".

50

~ 0



40 [ i

o

, 3

2

4

Lcicutores

Figura 14. Resulrado de un ensayo de articu lacio n de palabra a partir de cuatro locutores diferentes

Figura 15. Resulr ado de un ensayo de art iculac i6n de palabr a obten ido co n siete oyenres ubicados en la misma pos icion. El locutor fue siempre el mismo

259

80% permite co mprende r el discurso sin esfue rzo. C ua n do baja al 70 % los oyen tes deben co nce ntrarse co n esmero pa ra entender las sen ten cias y, por de ­ bajo de l 60 %, en la m ayor fa de los casos la in teli gibilidad resulta ins ufic ien te. Los ensayos de articulacio n , a un q ue brindan va liosa in formaci on sobre la in te ligibilidad , so n mu y cosrosos en ti em po y recursos, y en algunos casos pue­ de n resultar imposibl es de reali zar. En la ac t ualidad se usan principalm ente pa­ ra ve rifica r los modelos d ura nte el de sarro llo d e metod os ob je tiv os de med ici6n y predicc i6 n de la inteli gibilidad .

Medi cion indirecta y predic cion de la inteligibilidad Ex isten varios metodos d ispon ibles pa ra predec ir la in tel igibi lid ad de h ab la en un sistema de co mun icaci6 n 0 en el in te rior de un a sala. C ada un o de esros met od os se basa en el m ismo pr incipio fund am ental , qu e co nsi ste en h all ar al­ gun a relacion entre la serial del h ab la y el ni vel del ruid o que la in terfiere en el can al de co mu n ica cion , En esta relacion intervi enen los sigu ientes factores me nsurab les: el ni vel y o tras carac terfstica s aciisticas de la sefial em itid a, e l n ivel y co mp osici6n esp ec tra l del ruido de fon do, y la naturaleza del can al de com un icac i6 n 0 de la sala . En un en torno tranquilo, un a conversac ion produce un n ivel de presion son o ra entre 55 y 65 dBA medidos a I m de l locutor, aunque en situac ion es es­ peci ales el ni vel p ued e alcanza r 96 dBA. Como los ni veles varian sign ificativa­ mente en tre individu os, pa ra el d isefio de siste mas de co mun icac ion se ut ilizan los casos mas desfavo rables en lugar de los ni veles promed io. La tabla 1 presen­ ta los valo res estandart izados para el disefio de sistemas electroacu st icos en grandes salas pa ra pro sa. Cad a va lor se obtiene restando un desvfo est and ar al

prornedio. Tabl a 1

Esfuerzo vocal

Se enco ntro q ue un d iscurso gritado es mas d iflci l de en tende r que uno a n i­ veles medios, al margen del n ivel ac iistico fin al en el o fdo de los oye n tes . Es­ te efec to de sobrecarga, q ue ya ana lizamos en este cap ftu lo , se debe a los cambios en los t ransito rios del ataq ue y en la ento na cion de las forrnantes de la serial. Para sirnp lificar los ca lculos la sob reca rga se suele tr atar de la siguien­ te man era: en pr imer lugar, para altos n iveles de ernision se reduce la razon se­ fial-ruido permitida en el canal un valo r de -4dB cada vez q ue la serial supera en 10 dB el valo r base de 75 dBA (rnedi dos a I m del ernisor) . En segundo lu­ gar, se asume qu e los ni veles de ernision co mprendidos entre 45 y 75 dBA que no llegan a los oyentes con valo res super io res a 80 dBA no requieren correc­ cion po r sobreca rga . En to do cana l aciistico h ay siemp re cierto nivel de ruido de fondo. EI efec to mas o bv io de l ruido de fond o es en masca rar la serial del habla, C uanti ­ ficar este efec to es diftcil dadas las d iferen tes situac ion es posibles, pero co mo esta nda r de d isefio se co ns idera q ue ca da deci bel de ruido que se agrega por en cima de un ni vel base de 45 d BA debe co mpensarse co n un aumento de 0,6 dB en la sefial h ablad a. La n at ura leza del canal de cornun icacion tarnbien pue de afecta r de cisi­ va rnente la in teligibil idad del d iscurso h ab lad o . S u in fl ue ncia, be ne ficiosa 0 pe rjud ic ial, se p uede e val uar a pa rt ir de la respuesta al impulso del canal. Si se t rata de un a sala exis ten dos fact o res q ue se ana lizan por separado : el pa­ tr on de refle xiones y la reverberacion . En ge neral, el recin to re alzar a la in­ teligibilida d cu ando proyec te cie rta ca n t ida d de ene rgfa de ntro del per fodo de integraci 6n del di sc urso (de 35 a 50 rns). Dado q ue el ru ido de fondo se distribu ye de mane ra un ifor me e n el tiernpo, toda reflex i6n temprana mejo­ rara la rel ac ion seria l-ru ido del sistema . S in emba rgo , las reflexiones tard ias, los ecos y un a re ver ber ac io n e xce siva inte rfie ren con la serial y tienden a re­ duc ir la relac i6n sefial-ruido del ca na l, det erio rando la inteligibilidad d el d isc urso .

dBA

Re!aci6n seiial-ruido S usurro S uave Relajado Norm al (p rivadc ) Normal (p ublico) Voz levan rada Int cnso Muy int ense G rito Max imo

260

32 37 42 47 52 57 62 67 7Z 77

Prob ablemente sea la mas simp le y senc illa de las relac iones que se usan para med ir la inteligibilidad. Se la define co mo la resta entre el pro med io de largo tie rnpo, 0 ni vel sonoro continuo equ iva lente , de la serial del h abla en el pun­ to de recepc ion (LA eq. " iiul) Y el n ive l promedi o de largo tie mpo del ruid o de fondo (LA eq. ruido)' Ambos n iveles se miden en dBA:

Relaci6n seiiai-ruuu: (SR) = LA eq. seiial - LAeq

n,ido (dBA)

26 1

Las med ic iones de in teligibi lid ad del discu rso conforme a la re laci 6n sefia l-rui­ do reali zadas po r Brad ley sugiere n un a meseta de ni velaci6n po r en cima del va lor S R = + 15 dBA. En o rras palab ras, me jo rar el sistema m as alla de este va­ lor n o aurne n ra la in teli gibil idad del sistema. El defe ct o de este fndice es q ue n o contemp la la na tur aleza ac ustica de l canal de comun icaci6 n: relaciones de S R 6pt imas pueden co rrespo nde r a un a in te ligibilidad deficienre si, po r eje rn­ plo , la sala prese n ta un ec o desrac ad o.

[ndice de articulaci6n (Ai) EI prime r estudio siste ma t ico y profund o sobre la inteligibil idad de l h abla fue realizado po r H arvey Fletch er d urante la de cada de 1940 en los Laboratori os Bell. Flet ch er y su eq uipo , a pa rt ir del estudio de la relac i6n sefial/ruido de ca­ da banda de un terc io de oc tava , cre a ron el iiuuce de articulaci6n (AI) , un ex ­ ce le n te rne todo pa ra eva lua r los efec ros de l ruid o en la inte ligibili dad . EI AI es basicame nr e una med ida de la in te ligibilidad basad a en e l coc ien ­ te serial/ruido en c inco bandas de oc tava. EI calculo del A l co ns iste en tres pa­ sos basicos: medi ci6n del cocien te sena l/ruido eficaz pa ra cad a band a de oc tava, ap licaci6n de un facto r de co mpensaci6n tabulado para cada banda y ca lculo del valor med io . La siguien te ecu ac i6n sintet iza el procedim iento:

Al

G(i}

5

30dB

.=1

=- - L

(LA eq . seiial - LA eq

ruido +

12) dB

e n la q ue el fact o r de co mpe nsa ci6n G r,] va le: Frecuencia(Hz)

G r,}

250

0.072

500

0.144

1000

0.222

2000

0.327

4000

0.234

EI Indice de art iculac i6n no es sensible a los cambios en la reverberaci6n y a la presenc ia de distorsion tem poral en el camp o aciistico, factores q ue sf co ntern­ plan los ensayos de art iculacion. Por ella se lim ita su aplicac i6n a ca mpos aciisti ­ cos sin defec tos ostens ib les y con un tiempo de reverb eraci6n maximo de 0,5 s. 262

Dur ante varias decad as, el AI y los e nsayos de articulac io n fueron los uni ­ co s met odos cap ace s de evalua r la inteligibil idad del ha bla. Se sabla q ue el ri ­ po y la complej ida d de la serial de pru eb a (pa labras art iculadas sin se n tido contra palabras cone ct adas en un a sen te nc ia signi fica tiva ) tien en un irnpact o importante en los result ad os. S in e mba rgo, la ac ust ica de esos ti empos n o po­ dfa diferenciar c uan ritat ivarnenre ent re las dos secuencias. Tampoco inclu ia elemen tos prop ios del canal de co mun icac i6n, co mo el patron de reflexion es o la re verbe rac io n , ni co n te mplaba algunos efec tos psicoac iisticos rele vantes co mo el en rnascararn iento . Era necesario h all a r o tro merod o de evalu ac i6n q ue superase estas lirnitaciones. [ndice de transmisi6n de la palabra Introduc ido por Steen ek en y H ou tgast , e l fndice de transmisi6n de fa polabta (STI )6 es basicarnenre un a ve rsi6 n mej o rada del In di ce de la art iculac i6n que in cluye las d isto rs iones te mp o ra les e n el ca na l d e co m un ica ci6n (S tee ­ neken y H ourgast , 198 0 ). El STI se basa e n las ex pe rienc ias de det ecci 6n de modulac i6 n desc rip tas e n e l pun to 3 del ca pit ulo II. Las seria les del h abla se co ns ide ran como un flu jo de ene rgia co n va riac io nes espec tro-te rnpo rales y el grad o de prese rvaci6n de estas va riac ion es a t raves del ca na l de co rnun i­ ca c i6n se to rna co mo un a med ida de su fid elida d . Los autores argumen taro n q ue la conse rvaci 6 n de la envo lve n te d in arn ica impl ica la prese rvaci on d e sus compo n en tes de Fo ur ie r en el p unto de recepc i6 n. EI n ive l co n ti nu o eq uiva len te de la sefia l del hab la es sust it uido po r un a seria l teo rica de prue­ ba, c uya intens idad es modulada por un a func i6 n s in uso id al co n un Indice de la modul ac i6n m = 1. C ua lq u ier degr adaci 6 n de la se ria l e n e l ca na l de comuni caci 6n apa rece ra co mo un a red ucci 6 n en e l fn d ice de la mod u la­ c i6n e n el p unta de recepci on . Steene ke n y H ou tgast aco ns eja n el e rnp leo de seria les mo d uladoras de frec ue n c ias co mp rendi das en tre de 0 ,4 y 20 H z pa ra repres e n ta r el grade de in tel igibi lid ad a tod as las tasas de oc urrenc ia del h ab la . S i f rep resenta la frecuenc ia de la serial modul adora y t es el tiem po en se ­ gundos, en tonces la inte nsidad de la sefial de pru eb a es modul ada por la fun ­ ci6n 1 +cos(2n ft ). El fnd ice de mod ulac i6 n en el pun to de recepci6n es fun ci6n de la frec uenc ia y se ca lcula co n la siguien te ex presion , q ue se dedu­ ce de la repuesta di screta al imp ulso entre los ex tre mos de l ca na l:

6

Del Ingles Speech Transmission Index.

263

~

L.J

a ( -j nf ~) n

e

rn2

n

m( f ) = - - - ­ an

L n

r;

Usando mediciones empfricas de las sefia les reale s de prueba, es posible medir el STI de cualquier sala 0 siste ma de co mun icac i6n. Si se reduce el numero de bandas de octav a se pu ede construir un sistema mu cho mas sencillo y rapid o denominado RASTI,7 qu e permite determinar la inteligibilidad del habla en tiempo real.

Perdida de articulaci6n en consonantes en la qu e c es la ve loc idad del son ido y rn la trayectoria entre el em isor y el re­ ce pto r. S i se desea incl uir el efec to del ruido de fondo se la deb e rnod ificar de la siguien te man era:

L n

Is an

r;

m'(f)=m(j) - - - -

IsL~+ l R n

r,;

aquf Is es la inte ns idad promedio de la serial del habla en el punta de recep­ c ion e l R la intensida d del ruido de fondo. En esta fun ci6n se manifiest an los efectos del patron de reflexiones y de la reverb er aci6n. Ta mb ien es posibl e deducir de manera senci lla un coc ien te sefial/ruido aparen te:

(S/R)ap = 10 log ( m (f) ) , I-m(f) Si se recorta cada coc iente individu al a un valor limitado entre + 15 y -15 dB, se ca lculan las relaciones SIR apare n tes por bandas de octav a y se prom edi an los va lores de las 14 band as in volu crad as, queda: 14 --

L

(S/R )ap

ocr. I

(S/R)ap = --14.

El Ind ice de tran srnision de la palabr a (STI) representa un a razon lin ealizada de la forma:

ST1= (S/R)ap + 15

30

264

Como la inteligibilidad de la pal abra depende en gran medida de la audi ci on correcta de las co nso na n tes, a veces se emplea un Indice denominado per-dida de articulaci6n en consonantes (% A lco ns ) qu e se ca lcula unicamente en la ban ­ da de 2.000 H z. Es un Ind ice apro p iado para pred ec ir la inteligibilidad por software durante la eta pa de disefio de un a sala. Por eje mplo, a distancias rna­ yores que el radi o de reverb er aci on, la pe rd ida de articulac ion en consonantes se calcula de la sigu ien te ex presi6n:

%A lcons = 9 TR ~ i -a en la qu e TR es el ti empo de rev er ber aci on globa l en segundos, S es la su­ perficie interi or total de la sa la y a es el coe fic ien te de absorcion medio d e la sala.

Ayuda visual Se sabe que la lectura de los labi os perm ite que las personas hipoacusicas par­ ticipen en un a conversacion. Las personas con ofdo n ormal tambien se bene­ fician con la info rmac i6n v isual y, si b ien no les perrn ite la comprensi6n completa del discurso h ablado , la reconstruccion fonetica en presencia de rui­ do se facilita al obs erva r el rost ro del locutor. Se h a co mpro ba do qu e la informaci6n lin gufstic a se comprende mejor cuando se la tr an sm ite por television qu e por radi o (Reisberg y McL ean , 1987). Macleod y Sum me rfield encontraro n que el "beneficio de la lectura de labios" corresponde a un aume nto promedi o de 11 dB en la relaci6n sefial-rui­ do del sistema y O stberg probe qu e el tarnafio del monitor de video tambien contribuye en el m ismo sen tido (M cLeod y S umme rfield, 1987). Estas ob ser­ vacion es confirman la idea intuitiva de que la informacion visual contribuve 7

Del ingles Rapid Speech Transmission Index.

265

100 so

ro

Apendice I Teorema de Fourier

80

<:;

i!'

" 0

"' ro

60

(iJ <J)

:J o,

co

~

40

<J)

-0 <J)

'ro

20

C <J) ~

0

0

0..

-l­ -30

-20

-10

o

Relaci6n Senal! Ruido (dB)

Figu ra 16. A umento de la inteligibilidad en condiciones de ruido al agregar infor macion

visual

a rnejorar la in telig ibilidad, sobre todo en condicio nes adversas provocadas por la existe ncia de ruido en el cana l de comun icacion . En la Figura 16 se observa el result ado del expe rirnen ro de Ben oit , en el q ue se midi6 la inteligibilidad en funcion de la razon sena l/ruido en dos sit ua ­ cio nes diferentes: s610audicion y audic ion mas vision (Benoit , C. et al., 1994). La vision es innecesaria en condiciones acusti cas optirnas (SIR > 0 dB), pero resulta decisiva en condicione s aciist icas alta mente degradadas (SIR = -24 dB) en las que la informacion auditiva no alcanza para entend er el discurso lin ­ gufstico.

El teorema de Fourier se puede en unciar de la siguien te rnanera: "Toda funcion period ica de perfodo P puede descomponerse en una suma de sinusoides arrno ­ nicas, de amplitudes y fases adec uadas, cuyo primer arrnon ico 0 fundamental posea perfodo P".1 En otros terminos, un a suma de sin usoides armonicas gene­ ra una onda periodica cuyo perfodo co inc ide con el perfodo de la sinusoide de menor frecuen cia, llamado primer arm6nico 0 fundamental de la serie. El teore­ rna permite descomponer y analizar cualquier funcion periodica y habilita la posibilidad de cons truir sefiales periodicas complejas a partir de un a suma de sinusoides puras. Record emos que un a sucesio n es armonica cuando presenta una base y to­ dos sus mult iples. Es un caso particular de sucesion arit rnetica en la q ue la ba­ se ao coinc ide con la razon k (an = aa + n k con k = ao)· Por ejernp lo, un a sucesion arrnonica de base 5 es: 5, 10, 15, 20, 25, ... , n x 5; y una de base 300 : 300, 600, 900, 1200 , ... , n x 300. La diferen cia entre dos valores sucesiv os, 0 raz6n de la sucesion arrnon ica, es igual al valor de la base. Asf en el ultimo de los ejemplos 1.200 - 900 = 300; 900 - 600 = 300, etce te ra. La disposicion de las amplitudes y frecue ncias de las sin usoides involu cra­ das en la suma se denom ina espectro de Fourier, y cada una de ellas toma el nombre de componente de Fourier. Aunque la co mplejidad de las operac iones mat ernat icas involucradas en el calculo de los arrnon icos es grande, en la ac tualidad ex isten num erosos pro­ gramas de cornputacion que los realizan con gran eficie ncia. Aun sin realizar grandes esfuerzos mat ernati cos podemos extraer num erosas conclusione s cua­ litativas que son de ut ilidad. Por ejernp lo, el teorema dice que una funcion pe­ riodica posee un espec tro arrnon ico. Si te ne mos un a serial periodica y 1 En realidad exisren cierras restriccion es matematicas: las funciones deben ser secc ional ­ mem e co nt inuas adernas de period icas. Afortunadamenre, las que interv ienen en acustica musical cumplen con estos requisitos.

266

267

2

los rnotivos de su emp leo en gra n ca n tidad de ap licaciones prac t icas. La voz humana y algun os instrumen tos, como el v iolin 0 el oboe, generan sefia les q ue se le aproxim an .

h = 2 mm

-l. . •. .. •• •• • .• .

Tiempo (ms)

E

.s §

Reconstruccion de parcia les por batid o

0

ro a.
W

-1

-2

'

~

I

.

I

i:

Periodo P= 10 ms

E

A

0,64

=0,64 mm

.su

f,

'6. 0,32

f, = n f ,

.3

E


0,213

=1/

P

= 100 Hz

+-"m.u r, r,

f2

f3

= 100 Hz

r.

f5

Frecuencia (Hz)

f6

f7

f.

f5 = 500 Hz

f9

f,o

f,o = 1000 Hz

Figura 1. G rafico temp oral y espec rral de un a onda dien re de sierr a

conocemos su per todo , sabemos inmediatamen te : 1) que el espectro co rres­ pondiente sera arrno n ico, y 2) cu ales seran las frec uencias de cada un o de los arrnon icos (la co rres po nd ien te al pert odo de la seria l original y sus mu lt iples) . Desconocerernos, h ast a qu e se ap lique completo el teorema de Fourier, las am­ plitudes de cada un o de esos arrnon icos. C om o ejemplo aplicaremos el an alisis de Fouri er a la fun ci6n diente de sie­ rra dibuj ada en la Figura 1. El espectro resultante nos muestra que posee todos los armo n icos posibles desde la fundamenta l ha sta el infinite . La amplitud de cada un o de ellos va decreciendo a med ida que aum enta la frec uen cia segun la ley A n = Ai / n, siendo n el ruimero del arm on ico, Ai la amp litud de la fund a­ mental y A n la arnplitud del armo n ico numero n. Por ejernplo, el quinto arrno­ ni co tendra un a am plitud A 5 = Ai / 5 , cinco veces menor que la fund am ental. En teo ria, se deb en suma r todos los infi ni tos arm6nicos para sin te t izar ex act arnente un a onda diente de sierra. Es esta gran riqueza armonica un o de

268

Dos sinusoides de distin ta frecuenci a baten a un a rasa igual a la difer en cia de frecuencias entre arnbas, C omo las co rnpone n tes de Fourier son sinusoides, es de espe rar que est e fenorneno tenga lugar para todo par de co mpo nentes ar­ monicos que se consideren . S i fny i; son las frecuencias de dos armonicos cualquiera, la frecuenci a de baudo sera fb= fro La frec uencia de batido en­ tr e arrnonicos siempre va a co inc id ir co n la frecuencia de algun ar rnonico de la serie . En particu lar, dos componentes co nsecut ivas baten a la frec uencia de la fun damen tal. Por ejemplo fz - fl =fl; h - fz =fl; ... .i; - fn-l =fl ' La armonicid ad de un espectro refuer za la periodicidad dada por su fun­ damental. lnclu so , aun que falte la fund amental, la frec uen cia que le cortes­ ponde se reconstruye a partir del baudo de sus arm onicos. Este fen orneno , de gran irnportancia musical, se co noce como fundamenral perdida 0 [axvasma de la onda , Un ejemplo de reconstrucc io n de la fund amenta l se da cua ndo se repro­ d uce rruisica a craves de un altavoz pequefio, incap az de rad iar ondas de baja frec uenc ia. Como la mayor fa de los instrurnentos graves -contrabajos, fagotes o bajos elect ricos- producen seria les espectralmen te ric as en arrnonicos, se puede n oir los bajos de la musica porque los primeros armon icos se recon stru­ yen por batido a pesar de n o esta r presentes a la salida de l altavoz. El fenorne ­ no de fund amental reconstruida tambien puede originarse durante el proceso de percepci6n . Ocurre , por ejemplo , cu ando do s sefiales acce den , a tr aves de auriculares, de manera ind ependiente a ca da un o de los otdos: en ese caso n o exis te baudo ftsico , de rnan era que la fund amental se reconstruye en algun lu­ gar de la cad ena neural de procesam iento superior.

269

Apendice II Principia acustico de indeterminaci6n

La serie de Fourier se pued e aplicar uni camenr e a seriales perrnanentes perio­ dicas cuyos espectros son siempre arm6nicos y de lfneas, N o es posible ana li­ zar con ella el estado transitorio de un a serial, que se puede definir com o el intervale temporal en el que una onda evoluciona de un estado perrnanente, o est acionario, a otro. Asf como h ay sefiales to talmen te tr ans itori as -Ia gene­ rada por el golpe sobre un a mesa es un buen ejernplo-, existen otras que pre­ sen tan caract eri st icas tr an sit ori as en el co m ienzo y en la extincion , permaneciendo relativarnente esta bles dentro de esos lfmite s. Por oposicion al estado perrnane n te, en el que roda oscilaci6n es una combinac i6n de sin usoides de du raci6n in fin ita, el estad o transitorio posee una duraci 6n finit a y necesariarnente ocurre por 10 menos al comenzar y fina ­ lizar una sefia]. C ualquier rnodificacion de las condiciones de oscilacion en medi o del desarrollo de una onda , como el carnbio en la amplitud 0 la frecu en­ cia de alguna cornpon ente, form a part e del estado tran sitorio. EI efecto de vi­ brato, que co nsiste en una variaci6n periodica de la frecuencia y/o de la arnplitud de aproximadamen te 7 H z, origins en much os casos la supres ion del estad o perrnanenre en la porcio n de serial a la que se aplica. En sefiales sin es­ tado perrnan ente el estado transitori o co inc ide con su dur aci6n. J. B. Fourie r desarrollo la tranfo't1nada 0 integralde Fourier para extender el alcanc e de sus series a todo tipo de sefiales, sean perrnane ntes 0 transitori as. Una de las derivacion es mas import antes de la transforrnada de Fourier esta­ blece q ue las sefiales limit adas en el tiem po poseen espectr os de band a. Se puede concluir, por sirnetrfa, que los espec tros de lin eas, arrnonicos 0 no, co ­ rresponden a sefiales no limit adas en el tiempo. Todas las sefiales reales, o bviarnen te limit adas en el tiempo, poseen anchos de banda no nul os. La onda que gene ra un diapason posee una gran duraci6n y un pequerio anc ho de band a, mien tras que la que produce un tamb or se ex­ tingue rapidarnente y ocupa un anc ho de band a co nsiderable. Podemos pregun ­ tar por la existencia de alguna relaci6n general entre duracion y an cho de

271

iD

iD

!'! o

!'!

~

~

o c

c

51

51

,0

c 'in

-0

i"

i"

c

"in

0.

0.

QJ

QJ

-0

-0

~ Z

W

Freeuencia (Hz)

>

Z

ti/ = oo

M= 0

ro~

iD ~

[1'

[1'

o

o

c

c

51

51

c

c

-0

-0

"in

"in

i"

i"

0.

0.

QJ

Tiempo (ms )

-0

W >

QJ

-0

W >

Z

Z

6 1= 0

iD

iD

[1'

!'!

~

g

o

c

51

51

-0

c;

-0

c

"in

"in

i"

i"

0.

0.

QJ

QJ

-0

-0

~

~

"z

M= oo

~

I

I

Freeuencia (Hz)

espec tro contendra un a sola lin ea (com o era de espe rar) . Si se anal iza un im­ pu lso de duraci6n tl c -7 0, el ancho de banda tl f sera 1 divid ido (cas i) cero que equ ivale a infiniro , Este result ado co nfi rrna qu e el espectro de un impulso es un ruid o blanco can un anc ho de banda infinito. En el caso intermedio de un a se­ fial limitad a en el t iempo -
Z

I

61

M

I

Figura 1. Ap licac i6n del principia de indeterrninacion a diferenres senates

ba nda. De ac uerdo co n el desarro llo de Fourier las representaci on es te mpo ra­ les y espec trales son dos formas de int erpretar el mism o fen 6m eno. El vin cul o qu e las relacion a se dedu ce sin dificul tad a partir de la tranformad a de Fouri er y se den omina principia acUstica de indeteTminaci6n. Se 10 puede en unc iar de la siguien te rnan era: "el pro ducto entre la duraci 6n de l esta do transitori o de un a serial y el anc ho de banda que le co rrespo n de n o puede ser inferi or a un cie rto va lor mfnimo". S i tlf es el ancho de banday tlt la dur aci6n del estado transi­ tor io, el princ ip io ac iistico de ind eterrninacion est able ce, para el caso gene ra l: tlf x tlt ~ 1

S i se aplica la relaci6n anterio r a un a s in uso ide, co mo en ella la duraci6n tlt tiende a infinite el anc ho de banda co rrespondiente (tl f ~ l /tlt ) sera nulo y el

272

273

Referencias bibllograficas

Ando, Yoichi (1998 ), Architectural A coustics. Blending Sound Sources, Sound Fields , and -

Listeners, Nueva York , Spr inge r-Verlag. et al. (199 7a), "Acoust ic Design of a Conce rt

Hall A pplying the Theor y of

Su bject ive Preference, and th e A coust ic Measurement aft er C on strucct ion", -

Acustica & Acta Acusncc , 83 . y Dennis N oson (199 7b ), Music and Concert Hall Acoustics, Londres, Academ ic

Press Limi ted. - (19 85 ) , Concert Hal! Acoustics, Berl in, Sp ringer-Verlag. Aronson, L. et al. (200 S) , "Carac te rfst icas ac usti cas de la voc ales del es pafiol rio­

platense", pub licad o en in ternet po r la Fundacion A rauz. Attneave, F. y R. O lson (197 1), "P itch as a Med ium : A New A pproach to Psychoph ysical Scaling", AmericanJournal of Psychology, vo l. 84. Backus, J. (1969 ), The Acoustical Foundations of Music, Nu e va York, W.W. N orto n & C ompany Inc. Barton S . (1994 ), "C hao s, Self-O rgan izat ion and Psychol ogy", American Psychologist, vol. 49. Basso , G . (200S) , "Orde n gene rat ive , Irac tales y miisica'', en Revisw. del Ins titu to

Superior de MUsica UNL, N Q 10, Sa nta Fe. -

(2004 ), "Varia bles de d isefio e n ca mp os ac ust icos no expon enciales", en A et as de las Terceras [o rn adas de Acust ica Elec troacus t ica y A reas Vin culadas (CADAE) , Buenos Aires. (200 2), "Frac tales y es truc turas musicales aurosernejan tes", en Aetas de XV

-

C onferen c ia An ua l de la A sociaci6n A rgentina de M usico logia, Buen os Ai res. (2001 a ), Andlisis espectral. La transformada de Fourier en ml/.Sica, La Plat a, Ed. Al

-

Margen - UNL P. (2001 b ), "Fracrales, ruid o l /f y rruisica", en Acw.s del Encuenrro Nacional 2001 de

-

Investigaci6n en Artes y Diseiio (EN IAD 2001) , La Plata. (2000 ), "Pe rce pc ion auditi va. Nuevos en foq ues", Bem al , UNQ, mim eo .

-

(1999 ), "E l princi pio de inde term in aci6n en ac ust ica m usica l", en AcUlS de la XIII

w.

275

III!\"

Conferencia Anual de la Asociaci6n Argenrina de Musicologia , Bue nos A ires . _ (1998a), "M odelos cs ta t icos I' d inarn icos e n ac ust ica mu sical ", en Acres de la 2 ~ Conferencia Iberoanericana de Invesrigaci6n Musical, Lan ds. - ,J . Guillen I' M . Liut (2000) , "Cond icion es necesarias par a el uso mu sical eficaz de l desplazarnien to ac ust ico temporal", Actas del II Congreso Iberoamericano de Acusnc«, Mad rid. - et al. (1 998a) , "Limitcs de a plica c i6n del desplazamiento aciistico te mpora l", en Actas de la XII Jorruulas Ar'genrinas de MU5ico logia, Buenos A ires. - et al. ( 1998 b) , "El de splaza rnicn to ac ust ico rempo ral. A juste de la ex pe rie nc ia I' uso mu sical" , en Actas de las 11I JOT7UU1as del insntu to Julio E. Payr6, Buenos A ires. Bekesy, G . Von (1 960) , Experiments in Hearing, N ue va York, W iley. Be na de, A. H . (19 76) , Fundamentals of MU5ical Acousncs, Nueva York , Oxford

C halmers, D. (1996 ), "EI prob lema de la co nc icnc ia", Inuesrigaci6n y Ciencia, N 233 . C hion , M . (1998) , "Du son a la cho se: h ypo th eses sur l'objet sono re", L'analyse musi­

Un iversit y Press - (1960), H ams, Strings and HamlOny, N ue va York, Anchor Books. Benoit , c., T. Mohamadi I' S . Kandel (1994 ) , "Effec ts of ph onetic contex t on a ud io­

C ulve r, C. A. (194 7) , MusicalAcoustics, Filadelfia , Blac kiston . Delgute , B. (1 987 ), "Peripheral aud itory processing of speech information", en The

visual intelligibility of French spe ec h in noise", Journal of Speech & Hearing

Research. Beranek , L. ( 1996), Concert and Opera Halls: How they Sound, N uev a York, A cou st ical -

Society of A me rica . (1988 ), Acousrical Measurements, Wood bury, A co ust ical Society of A merica.

-

(196 2), Music, Acoustics. and Architecture, N ue va York, Wile y. (1954 ), Acoustics, McG raw H ill [trad., (196 1) , A cusncc , Buenos A ires, Edi to rial

H ispan o A mer ican a]. Bism ark , G . von (1 9 74 ), "Sharpness as an att ribute of th e t imbre of stea dy sounds",

Acustica, vo l. 30 . Blaue rt, J. (199 7 ), Sparial Hearing. T he psychoph)'sics of human sound localization, Ca mbridge, MIT Press. Bregman , A. (1 994), Auditory Scene Analysis, Ca mb ridge, MIT Press. Brown ell, W. E. er al. (1985 ), "Evok ed Mechan ical Re spon se of lso lat ed C oc h lear O ute r H air Ce lls", Science, vo l. 22 7. Butler, R. A. ( 1969) , "Mo naura l a nd bin aur al local izati on of no ise bursts ve rt ically in th e med ian saggital plane", Journalof Auditory Research, vo l. 3. Butler, D . (1992 ), The Musician's Guide to Perceprion and Cognition , N ueva Yor k, Sc h irme r Books. C adoz, C. et al. (1993) , "C ORDIS-ANIMA: a Mod eling and S imu lat ion Syste m for So und and Image Sy nthes is-T he Gen era l For mali sm", Computer' MU5ic] oumal, vo l. 17. Ca rlson , R., B. G ra ns tro m I' S . Hu nnicutt ( 198 2) , "A multi -lan gu age tex t-to -speech module", Proceedings of ICASSP, vo l. 82 . Ca rlyo n, R. I' B. Mo ore (1984 ), " In te nsity d iscrim ination: a sev ere depar tu re fro m We ber 's Law", Journal of the A cousnccl Society of America, vo l. 76.

276

Q

cale , vol. 11. C o lbu rn , H . S . (1995 ), "Computati onal models of binaural processing" , Auditory Computarion, Nueva York, S pringe r-Verlag. Cook, P. (1999 ), Music , Cognition, and Computarized Sound, Ca mbridge, MIT Press. C how ning, J. (1999 ), " Perceptua l Fusion a nd A ud itory Persp ec tiv e", Music, Co gnirion , and Computarized Sound, C ook (ed. ) , C a mbridge, MIT Pre ss. C o le, R. I' B. Sc o tt (1 974 ), "Towa rd a the ory of speec h pe rcep t ion ", Psychological Review, vo l. 8 1. Crowder, R. G . (1 989 ) , "Image ry for musica l t imb re", Joumal of Experimental Psychology: Human Perception and Perfonnance, vo l. 15.

Psychophysics of Speech Perception, Parses Bajos, Nijhoff. Den nett, D. C. (1 993 ), Coscie nza, Mil an , R izzoli. Deutsc h , D. (1999) , T he Psychology of Music, Nue va York, A cade m ic Press. _ (1995), MU5ical lllusions and Par'adaxes, La Jo lla, Phi lornel R. In c. Q _ (1 99 2) , " Parado jas de la ro na lidad mus ica l", Invesrigaci6n y C iencia, N 193 . _ (1975), "Two-ch annel listening to musical sca les", Joumal of the Acousrical Socie ty

of America, vo l. 57. Di Liscia, O . P. (2000 ), "Spa t ial listening and its computer simulat ion in electron ic music", en . Divenvi, P. (1 992 ), "Binau ral suppressio n of no nechoes" , Journal of Experimental

Psychology: Human Perceprion and Performance, vo l. 9 1. P. (1 992) , "T he effec t of ba nd wid th on aud ito ry localizati on: An estimation the or y mode l", Proceedings of the 12th Internarional Symposium on Hearing, Lon dres, Pergamon Press. _ I' Danner, W. (1977) , "Discrim inat ion of time inter vals mar ked by brief aco ust ic pulses of var io us intensit ies and spec tra", Percept . Psychophys., vo l. 2 1. Durlach, N . I. I' L. D. Bra ida (1969) , " Inte nsity pe rce pt io n . I. Preliminar y theory of in tens ity resol ut ion ", J.Acoust. Soc. Amer., vo l. 46, pp. 3 72-383 .

_

I' Zakarau skas,

Eh resman, D. (1 978 ), "Percept ion of t imb ral an alog ies", Rapports IRCAM N ° 13/78. Erick son , R. (19 75 ) , Sound Structure in Music, Berkeley, Uni versity of California Press. Fec hner, G . (1 860 ) , "E lem e nt os de psicofisica", pub licado en int e rn et.

Fevrnan , R. (1971 ), f(sica, Panama, Fo nd o Ed ucat ive Lati n oa rner ica no .

Fin e, P. A. I' B. Moor e (1993 ), "Freq ue nc y ana lysis a nd musical a bility", Music

Perceprion, vo l. 11. Flet cher, H. , W. A. Munson (1933 ), "Lo ud ne ss, its de fin it ion, mea surement and cal­ culati on", Journal of the Acousrical Society of America, vo l. 5.

277

Fletch er, H . (1995), "Speech and Hearing in Communi cation - A SA Edit ion ", reirn ­ preso, Woodbury, A me rican Ins ti tut e of Ph ysics. Fraisse P. (1967), Psychologie du temps, Paris , PUF.

Fraser, J. T. (1992), II Tempo, una Presenza Sconosciuca, M ilan, Felt rin elli,

Freed, D. J. (1990) , "Audi tor y co rre la tes of pe rceived ma llet h ardness for a set of

record ed per cussive sound events", Journal of the Acoustical Society of America, vo l. 87. Freeman, W. (1991), "Fisiolc gfa de la percepc ion", Investigaci6n y Ciencia , NQ 175. Gardne r, M. (1968), "His to rica l Background of the Hass and/or Preced en ce Effect ", Journal of the Acoustical Societ)' of America, vol. 43. Ga rne r, W. R. y G . A. Mi ller (1947), "T he masking th reshold of pure ton es as a func ­ tion of du ration ", J. Exp. Psycho/., vol. 37. G lasberg, B. y B. Moore (1990), " Deriva tion of aud itory filter sha pes fro m not ch ed n oise dat a", Hearing Research, vol. 47. Goertzel, B. (1993) , The evolving mind, Nueva York, Gord on and Breach Sc i. Pub . Go ldste in , J. L. (1973), "A n op tim um processor th eor y for the central form at ion of th e pitch of co mp lex to nes ", Journal of the Acoustical Society of America, vo l. 54. G oode, R. L. et al. (1994) , "N ew know ledge abo ut th e fun cti on of th e human ear : deve lopmen t of an improved model", Am . J. Otol., vo l. IS . G rant ham, D. (1995), "Spat ial hear ing and related ph en omen a", en Hearing, ed. B. Moo re, Nu eva York, Acade mic. G reen, D. M. (1973), "Temporal acuity as a func t ion of frequ en cy", Journal of the Acoustical Society of America, vo l. 54. G rey, J. (1975), An Exploration of MusicalTimbre , CCRMA , S tan ford Un iversity. Guillaum e, P. (1975), Pisicologfa de la forma , Buen os A ires, Psiq ue. H aas, H . (1951) , "Uber den e ing luss e in es einfach echos auf die h orsamk ei t von sprache", Acustica, vo l. I [trad . a l Ingles, (1972), 'T he in fluen ce of a sing le echo on the audi bility of spee ch" , Journal of the Audio Engineering Societ)', vol. 20]. Hafter, E. y" T. Bue ll (1990), "Resta rting th e adapted bin aura l system ", Journal of the AcousticalSociety of America, vo l. 88. Hall, J. W. y R. W. Pet ers (198 1), " Pitch fro m no nsirnultaneous successive harmoni cs in quiet and noise", Journal of the Acoustical Society of America, vel . 69. Ha ll, J. W. et al. (1984) , " Detection in noise by spec rro- rernporal pa tte rn ana lysis", Journal of the Acoustical Society of America, vol. 76. -

y M. Fern and ez (1984), "T he role of rnon oaural frequency se lectivity in bina ural ana lysis", Journal of the Acoustical Society of Amencs, ve l. 76.

H all , D. (1991) , Musical Acoustics, Ca liforn ia, Brooks/Cole Publi shing Company. Han del, S. (1995), "Timbre percep tion and audito ry object ide ntificat ion", Hearing, ed. B. Moo re, Nu eva York, Acade mic Press. - (1989) , Listening, Cambridge, MIT Press.

278

H elmho ltz, H . von (1885) , Die Lehre von den Tonempfidungen [trad. en ingles, (1954),

On the Sensation of Tone, trad . A. J. Ellis, Nu eva York, Dover Publicat ions]. Henning, G . B. (1970), "Compar ison of th e effects of sign al dur ation on frequency an d amplitude discr imin at ion", en Frequency analysis and periodicity detection in hear­ ing, ed . Plornp, Leiden , Sijthoff H irsch , 1. J. ( 1959), "Aud itory percept ion of temporal order", Journal of the Acoustical Society of America, vol. 3l. Hourga sr, T. (1976) , "S ubharrnon ic pitc hes of a pure to ne a t a low SIN ra tio", Journal of the Acoustical Societ)' of America, vol . 60. - (1972), "Psych oph ysical evide nce for lateral inhibit ion in he aring", Journal of the AcousticalSociet)' of America , vol. 51. - Y Sreen eken , H .. (1984), "A mult i-language eva lua tion of th e RASTI-Me tho d for estim ating speech inte lligib ility in aud ito ria", Acustica, vol. 54. H~tsma , A. y J. Go ldste in (1972), "The central origin of the pitch of pure to nes : evi­ \\ence fro m musical int erval recogn ition ", Journal of the Acoustical Society of America, vol. 51. - , T. Rossin g y W. Wage naa rs (1987), Auditory Demostraiions, ASA (cd y libro). Iverson, P. y C. L. Kru mh an sl (1989), "P itch and t imbre interac t ion in isola ted ton es and in sequences", Journal of the Acoustical Society of America , vol. 86. Ive rson , P. y C. L. Krumhan sl (1993) , " Iso lat ing th e dynami c at tribures of musical tim­ bre", Journalof the Acoustical Society of America, vol, 94. Javel , E. (1980) , "C od ing of AM tones in the ch inc hi lla aud ito ry nerve: implication s for th e p itch of complex to nes ", Journal of the Acoustical Society of America, vol. 68. Joh nson , D. L. y H . Gierke ( 1974), "A ud ibility of infrasound" , Journal of the Acoustical Society of Amelica, vo l. 56. Kat z, D. (1967) , Pisicolog(a de laforma, Madrid , Espasa-C alpe. Kemp , D. T. (1978), "S timulated Aco ustic Emissions from with in th e A ud ito ry S ystem" , Journal of the Acoustical Society of America , vo l. 64. Kendall R. A. y E. C. Cartere rre (1993), "Verbal att ribu tes of simul tan eou s wind ins trum ent timbres: II. Adjec tives induced from Pisto n 's Orch estration ", Music Perception, vol. 10. Kendall , R. A. , E. C. Cartere tt e y J. M. Hajd a (1999), "Natura l vs. synt he tic instru­ ment ton es", Music Perception, vo l. 16. Klatt, D. H . (1989 ), "Review of selected mod els of speech pe rcep tio n", en Lexical Representation and Process, Ca mb ridge, MIT Press. Klumpp, R. y H . Eady (1956), "So me measurements of interaural time difference th resho lds", Journal of the Acoustical Society of America , vo l. 28. Koh ler, W. (1972), Psicologia de la forma . Su tarea y ultimas experiencias , Madr id, Biblioteca Nu eva . - , K. Koffka y F. San der (1962), Pisicologia de la forma , Buenos A ires, Paidos.

279

Konishi, Masak azu (1993), "Audici6n bin aura l", Investigad 6n y Ciencia, N Q 20I.

M iller, G . y W. Taylo r (1948), "The perception of rep eated bur st of noise ", Journal of

Krumhansl, C. (1990), Cognitive Foundations of Musical Pitch, Nueva Yo rk, O xford University Press.

the Acoustical Socie ty of America, vo l. 20, pp . 171-182. M iyara, F. (s/f) , "Introduccion ala psicoacust ica", mimeo.

-

y R. Shepard (1979), "Quant ification of the Hi e rarch y of To nal Fun ct ions With in a D iatonic Contex t" , Journal of Experimental Psychology : Human Perception and Performance, vo l. 5.

Kubo vy, M . (1981), " Integral an d sepa rable d imensions and the theo ry of in d is­ pensable att ributes", en Perceptual Organization, Erlbaurn, H illsd al e.

Kuhl, P. K. (1993), "In na te predi sposit ions and the effects of exp er ience in speech per . ce pt io n: The na ti ve langu age magnet theory", en Developmental neurocognition:

Speech and face processing in the first year of life, Pafses Bajos, Kluwer'A
Parts , PUF. McAdams, S tephen (1995), Localisation Auditive, Parfs, IRCAM . Mc Clell and , J. L. y

J. L. Elman (1986), "Th e -mACE Mod el of Speec h Perception", Cognitive Psychology, vo l. 18. Mcfadden , D. (1989), "Sp ec tra l d iffere nces in the ability of te mp oral gaps to reset the mechan isms underly ing ov ersh oot", Journal of the Acoustical Socie ty of America, vo l. 85. McGill, W.

J. y J. P.

G o ldb erg (1968), "A St udy of the near-mi ss inv o lving Weber's

Law and pure-tone in tensity d iscri m inati on", Perception and Psychophysics, vo l. 4. McG urk, H . y J. Mac Donald (1976), "Hearing lips and see ing voices: A new illusio n ",

Nature, vol. 264. Mc Leod A. y Q . S ummerfield (1987), "Quantifyi ng the contribution o f vision to spe ec h per cep t ion in noise", British Journal of Audiology, vol. 2I. Majernfk, V. y J. Kaluzn (1979), "On the auditory uncert ain ly re lations" , Acustica, vol.

43. Malham D. G . (1998), "S patial he aring mechan isms and sound rep roduction", trad . al espa fiol O . P. Di Liscia, aur o rizad a por el auto r, en < h ttp://www.unq .ed u.ar/cme/ personales/od iliscia>. Matthew, Robert (1975), "A co ust ics in per spective", en Auditorium Acoustics, Londres, A pplied Sc ience Pu blishers. Mathews, M . y J. Pie rce (1980), "H armon y and no nharmon ic part ials", Journal of the Acoustical Society of America, vo l. 68.

280

Moor e, B. (1997), An introduction to the Ps)'chology of H earing, Londres, Academ ic -

Press. (ed .) (1995), Haruibook of Perception arui Cogn ition : Hearing, Londres, Academic Pre ss.

- et al. (1993), "Cornodulation masking release in subj ects with unilateral an d bilat­ eral cochlear hearing impa irme nt", Journal of the Acoustical Society of America, vo l. 93. - y B. Glasberg (1983), "S uggested formu lae for ca lculat ing aud ito ry-filter bandwidths and excitati on pa tterns", Journal of the Acoustical Society of America, vo l. 74. N e isser, U . (1967), Cognitive psychology, N ue va Yo rk, App let on-C enrury-Crofts. O lson, H . (1952), Music, Physics and Engineer ing, Nu ev a Yo rk , Dov er Publications. O stberg 0 ., B. Lindst ro m y P. O . Renhall (1988), "Contribution to speech int elligi­ bility by different sizes of vide ophone displays", Proc. of the Workshop on Vide ophone Terminal Design, Turfn . Patterson, J. y D. Green (1970), "D isc riminati on of Transient Si gn als H aving Ident ical Energy Spectra" , Journal of the AcousticalSocie ty of Am erica, vol. 48. Patterson, R. D. (1976), "A ud ito ry filte r shapes der ived with noise stimuli", Journal of the Acoustical Socie ty of America, vo l. 59. P ick les, J. (1988), An Introduction to the Physiology of Hearing, S an D iego, Acad em ic Press. Pierce, ] . R. (1991), "Periodic ity a nd Pit ch Perception", Journal of the AcousticalSociety

of America, vo l. 90. (1 985), Los sonidos de !a mUsica, Barce lona, Ed . Labo r. Pisoni, D. B. (1973), "Auditory and ph onet ic memory co des in th e d iscrimination of consonants and vowe ls", Percept. Psychophys., vo l. 13. Plenge, G . (1974), "On the d iffe rence between locali za t io n and latera liza tio n", T he Journal of the Acoustical Society of America, vo l. 56. Plomp, R. (1976), Aspects of Tone Sensation, Londres, A cadem ic Press. - (1967), "Pitch of complex tones ",journal of the Acoustical Society of America, vol. 4I. - y Levelt,] . M . (1965), "Tona l Conso nance and Critical Bandwith", Journal of the Acoustical Society of America, 38. Po llack , I. (1968), "Auditor y pul sed Dopp ler d iscriminat ion", Journal of the Acoustical Socie ty of America, 44, pp . 592-598 - (1953), "The Inform ati on of Elem entar y A ud itory D isplays", Journal of the Acoustical Socie ty of America, 25, pp . 765-769. Ran d, T. C. (1974), "D icho tic rel ease from masking for spe ec h ", Journal of the AcousticalSocie ty of America , vo l. 55.

-

281

-Randell, M. (1993), "M ental mode ls and co mp lex syste ms: the ada ptive dynamics of cog n itio n" , en internet . Rasch, R. A . (1978), "The perception of sim ultane ous notes such as in polyphon ic music" , Acustica, vo l. 40. Rasch , R. y R. Plornp, (1999), "The percept ion of musical tones", en The psychology of music, ed. D. Deutsch, San Diego , Acade m ic Press. Rayleigh, L. (19 45) , The Theory of Sound, Lond res, Do ver. Repp, B. H. (19 87), "The sound of two hands clappi ng", Journal of the Acoustical Society of Am erica, vo l. 8l. Rei sberg D . y J. McLean (1987) , "Easy to hea r but

hardt~nderstand :

Risser, J. e. (1 986) , "Pitch and Rhy thm Pa radoxes: C o mment on A uditory Par ad ox es Based on Fract a l Wavefo rm" , Journal of the Acoustical Society of America, vo l. 80 . -

(1 97 8a) , "M usical A cou stics ", Parts, Ra pports IRCAM N ° 8.

-

(1978 b) , "Parad oxes de H aut eur" , Pa rts, Rapports [RCAM N° 10.

-

(1978c) , "Ha uteur e t TImbre de s Sons", Paris, Rapports IRCAM N ° 11.

-

y M . V. Mathews (19 69), "Analysis of M usica l Instrument Tones", Ph)'sics Toda)', vo l. 22.

Risser, J.e. , y D. L. We ssel (1999), "Exp loration of timbre by ana lysis and syn thesis", en The Psychology of Music, ed . D. De utsch, San Diego, A cad emic Press. Ritsrna, R. ( 1967), "Freq uencies do minan t in the percep tion of th e pi tch of co mplex so und", Journal of the AcousticalSociety of America, vo l. 42. - ( 1962), "Existen ce region of the tona l residu e", Journal of the Acoustical Society of America, vo l. 34. Rock, I. y S. Palmer (1991), "EI legado de la psico logia de la forma", Investigaci6n y C iencia, N Q173 . Roede rer, Juan (1997), FCsica y psico[fsica de Ia miisica, Buenos Ai res, Ric ord i.

Ru iz, R icard o (1995), Ideas para el estudio de la organizaci6n pSlquica, La Plata, UNLP.

Schaeffer, p. (1966) , Traue des Objets Musicaux, Paris, Edition du Seui l.

(1 95 2) , A la Recherche d'une Musique C oncrete, Pa ris, Edi tion d u Seuil [t rad. en caste llan o, (1 959 ), iQue es la mt1.sica concreta?, Nue va Vision].

Scho ut en, J. F. et al. (19 62), "P itch of the resid ue", Journal of the Acoustical Society of Am erica, vo l. 34. Sek, A. (1 994), "M od ulati on de tec tion th resho lds and crit ical modu lati on frequen cy based in random amp litude and freq ue nc y chan ges" , Journal of the Acoustical

Society ofJ apan, vo l. 15. Se thares, W. A. (19 93), "Local C ons onance an d the Rel at ionsh ip be twe en TImbre and Scale", Journal of the Acoustical Society of America, vol. 94. Sethares, W. A. (1998) , Tuning, Timbre , Spectnl m, Scale, Lo nd res, Springer -Verlag.

282

t ion", Journal of the Acoustical Society of America, vo l. 9 1. Shailer, M . y B. Mo ore (1 98 7), "Gap detection an d th e aud ito ry filt er: ph ase effects usin g sinus oida l st imuli", Journal of the Acoustical Society of A merica , vo l. 8l. Sheppard, R. N. (1964), "Circul arity in Ju dgmen ts of Relat ive Pit ch ", Journal of the Acoustical Society of Am erica, vol. 35. S lawson, W. (1968) , "Vowel q uality and music al timb re as functi ons of spectrum enve­ lope and fundament al frequency".Journal of AcousticalSociety of Amence, vol. 43 . Soderq uist, D. R. (1970) , "Freq ue nc y a na lysis and the cr it ica l band", Psychonomic

A lip-reading

adv antage with intact a ud ito ry st imuli", en Hearing by ey~ : The psychology of lip­ reading, New Je rsey, Lawrence Erlbaum Associates.

-

S hac kleton, T. M ., et al. (199 2), "Across freq ue ncy integration in a mod el of lat era liza­

Science, vol, 21. Spiegel, M. F. (198 1) , "T h resho lds for ton es in maskers of vari o us bandw idths and fo r signa ls of vari o us bandw idths as a func tion of signal freq uency", Journal of the

Acoustical Societ)' of Am erica, vol. 69 . S teeneken , H . y T. Ho utga sr (1980) , "A ph ysical me thod for meas ur ing speech -tran s­ m ission quali ty", Journal of the Acoustical Societ)' of Americ«, vol. 67. S tem, R. y C. Trahiotis (19 95), "M odels of binaural interac tio n", en Hearing, ed . B. Moore, Nueva York, A cad emic Press. S tevens, K. y Blum stein, S. (19 81), "The sea rch for in variant ac o ustic cor relates of ph oneti c fea tures", Perspectives on the stwiy of speech, eds. P. Eimas y J . Mill e r, Hillsdale, Lawre nce Erlebaum Associates. S te vens, S . S . (1975), Psychoph)'sics: Introduction to its Perceptual, Neural and Social -

Prospects , Nueva Yo rk, Wil ey & Sons. (195 9 ), "On the validity of loudness scale", Journal of the Acoustical Society of

-

America , vol. 31 . (1935 ) , "The relati on of pit ch to in te nsity," Journal of the Acoustical Society of

Amencc , vo l. 6. al. (1937), "A sc ale for th e mea sure ment of the psychologic al magni tude of pi tch", Journal of the Acoustical Societ)' of Am erica, vo l. 8. S undberg, J . ( 1991), The Science of MusicalSound, San Dieg o, Academ ic Press. - (1 98 7), The Science of the Singing Voice, DeKalb, N orthern Illinois Un iver sity Press. - y Lindqvisr, J . (1 973 ), "Musica l oc ta ves and p itch," Journal of the AcousticalSociety of A merica , vo l. 54 . - y Verr illo , V. (19 80) , "On the anato my of the retard : A St ud y of tim ing in music," Journal of the Acoustical Society of America , vol. 68 . Terhardt, E. ( 1974), " Pitch , consonan ce and harmony," Journal of the Acoustical Society of Amencc, vol. 55. - er al. (1982a) , "P itch of co mplex signa ls accord ing to vi rt ua l-p itc h theory: Tes ts, ex amples, and predic t ions ", J. Acousr. Soc. Am ., 7l. - y W. Dixon Ward (1982b), "R ecognition of musica l key: Exploratory stud y", J. Acousr. Soc. Am. , 72 . -

er

283

----------------------zp-----------

Unernoto, T. (1989), "T h e psycho log ica l structure of m usic", Proccedings of the Firs t

International Conference on Music Perception and Cognition, Kioto. Vanderveer, N. J . (1979), "Eco logi cal Aco ustics. Human perceptio n of environm ental so unds", Doc toral Thesis, U n ivers ity M icrofil ms No. 8004002. Van Dommelen W. (1990), " A coust ic para mete rs in h uman spea ker reco gnitio n ", LangSpeech, vo l. 33. Van Noorden, L. (1975) , "Tempor a l Co heren ce in th e Per ception of Tone Seq uences ", Im tituut voor Perceptie Onderzoek, Ein dhoven. V icario , G. B. (1997), "Ti me in Psych ol ogy", Sci. Am . - (1967), Tempo Psicologico ed Eventi, Florenci a,..G~ti- Bar bera . V ieme ister, N . F. (1988), "Ps yc hophysical aspec ts of au d itory intensity co d ing" , en Auditory Functions, ed . Ede lma n , Nueva Yor k, Wiley. Walla ch , H . et al. (1949), "T h e Preced ence Effect in Soun d Local izati on", American JOUl/Ul1 of Psychology, vo l. 57. Warre n, R. M . (1970), "Elimin ation o f b iases in lou dness judge me nts for to n es", Journal of the Acoustical Society of America, vo l. 48. Warren, W. H . y R. R. Ve rbrugge (1984) , " A ud itory Pe rcep t io n of Brea king a nd Bouncin g Events: A Case S t udy in Ecologic al A cou stics", Journal of Experimental Psychology: Human Perception and Performance, vo l. 10. Wegel , R. y C Lane (1924), "The auditory ma sking of one so und by an other sound an d its pro babl e re lat ion to the dy n am ics of th e inner em ", Physical Review, vo l. 23. Wier, G . C , W. [esteadt y D. M . Green (1977), "Intensit y d iscriminat ion as a fun ction

of freq uency an d sen sa t ion level", Journal of the Acoustical Society of America, 61,

pp. 169-177.

W essel, D. (1978) , "Low Di m ension al C o ntrol of Musical Ti m bre" , Paris, Rapports lReAM

N° 12.

Whittle, L. S . et al. (1972), "T h e aud ibility of low frequency so un ds ", J. Sound Vib., vo l. 2 1. Zwi cker, E. (1965) , "Tempora l effects in simultaneous masking by wh ite -n o ise burst",

Journalof the Acoustical Society of America, vo l. 37. - , G . Flottorp y S . S. S te ven s (1957), "C ritical Bandwidth in loudness sum m at ion ",

Journalof the Acoustical Society of America, vo l. 29. - y H . Fastl (1999), Psychoac1lStics . Facts and Models, Berh n, S prin ger-Verlag. - y H . Fastl (1990) , Ps)'choacustics, Berl in , S pringe r-Ve rlag. Zwislocki, J. J. y H . N. Jordan (1986), "On the rel at ion of intensity jn ds to lou dness a nd neural n oi se, Journal of the Acoustical Society of Americu, vo l. 79.

Indice ternatico

A

A daptaci on aud itiva , 73 , 82

Ad aptacion binaural, 200

A daptacion pat ologica, 74

A gregado aud it ive , 215

A lgorinnos psicoac usticos

de co mpresi6n , 113

A ltura espect ral , 133

Al tura residual, 140, 143

A lt ura ton al, 133

Al tur a to n al en estfmulos diacronico s, 140

A ltura ton al en estimulos sinc r6n icos, 140

Al tura ron al, repr esemaci6n grafica, 150

A n alisis audi tive del en torno , 215

Anal isis especuo-temp oral , 104

A nalisis multid imens ion al , 171

Ancho de banda, 272

Ancho de band a rectangu lar equivalem e, 92

Ando, modelo de, 51, 109, 201

A parato vocal, 240

Arrn onicos, 267

Atenci6 n y t imbre, 190

At riburos dispensables e ind ispensables, 149

Aud ici6n an alit ica, 134

Aud ici6n fuera de frecu encia, 94

Aud ici6n sln tet ica, 134

Auriculares, 22

Ayuda visual par a la inr el igibilidad , 265

B Ban das cnticas, 91, 103

Batidos binaur ales, 197

Blauert , model o de , 201

Brillo del son ido, 187

C

C ampos acust icos virtuales, 212

C ategorfas temporales, 117

Celulas ci liadas, 34

C oclea (ca racol) , 32

C olor del son ido, 183

C o loraci6n espec t ral, 204 C ornodulacion, reducci 6n del en masca ram ient o par, 105, 227 C onducro coclea r, 31

Co no de co nfusion espacia l, 195

C onsonan cia y dison an cia, 160

Co nsonan ces [ricat ivas, 242

C on son antes nasales, 242

Conson an tes plosivas, 241

C onstancia de la sonoridad , 207

Co nsta nc ia del t imbre, 187

C on tornos de igual son oridad , 61

C orrespondencia t iemp o-intensidad, 200

C ort i, 6rgan o de, 31, 33

D

Dato s especrrales, 198

Decibel (un idad) , 54

Desborde acustico ("overshoot") , 77

Desplazam ien ro acustico temporal, 128

Desplazamiemo per man en te del umbra!

(PTS), 77

Desplazami em o temp orario del umbral

285 284

---------------~----------------_.

(TIS) ,75

Derec cion de asin cron fas, 127

Detecci6n de disconri nuidades, 124

Detecci6n de sefiales en presencia

de ruido, 77

Difere nc ia intera ural de inte nsid ad (110 ),

190

Diferencia interaural de tiempo (ITO), 192

Dimensiones timbricas exclusivas, 187

Discriminaci6n de parciales, 100

Disparidades en el cuerpo de la senal, 200

Distors ion alinea l, 110

Distors ion arm6n ica, 47

Distribuc lon de ann6nicos, 168

Doppler, efecro, 211

E

Ecos, 203

Ecos cocleares, 47

Efecro de cafeteria, 217, 223

Efecro de precedencia, 202, 222

Emisi6n vocal, 247

Emisiones o toa ciisticas, 37, 46

En masca rarnienro, 101

En rnascararnienro binaural, 109

Enmascaramiento no sim ulta neo , 106

Ensayos de arti cu lacion , 258

Escala de alturas, 136

Espec ializacion cerebral para el habla, 248

Espec tro de pote nc ia, modelo del , 92

Espec rrogramas auditivos, 249

Estado t ransitor io, 271

Esnrnulos sinusoidales, suma de, 71

Eustaqu io, rro mpa de, 26

Exciraci6n irnpulsiva, 44

F

Fac to res espec rrales, 98

Fase, informaci6n de, 39

Fatiga aud iriva, 75

Fechner , ley de , 70

Filrros de modulaci6n , 126

Fletcher, expe rirne nto de, 91

Fen (unidad), 61

286

Fonaci6n, 241

Fonemas, 239

Formanres, 244

Fourier, teorema de, 267

Fourier, transformada de, 271

Frecuencia, d iferen c ia apenas perceptible

(DAP),89

Fuente aciistica , 216

Funci6n de rransferen c ia de la cabeza

(HRTF),198

Funci6n de transferencia del o fdo, 47

Fundamental de Fourier, 134, 140, 267

Fundamental reconstruida, 140, 269

Fusion por arrnonicidad, 217

Fusi6n por cambios de arnplirud y

frecuencia, 220 .

Fusi6n por conrraste con sonidos previos, 219

Fusion por disparidades en el a raq ue , 219

Fusi6n por localizaci6n de la fuenre, 221

Fusion por periodicidad, 223

Fusion y fisi6n ritrnica, 226

G

Gestalt, teoria de la, 228

Goldstein, modelo de, 142

Grey, rnodelo de, 174

H H ass, efecro, 202

Hueseciltos de! ofdo medio, 26

Indicadores ac ustic os invar iantes en el

habla, 256

fndice de arriculaci6n , 262

ind ice de transmisi6n de la palabra, 263

Integraci6n audiovisual, 253

lnregraci6n temporal, 70, 119

ln teliglbilidad de la palabra, 257

lnteligibilidad, predicci6n de la , 260

In tens idad ac ustica , 56

Intensidad, codificaci6n contextu al, 85

lnrensidad, codificacion de la , 8 1

Inrensidad, codificaci6n de rasgos, 85

ln te nsidad , cod ificacion peri ferica , 82 In rensidad , di fer enc ia apenas perceptible

(DAP),66 Inrensidad, discriminaci6n de la, 66 In re nsidad , facto res espec tra les, 71

In re rfe rencia binaural, 201

In rervalos d iacronicos, 156

lntervalos musicales, 154

ln tervalos sincronicos, 157

l nvariancia del timbre, 169

ln var iantes acusticas, 178

Inversion temporal, 169

Isofonas, curvas, 61

Isornorfismo, 238

Iverson y Krumhans l, estudios de, 174

Modelo de supresion, 104

Modelos de doble poblaci6n, 83

Modelos rernp o rales, 142

Modo lingufsrico, 252

Moore, modelo de, 145

Morfof6rico, med ic , 149, 189

MP3, cod lficac ion, 114

N Nervio aud it ive , 40

Neural, respuesras de alto nivel , 48

Nivel de inrensidad (N O, 57, 6 1

Nivel de presi6n sonora (NPS) , 55

Nive les de urnbral, 59

o L Ley de c ie rre , 23 1

Ley de continuidad, 233

Ley de desrino corn un, 234

Ley de proxi rnida d , 230

Ley de sernejanza , 231

Limen en frecu enc ia, 89, 137

Limen en in ten sidad, 66

Lo, modelo de, 184

Localizaci6n audiriva, 19 1

Localizac ion de sefiales cornplejas, 197

Localizaci6n de senales transirorias, 199

Localizaci6n monoaural, 197

Localizaci6n temporal, 129

Loudness, contro l de, 62

M Medidor de n ivel sonoro, 64

Med idores de sono ridad , 87

Mel (unidad), 136

Membrana basilar, 3 1, 43, 46

Memoria de la int en sidad, 85

Met arne ricos, ti mbr es, 189

Minimo angulo de rnovim ient o

perceptible (MAMA), 211

Mode!o de cobert ura, 104

Mode!o de reco nocim iento de patr ones,

141

O bje tos audi u vos , 166, 215

O hm, ley ac ust ica de, 100, 167

O ido absolute , 157

Otdo ex terno, 20

Otdo in tern e , 30

Oldo medio, 24

O rden temporal, 128, 226

p

Pabellon auricular, 20

Pascal (unidad}, 54

Pa tol ogias a uditivas, 77

Percepci6n ca regorica, 253

Percepci6n del habla, 239

Percepci6n del movimiento, 211

Percepci6n dual, 253

Perdida de articulaci6n en consonanres, 265

Perfil espec tra l, exarnen del, 108

Perspecriva audit iva, 206

Plomp, estud ios de ,I n

Potenc ia ac iistic a, 56

Presi6n dinarnica, 54

Principio ac ustico de indeterminaci6n, 95,

119,130, 186, 200, 248, 271

Principio de figura y fondo, 235

Principio de inferencia incc nsciente. 228

Princip io de pe rrenencia, 235

Prin ci pio de pregnancia, 236

287

Propiedades emergen res, 228

Psicoffsica, ley, 62

rnetodo de, 95

Supresi6n lateral, 107

R

T

Rango dinamico, problema del, 81

Reclu rarni enr o a ud itive , 79

Red neuronal, modelo de, 256

Reflejo ac iistico (en el oido rned io ), 29

Refractario, esrado, 38

Refuerzo elect roacust ico , 204

Regularidad de datos fisicos, 226

Reissner, membran a de, 32

Relaci6n senal/ruido, 93, 261

Resistencia del habla, 257

Resoluci6n temporal, 118

Resonancia del filtro a ud it ive, 121

Resonancia del tract o vocal, 244

Resonancia me cani ca

(membrana basilar), 43

Reverberaci6n , 208

Risser y Mathews, rnctodo de, 180

Ruido cn masc aran te de Patt erson , 95, 119

Tasa de ocurrencia en el habla, 251

Tensor del tirnp an o, 29

Teorfa de los rasgos in varian tes, 255

Teoria del lugar, 42, 134

Teoria del magn eti srno del lenguaje

nati ve , 255

Teoria doble, 196

Teoria rnorora, 255

Teena temporal, 134

Terdhardt, modelo de, 142

Tiernpo, problema del , 117

Timbre, 163

TImbre en la voz h urnana, esrudios sobre

el, 182

TImbre, defin iciones, 164

TImbre, modelo clasico, 167

TImbre, rnod el os de analisis por sfn tes is,

S Schouten, expe rirncnto de, 142

Secuencias rftmicas, 225

Segregaci6n aud it iva, 217

Sensibilidad a la fase, 98

Senates c uasi-period icas, 223

Shepard, helice de alturas tonales, 151

Shepard, sonidos de, 152

S ln tesis ac iistica, 170

Slawson , esrud ios de, 183

Son (un idad) , 63

Sonidos de cornbinacion, l l O, 112

Sonidos diferenciales, l lO So nogra rnas, 248

Sonoridad, 53

Sonoridad, cont rol de, 62

S ta pedi ano, 29

Stevens, relaci6n de, 64

Suma de locaciones, 203

Supresi6n, 82

Supresi6n de bandas por cobertura,

288

177

TImbre, rnodel os verbales, 178

Tfmpano, 24

Ton icidad, 134

Tonoropta.T Z

Transducci6n en el ofdo medi c, 27 , 37

U Umbral de audiblidad, 58

Umbral para esti mulos co rnplejos, 98

Unisono rfrnbrico, 189

V

Variaci6n de datos acusticos en el habla,

251

Vocales, 243

Von Bekesy, esquema de, lOl

Voz h umana, frecuencias fundarnentales,

182

W

Weber, fraccion de, 68, 71, 84

Weber, ley de, 68, 8 1


More Documents from "Julián Campo"

Sopa De Letra.docx
April 2020 10
La Fisica Y La Critica.doc
December 2019 13
Scout.docx
April 2020 4
December 2019 21