Fisiologia del sistema uditivo

Da "Fisica, onde Musica": un sito web su fisica delle onde e del suono, acustica degli strumenti musicali, scale musicali, armonia e musica.

I meccanismi fisiologici che stanno alla base della percezione del suono non sono a tutt'oggi completamente compresi. La percezione del suono, come tutti i processi percettivi umani, non consiste tanto in una trasformazione fedele delle caratteristiche fisiche dell'onda sonora, quanto piuttosto in un vero e proprio processo attivo di costruzione ed interpretazione delle onde pressorie in termini di qualità percepite come altezza, intensità e timbro, ma anche, ad un altro livello cognitivo, eufonia o cacofonia, o ancora in termini di significato (ad esempio nel linguaggio parlato) o di aspetti emotivi, come ad esempio quelli legati alla musica. Il carattere attivo di questo processo è testimoniato, tra l'altro, dalle caratteristiche e dall'esistenza stessa delle illusioni acustiche. Per cercare di comprendere, seppur nei limiti imposti da un sito come questo, lo stato dell'arte nella comprensione di tali meccanismi è necessario che tu legga

Puoi anche sperimentare direttamente alcuni fenomeni percettivi nelle pagine effetti e illusioni acustiche, battimenti, bande critiche, mascheramento.

Fisiologia della percezione dell'altezza

Mediante quali processi fisiologici l'orecchio attribuisce ad un suono un ben precisa sensazione di altezza? Prima di cercare in questa pagina la risposta a questa domanda ti invitiamo (se già non l'avessi fatto) a leggere le pagine:

Di seguito illustreremo due modelli fisiologici della percezione dell'altezza; entrambi i modelli partono da una base comune ormai assodata (anche sperimentalmente). La percezione del suono avviene secondo questi passaggi:

  1. l'onda sonora è ricevuta dal padiglione auricolare ed è convogliata, attraverso il condotto uditivo, alla membrana del timpano;
  2. la membrana timpanica è messa in vibrazione. La vibrazione è trasmessa, tramite un sistema di leve (la catena degli ossicini) ad una membrana che racchiude un'apertura detta finestra ovale che è la porta d'accesso ad un canale a forma di chiocciola (detto coclea) pieno di liquido;
  3. la vibrazione è trasmessa della membrana alla finestra ovale, sotto forma di onde di pressione, al liquido contenuto nella coclea;
  4. l'onda di pressione del liquido cocleare mette in oscillazione una membrana (detta membrana basilare) interna alla coclea stessa;
  5. contestualmente viene messo in moto l'Organo (detto del Corti) adagiato sulla membrana basilare, e fornito di cellule ciliate;
  6. la vibrazione delle cellule ciliate dell'organo del Corti attiva segnali elettrici (potenziali di attivazione) che, attraverso le fibre del nervo uditivo, vengono inviati al sistema nervoso centrale;
  7. il segnale elettrico viene elaborato in sede centrale e diviene la sensazione uditiva vera e propria.

La teoria posizionale di von Helmholtz

Hermann von Helmholtz riteneva che il meccanismo di discriminazione delle frequenze fosse di tipo posizionale:[1] suoni di differenti frequenza mettono in moto regioni diverse della membrana basilare

Membrana basilare e frequenze.png

In particolare suoni di frequenza elevata mettono in oscillazione le regioni della membrana basilare più vicine alla finestra ovale (immagine a lato); all'abbassarsi della frequenza le regioni messe in moto sono sempre più lontane dalla staffa della finestra ovale (e vicine all'elicotrema). Helmholtz, fisico e fisiologo eccellente, riteneva che la membrana basilare fosse costituita da un insieme di fibre trasversali con caratteristiche di elasticità e di massa per unità di lunghezza variabili, muovendosi dalla finestra ovale all'elicotrema.

Membrana arrotolata.png

Secondo l'ipotesi di Helmholtz, quando tali fibre vengono investite dall'onda di pressione del liquido avente una determinata frequenza, esse si comportano come oscillatori armonici forzati indipendenti ed entrano in risonanza a determinate frequenze. Ricordando che la frequenza di risonanza di un oscillatore armonico è data da:

f_{0}={\frac  {1}{2\pi }}\cdot {\sqrt  {{\frac  {k}{m}}}}

cioè dipende dalla costante k (che misura l'elasticità) del materiale e dalla massa dell'oscillatore, Secondo Helmholtz le variazioni morfologiche della membrana basilare (la membrana basilare, come illustrato nell'immagine a lato, va ispessendosi muovendosi dalla finestra ovale all'elicotrema) determinano frequenze di risonanza diverse per le varie regioni.

Inviluppo onda complessa.png

Il modello di Helmholtz è eccessivamente semplificato anche se è sostanzialmente confermato, nella sua "concezione posizionale", dalle osservazioni successive di von Békésy [2]. Questo fisico ungherese (premio Nobel nel 1961 per i suoi studi di fisiologia dell'orecchio interno) riusci ad osservare, con un raffinato sistemi di elettrodi, il moto della membrana basilare. Le sue osservazioni possono riassumersi dicendo:

  1. che l'onda sonora genera nella membrana basilare un "onda viaggiante" di forma complicata che si smorza più o meno rapidamente;
  2. l'inviluppo (vedi immagine a lato) di tale onda viaggiante ha un massimo che cade in regioni diverse della membrana basilare a seconda della frequenza e nelle posizioni previste da Helmholtz;
  3. nel caso di suoni composti, l'orecchio è in grado di compiere una sorta di analisi spettrale nel senso che è in grado di discriminare le varie parziali facendo vibrare parti diverse della membrana basilare;
  4. la figura precedente, nella quale sono riportate le zone di maggior deformazione della membrana in funzione della frequenza, mostra che lo spazio riservato ad un'ottava, cioè ad ogni raddoppio di frequenza è, grosso modo, costante. All'aumentare della frequenza quindi, il rapporto tra l'ampiezza della regione interessata e il "range" di frequenza da percepire si riduce drasticamente. Ciò avrà notevoli conseguenze sulla capacità del nostro orecchio, di discriminare due suoni sovrapposti, ad elevata frequenza.

Successi e limiti della teoria posizionale

Molti dei fenomeni percettivi osservati sono spiegati dalla teoria posizionale:

il collegamento della percezione dell'altezza alla morfologia della membrana basilare spiega l'esistenza di un range di frequenze udibili. Saranno le caratteristiche di elasticità e di massa per unità di lunghezza della membrana a determinate le frequenze "risonanti" e quindi udibili.
se l'ampiezza della regione riservata ad ogni ottava è di ampiezza costante, ci aspettiamo che vengano percepiti come identici intervalli che abbiano la stessa distanza all'interno della membrana basilare (la spiegazione è sicuramente semplicistica e verrà affinata dalla teoria della periodicità.
  • il fenomeno della banda critica
un fenomeno percettivo, illustrato nella pagina bande critiche, che si genera durante l'ascolto contemporaneo di due suoni aventi frequenze molto ravvicinate. Sostanzialmente la "confusione percettiva" nella quale incappa il sistema uditivo in tali circostanze, può attribuirsi al fatto che, secondo la teoria posizionale, suoni vicini in frequenza attivano regioni della membrana basilare parzialmente sovrapposte e quindi possono inviare impulsi nervosi non correlati al medesimo fascio di fibre nervose.
  • l'allargamento della banda critica alle alte frequenze
se, come detto, l'ampiezza della regione della membrana basilare decresce per ottave di frequenza crescente è chiaro che la sovrapposizione delle regioni della membrane basilare, invocata al punto precedente, è maggiore alle alte frequenze.
che consiste nella mancata (o comunque debole) percezione di uno tra due suoni contemporanei. Anche qui la spiegazione può essere data in termini di sovrapposizioni di inviluppi. Vista l'importanza che, in musica, assumono gli effetti di mascheramento, ad essi è dedicata una pagina apposita

I limiti della teoria posizionale possono riassumersi nell'incapacità di spiegare:

  • la fusione in unico suono di un suono composto da parziali esattamente armoniche
le varie armoniche di un suono composto attivano regioni diverse della membrana basilare. Come mai allora percepiamo un unico suono?
come possiamo percepire un'altezza virtuale se la regione di membrana basilare corrispondente a tale altezza non è nemmeno sollecitata, essendo l'armonica fondamentale assente?
  • la percezione dei battimenti, anche quando i due suoni di frequenza ravvicinata, sono ricevuti separatamente dalle due orecchie:
è ovvio che in tale caso la percezione (seppur debole) dei battimenti non può essere imputata a fenomeni di battimento a carico della membrana basilare (ciascuna membrana riceve un solo suono!). Il mescolamento dei suoni e la percezione del battimento agisce, evidentemente, a un livello di elaborazione successivo a quello cocleare.
  • la grande capacità di discriminazione delle frequenze di due suoni non sovrapposti ma ricevuti in rapidissima successione
come può il sistema essere nello stesso tempo selettivo in frequenza e pronto nella risposta? Ciò si scontra con la teoria della risonanza: per essere pronto nella risposta l'oscillatore (la fibra trasversale) deve smorzare rapidamente la sua oscillazione, per essere pronto a rispondere alla mutata sollecitazione esterna (il secondo suono della successione); d'altronde smorzamenti rapidi significano "risonanze allargate" (vedi a questo proposito le curve di risonanza proposte nelle pagine relative alla risonanza e all'impedenza dell'oscillatore armonico).
  • i risultati di alcuni esperimenti (primo fra tutti quello fa uso di una sirena di Seebeck modificata) in cui la percezione dell'altezza di suoni periodici non è determinata dall'armonica fondamentale.


Vi è infine un limite, che potremmo definire costitutivo, della teoria posizionale: la teoria è, giocoforza, incompleta non essendo ancora del tutto compreso quali movimenti della membrana basilare sono rilevanti per la stimolazione delle cellule ciliate. Come se non bastasse recenti studi hanno mostrato che le stesse cellule ciliate hanno una capacità di contrazione autonoma: ciò determina un'ulteriore complicazione nella comprensione del funzionamento dell'orecchio interno.

La teoria della periodicità

L'assunto principale della teoria della periodicità è che la sensazione di altezza del suono viene prodotta anche mediante un'analisi temporale del suono e in particolare della frequenza di ripetizione con cui i segnali del nervo uditivo arrivano al cervello. A prima vista la teoria appare molto più "naturale" della teoria posizionale: cosa c'è di meglio, per valutare la frequenza di un suono, che contare direttamente il numero di impulsi nell'unità di tempo, che l'oscillazione della membrana basilare, invia al nervo uditivo? Questo evita la trasformazione di un'informazione temporale come la frequenza, in un'informazione spaziale come avviene nella teoria posizionale.

Questa semplificazione va evitata per una serie di ragioni:

  • le osservazioni sperimentali di von Békésy mostrano inequivocabilmente l'esistenza della correlazione spaziale proposta dalla teoria posizionale;
  • la visione "ingenua" che i segnali del nervo uditivo siano sincronizzati alla frequenza della vibrazione della membrana basilare è, in parte, superata dall'osservazione sperimentale (si vedano gli studi di I. Tasaki[3]) che le singole fibre nervose connesse, tramite le cellule ciliate, alla membrana basilare in moto, riproducano fedelmente il periodo dell'onda eccitante. Nella figura seguente si vede come, occasionalmente la singola fibra nervosa non venga stimolata nemmeno in corrispondenza del massimo di deformazione della membrana basilare.

Impulsi fibra nervosa.png

Tuttavia il cervello è in grado di elaborare segnali provenienti da un più ampio numero di fibre nervose raccolte in unico nervo uditivo (si pensi che la densità dei recettori è di circa 100 recettori per millimetro di membrana basilare e l'estensione della regione basilare corrispondente ad un'ottava è di circa 4-5 millimetri) e di ricavare una configurazione ("pattern") di impulsi (come mostrato nell'ultima riga della figura a lato ) quasi periodica. Sembra che a livello cerebrale agisca un sofisticato meccanismo di tipo statistico detto di autocorrelazione temporale in grado di evidenziare le caratteristiche periodiche del pattern sopprimendo le altre, sulla base del confronto del treno di impulsi attuale con treni di impulsi precedenti. Ciò spiegherebbe anche "la prontezza" nel recepire piccole variazioni di frequenza tra suoni consecutivi. Tale meccanismo di autocorrelazione temporale diventa più problematico alle alte frequenze; in tali condizioni, l'aumentata densità del treno di impulsi, rende più confusa la percezione di periodicità del "pattern".

  • il modello della teoria della periodicità non è una estensione del modello posizionale; in tal senso, esso non deve essere accolto come un modello più generale e quindi di maggior potere esplicativo rispetto al modello posizionale. Piuttosto esso fornisce la descrizione di una strategia alternativa che il cervello sembra utilizzare per raccogliere il massimo di informazioni dall'onda sonora che perturba il sistema percettivo.

Successi e limiti della teoria della periodicità

Tra i successi (parziali) della teoria della periodicità possiamo annoverare:

  • la spiegazione dei risultati di alcuni esperimenti in cui la percezione dell'altezza di suoni periodici non è determinata dall'armonica fondamentale ma, addirittura, da una sorta di "sub-armonica" avente frequenza pari alla metà dell'armonica fondamentale..

come esempio di esperimento di questo tipo proponiamo quello proposto da Pierce [4] All'orecchio vengono mandati due treni di impulsi di egual frequenza (ad esempio 100 impulsi al secondo) ma, nel caso del secondo treno gli impulsi cambiano alternativamente segno (cioè corrispondono ad aumenti e a diminuzioni della pressione dell'aria).

Esperimento Pierce.png

Se ragioniamo secondo la teoria posizionale l'orecchio compirà un'analisi spettrale del suono e percepirà l'altezza della fondamentale. Essa corrisponde alla sinusoide di minor frequenza come suggerito dalla figura che meglio "approssima" il segnale che produce sulla membrana basilare la maggior deformazione: nel caso A dovrebbe percepirsi un suono di frequenza 100 Hz e nel caso B un suono di 50 Hz (visto che la frequenza della prima armonica è dimezzata).

Se ragioniamo secondo la teoria della periodicità dovremmo percepire in entrambi i casi una frequenza di 100 Hz (visto che vengono inviati alla membrana basilare 100 impulsi al secondo)

Ci troviamo, a prima vista, in un classico experimentum crucis, che può decidere quale, tra due teorie alternative, è valida. Il giudice ultimo è l'esperimento! I risultati sperimentali sono assolutamente sorprendenti e confermano la complementarietà delle due teorie più che la loro opposizione:

  1. alle basse frequenze (100 impulsi al secondo) i due suoni vengono percepiti con la stessa altezza (dando ragione alla teoria della periodicità);
  2. a frequenze più alte (200 impulsi al secondo) il suono B risulta più grave del suono (proprio un'ottava sotto come previsto dalla teoria posizionale).
  3. per frequenze intermedie la percezione dell'altezza del suono B è ambigua: si verifica un conflitto tra la valutazione dettata dalla frequenza di ripetizione degli impulsi e quella dettata dalla regione di massima deformazione della membrana basilare.
  • Un possibile meccanismo esplicativo del fenomeno della percezione dell'altezza virtuale
L'analisi temporale delle frequenze di due armoniche sovrapposte (ad esempio di frequenza 2f e 3f) può far percepire, a livello cerebrale, l'esistenza di una periodicità di ordine più elevato (e quindi di frequenza minore) rispetto a quello delle singole armoniche.
È un po' ciò che accade (semplificando molto) se osserviamo due luci che si accendono periodicamente con periodo di 2 e 3 secondi, possiamo percepire che l'evento "accensione simultanea delle luci" avviene ogni 6 secondi. Se anziché ragionare in termini di periodo ragioniamo in termini di frequenza, la frequenza dell'evento "accensione simultanea delle luci" è il massimo comun divisore delle frequenze delle singole accensioni. Questo è ciò che accade nel fenomeno di percezione dell'altezza virtuale.
  • la percezione dei battimenti di suoni ricevuti separatamente dalle due orecchie
come risultato di analisi temporale del pattern di vibrazione (cioè della forma d'onda) di due suoni molto ravvicinati in frequenza anche se ricevuti dalle due orecchie separatamente.

I limiti della teoria della periodicità risiedono

  • nella sua incompletezza
questo è un difetto da cui è affetta anche la teoria posizionale. Le due teorie appaiono complementari e non riescono a spiegare, separatamente considerate, l'intera gamma dei processi percettivi descritti;
  • nell'incapacità di spiegare il processo di "fusione" del suono che avviene nella percezione di suoni costituiti da parziali armoniche (o quasi-armoniche)
l'analisi delle periodicità dei pattern temporali non sembra sufficiente a giustificare tale evento percettivo. In un suono composto (costituito da parziali armoniche) sono presenti molti eventi periodici. In quale modo dovrebbe prevalere, nella percezione dell'altezza, quello dell'armonica fondamentale?

Oltre le teorie posizionali e della periodicità. Una possibile conclusione

Appare chiaro dalla seppur sommaria analisi dei modelli teorici proposti che la spiegazione completa dei fenomeni di percezione dell'altezza è di là da venire. Negli ultimi anni sono stati proposti ulteriori modelli (soprattutto per spiegare la fusione di suoni composti costituiti da parziali armoniche) modellati sulla teoria delle categorie del linguaggio parlato. In sintesi si ritiene che così come il cervello impara a distinguere i fonemi della lingua parlata e a non confonderli anche a fronte di differenze minime della forma d'onda, allo stesso modo il sistema percettivo riconosca (a partire dalla deformazione della membrana basilare) le configurazioni armoniche (o quasi) e tenda a "sentirle" anche laddove tali configurazioni fossero leggermente imprecise o incomplete.

Chiariamo con qualche esempio.

  • Noi siamo chiaramente in grado di distinguere, nel linguaggio parlato, le parole "Coro" e "Goro". Se mediante un computer generiamo una forma d'onda "a metà strada" tra la C e la G iniziale, quello che percepiamo è o la C o la G. Il sistema percettivo riconoscendo che la forma d'onda modificata assomiglia a quella della C (o della G) sceglie una delle due "categorie" del suo repertorio di fonemi. La transizione tra la percezione della C (o della G) è netta anche se si modifica gradualmente la forma d'onda.
  • Allo stesso modo un musicista (che probabilmente ha una percezione "categoriale" delle altezze più consolidata rispetto a quella di un ascoltatore profano) quando sente un cantante stonare (ad esempio eseguire una nota con frequenza più bassa) tende a riconoscere in quella nota un bemolle, (cioè la configurazione armonica più vicina all'effettiva esecuzione del cantante). Probabilmente un meccanismo di questo tipo permette di associare una sensazione di altezze anche a strumenti che generano parziali non esattamente armoniche (es. timpano, barre, campane, ecc.). Rileggi a questo proposito "Sulla percezione dell'altezza di un suono composto".

Se gli elementi a disposizione del sistema percettivo per riconoscere le configurazioni armoniche sono scarse (come avviene negli strumenti che generano suoni quasi puri, come ad esempio il flauto) la percezione dell'altezza può rimanere ambigua. Ad esempio spesso il suono del flauto viene percepito un"'ottava sotto" rispetto alla nota effettivamente eseguita.

Il meccanismo di riconoscimento delle configurazioni armoniche può fornire una possibile spiegazione anche del fenomeno dell'altezza virtuale. La configurazione completa delle parziali armoniche di un La4 può essere percepita come una configurazione incompleta delle armoniche del La3 (un'ottava sotto). Il sistema percettivo, riconoscendo tale "categoria", si affretta a "completarla" facendoci percepire l'altezza virtuale della fondamentale mancante.

È chiaro che la teoria delle categorie fornisce un'interessante chiave di lettura della fisiologia dei fenomeni percettivi. Essa lascia però problemi aperti:

  • come si costruire il repertorio di categorie conosciute? È innato o è un fatto acquisito dovuto all'educazione?
A questo proposito è utile osservare che i giapponesi adulti non sono in grado di distinguere il fonema "r" dal fonema "l" nelle lingue occidentali. I bambini giapponesi ci riescono facilmente se educati. Per il suono è la stessa cosa, o no?
  • perché sono state selezionate proprio le configurazioni armoniche?
  • la percezione di altri aspetti del suono (ad. esempio il timbro) è categoriale?

Approfondimenti e collegamenti

  • Ti suggeriamo anche la lettura dell'opera di A. Frova [5] soprattutto il capitolo 4 relativo ai meccanismi dell'udito.

  1. Hermann L. F. von Helmholtz, Die Lehre von den Tonempfindungen, als Physiologische Grundlage für die Theorie der Musik, Vieweg, Braunschweig, 1863. Puoi vedere qui la riproduzione integrale della terza edizione (1870), e leggere qui in inglese, la splendida introduzione
  2. G. von Békésy, Experiments in Hearing, Mc Graw Hill, New York, 1960
  3. I. Tasaki, "Nerve impulses in individual auditory nerve fibers of guinea pig", J. Neurophysiol. 17, 97 (1954)
  4. J. R. Pierce, La scienza del suono Zanichelli, Bologna, 1987
  5. A. Frova Fisica nella musica Zanichelli 1999 pag.107

"Fisica, onde Musica": un sito web su fisica delle onde, acustica degli strumenti musicali, scale musicali, armonia e musica.

Licenza Creative Commons

Valid XHTML 1.0 Transitional

Valid CSS!