Effetti e illusioni
La percezione uditiva è un fenomeno complesso, in cui le caratteristiche fisiche del suono ricevuto, quelle fisiologiche dell'orecchio, e l'attività neurale del cervello interagiscono in modo sottile. In queste pagine vogliamo mostrare come la percezione uditiva non debba essere considerata una immagine fedele del suono ricevuto, ma piuttosto una sua complessa (e non così fedele) elaborazione.
In questa sede distinguiamo effetti e illusioni, intendendo che gli effetti sono percezioni "non fedeli" dovute alle caratteristiche fisiologiche dell'apparato ricevente, mentre le illusioni, al pari delle più popolari illusioni ottiche, sono il prodotto della diretta azione del cervello che non si limita a registrare, ma interpreta i suoni che riceve.
La scala di Shepard
La scala di Shepard[1] è un esempio classico di illusione di cui esistono molte versioni. Provate ad ascoltare il campione qui sotto, che la riproduce in forma di glissando, e provate a tenere traccia dell'andamento della nota che percepite: sentirete un tono discendente, apparentemente senza fine. In realtà, come svela l'analisi del sonogramma, si tratta di un campione periodico, in cui le armoniche più acute vengono reintrodotte gradualmente, mentre quelle più gravi svaniscono gradualmente. Il cervello àncora la percezione dell'altezza più all'andamento complessivamente discendente, che non alla fondamentale del suono.
Effetti "di tipo Shepard" si trovano anche utilizzati in musica sotto forma di progressioni modulanti (per esempio nella Fantasia e Fuga in Sol minore per organo BWV 542 di J.S. Bach) o mediante altri espedienti.
- Nella parte finale del brano Echoes dei Pink Floyd un glissando di coro maschile è stato tagliato ad anello, e mixato in modo da dare l'illusione di una salita continua, esso emerge dalla dissolvenza di una lunga ripetizione guidata dalla chitarra elettrica;
- all'opposto del nostro esempio qui sotto. L'album A day at the races dei Queen si apre e si chiude circolarmente con piccolo trio strumentale in cui si sente una scala di Shepard eseguita per mezzo di chitarre elettriche.
La fondamentale mancante
Il campione che qui proponiamo ha in sé ben due particolarità paradossali. Si sente la sequenza Do3 - Re3 - Mi3 - Fa3 - Sol3 - Sol2 - Sol1 - Sol0 ripetuta due volte. Il Do3 iniziale corrisponde ad una frequenza di suono puro di 261 Hz, mentre i quattro Sol finali a ottave discendenti corrispondono all'incirca a 384, 192, 96, e 48 Hz.
Le due sequenze sembrano avere un differente timbro, ma le note suonate sembrano essere le stesse (cioè sembrano avere la stessa altezza). Questa è la prima sorpresa. Potremmo pensare che siano due strumenti diversi che eseguono la stessa partitura. Tuttavia, se esaminate il tracciato del sonogramma, troverete che l'unica differenza tra le due sequenze consiste nel fatto che nella seconda è stata eliminata la fondamentale di tutti i suoni. Questo dimostra che il cervello attribuisce l'altezza di un suono basandosi più sui rapporti tra le armoniche di tutto lo spettro, che non sulla sola fondamentale. L'altezza, infatti è attribuita alla frequenza corrispondente alla fondamentale anche se questa non è stata nemmeno fisicamente emessa (si veda la discussione nel dialogo Sulla percezione dell'altezza di un suono composto).
nota |
frequenza (Hz) |
Sol3 |
384 |
Sol2 |
192 |
Sol1 |
96 |
Sol0 |
48 |
|
|
|
Avevamo promesso due effetti in uno solo campione. Il secondo è in realtà implicito, ma lo potete notare ascoltando il campione dagli altoparlanti del vostro computer anziché in cuffia. L'effetto sorprendente è questo: non cambia niente! Si continua a percepire e ricononscere la stessa sequenza di note. I piccoli altoparlanti di un computer non sono in grado di trasmettere nessun suono al di sotto dei 50-60 Hz, però l'ultimo Sol a 48 Hz è ancora percepito alla stessa altezza. Quindi, abbiamo involontariamente scoperto un modo per migliorare le prestazioni degli altoparlanti, sfruttando l'aiuto che ci viene dal nostro sistema percettivo.
Un esempio non "artificiale" di fondamentale mancante si ha nella percezione dell'intonazione dei timpani. Anche in questo caso sentiamo principalmente una nota corrispondente ad un'armonica che non compare nello spettro dello strumento (si veda il suono reale dei timpani).
Senso sonoro e senso musicale
Il seguente semplice esempio dimostra che il nostro sistema uditivo elabora le informazioni sonore in modo completamente diverse per riconoscere il brano (senso musicale), e riconoscere lo strumento (senso sonoro).
Le informazioni sul brano sono contenute nella sua struttura di alto livello, come la sequenza delle note, la melodia, l'armonia, la struttura della composizione. Tutte caratteristiche che fanno parte dell'ambito musicale, e richiedono un'analisi "linguistica" del suono percepito.
Le informazioni sullo strumento riguardano invece la percezione del timbro, e sono codificate nelle caratteristiche acustiche di ogni suono che compone il brano, visualizzabili, ad esempio, per mezzo di uno spettrogramma .
"The Entertainer", di Scott Joplin |
|
|
versione originale |
L'ordine delle note dell'originale è invertito, ma le singole note non sono modificate |
|
|
si riconosce lo strumento, ma non il brano |
L'ordine delle note è lo stesso dell'originale, ma ogni singola nota è eseguita all'indietro nel tempo |
|
|
si riconosce il brano, ma non lo strumento |
Il terzo suono di Tartini
Il terzo suono è un suono "fantasma" che si percepisce talvolta quando due suoni abbastanza intensi (e ricchi di armonici) giungono all'orecchio simultaneamente. È piuttosto comune ottenere questo suono sul violino suonando note doppie sulla prima e seconda corda.[2] L'effetto in realtà assume forme diverse, in quanto il terzo suono compare a frequenze pari sia alla somma di (multipli delle) frequenze base, sia alla loro differenza, sia in corrispondenza di altre combinazioni. Nell'esempio sonoro che qui portiamo il terzo suono può essere interpretato come un effetto di fondamentale mancante (si veda il paragrafo precedente). Nell'esempio si sente la sovrapposizione di due onde triangolari ad un intervallo di terza maggiore naturale (v. scala naturale). Le loro fondamentali, a 512 e 640 Hz, stanno in rapporto 5:4. Questo particolare rapporto crea una sovrapposizione di armoniche ad intervalli regolari, il cui massimo comune divisore è 128 Hz (un suono un'ottava sotto la fondamentale a 512 Hz).
Nell'esempio che segue riportiamo dapprima separatamente i suoni delle componenti a 512 e 640 Hz. Poi la loro unione. Il terzo suono è udibile solo in cuffia, e a volume sufficientemente alto. Nell'immagine di sopra si vede lo spettrogramma del suono composto. Il reticolo evidenzia i multipli della fondamentale mancante a 128 Hz.
Il terzo suono può anche essere utilizzato per controllare l'intonazione naturale di un intervallo. Nell'esempio che segue, la frequenza della nota più acuta è fatta oscillare di ±20 Hz. Corrispondentemente anche il suono differenza oscilla. La frequenza di battimento che si percepisce è minima quando le note componenti sono accordate ad una terza maggiore naturale.
Mentre la fondamentale mancante è sostanzialmente un'illusione, in certi casi il terzo suono può essere interpretato come un effetto fisico. Esso, infatti, si produce anche in casi in cui non è possibile addurre come spiegazione una fondamentale mancante. Questo fatto è stato interpretato come una prova del comportamento non lineare dell'orecchio umano. In poche parole, se l'orecchio non si comporta linearmente (il che avviene per intensità elevate del segnale di ingresso), esso può distorcere il segnale. In poche parole, questo significa che l'orecchio può aggiungere al segnale in ingresso frequenze che non appartengono al segnale stesso. Tali frequenze non sono illusorie, ma esistono fisicamente all'interno dell'orecchio, e corrispondono quindi a massimi fisici dell'onda di pressione cocleare. In particolare, esiste un tipo di distorsione, detta distorsione di intermodulazione, ben noto a chi si occupa di trasmissioni radio, che produce proprio armoniche di frequenza pari alla somma e alla differenza tra le frequenze dei suoni in ingresso.
L'effetto McGurk
Osservate il video e cercate di capire quale sillaba viene pronunciata. Provate poi ad ascoltare l'audio senza guardare il filmato. Vi farete un'idea completamente differente. Come del resto tutte le illusioni percettive, anche questa convoglia al cervello informazioni volutamente ambigue o contraddittorie, e ne ottiene una "sistemazione" che non è la semplice registrazione fedele della realtà. In questo caso il video mostra un uomo che pronuncia tre volte "ga-ga", ma, l'audio registra effettivamente tre volte il suono "ba-ba". Ora, per pronunciare la "b" sappiamo che le labbra devono toccarsi, cosa che non accade nell'immagine. Il cervello sistema la situazione facendoci percepire, per lo più un suono intermedio "da-da", quando non direttamente la versione visuale "ga-ga". Lo stesso effetto, all'inverso, spiega in parte perché non siamo troppo disturbati dall'asincronia tra il labiale e l'audio nei film doppiati nella nostra lingua. Semplicemente ignoriamo la parte incomprensibile del messaggio (il labiale in un'altra lingua), a favore di quella comprensibile (il dialogo nella nostra lingua).
|
|
Altre illusioni ad libitum
Il campo della psicologia della percezione è troppo vasto per essere qui affrontato. Tuttavia le illusioni acustiche non godono della notorietà riservata alle illusioni ottiche. Rimandiamo chi fosse interessato al sito di una nota studiosa del campo (Diana Deutsch), che contiene svariati esempi di illusioni acustiche e ampia bibliografia.
Tra esse segnaliamo in particolare:
-
il paradosso del tritono: un intervallo pari esattamente a metà ottava (il tritono, appunto) è suonato mettendo due suoni di tipo Shepard in successione fissata, ascendente o discendente, ma viene interpretato anche da musicisti esperti in modo ambiguo. Alcuni percepiscono l'intervallo come ascendente, altri come discendente. In http://www.cs.ubc.ca/nest/imager/contributions/flinn/Illusions/TT/tt.html (in inglese) trovate anche un applet Java per poter sperimentare voi stessi quantitativamente l'effetto.
-
la melodia nascosta: dimostra l'importanza delle funzioni di riconoscimento (opposte alla pura registrazione dei suoni). Corrisponde al fatto arcinoto che la conoscenza di un brano lo rende più facile da seguire, ma anche al fatto meno noto che, sparpagliando i suoni di una melodia nota tra diverse ottave, la melodia ci diviene meno familiare, o addirittura irriconoscibile.
Un "effetto" simile trova una splendida applicazione nell'arrangiamento di A. Webern del Ricercar a 6 da Musikalisches Opfer di J.S. Bach. Il celebre tema è spezzato tra strumenti diversi, e su ottave diverse. In particolare le prime cinque note sono affidate al trombone, poi due al corno in Fa, due alla tromba in Do, una di nuovo al corno, ma con un tocco dell'arpa, poi di nuovo quattro al trombone (la prima insieme col corno), tre al corno, e infine le ultime due a tromba e arpa assieme. Esso diviene una musica completamente nuova, anche se basata sulle stesse note. Si noti che tutti gli ottoni suonano con sordina, e questo rende le differenze timbriche molto meno accentuate, favorendo il passaggio fluido da una voce ad un'altra. (Per una rassegna di esempi acustici sulla sordina si veda la pagina tromba).
Il tema originale di re Federico II, utilizzato da Bach
|
|
Collegamenti
Per l'esame di altri importanti effetti si rimanda alle pagine specifiche
Svariati campioni di file acustici contenenti diversi effetti si trovano nel sito di Diana Deutsch.
- ↑ Roger N. Shepard, Journal of the Acoustical Society of America 36 2346 (1964)
- ↑ Per questo si attribuisce la scoperta dell'effetto a G. Tartini (1692-1770), violinista, didatta e compositore, celebre soprattutto per la sonata Il trillo del diavolo, che si interessò anche alla teoria della consonanza e all'acustica, scrivendo diversi trattati. Il terzo suono è descritto nel Trattato di musica secondo la vera scienza dell'armonia, Padova, 1754.