Semplici modelli per la voce
Da "Fisica, onde Musica": un sito web su fisica delle onde e del suono, acustica degli strumenti musicali, scale musicali, armonia e musica.
Benché la produzione di suoni e rumori indistinti da parte dell'apparato vocale umano sia un fenomeno relativamente semplice dal punto di vista strettamente fisico (si veda Come si produce la voce), l'articolazione dei fonemi e la loro organizzazione in sequenze intelligibili è invece un fenomeno molto complesso, che non può essere descritto unicamente nell'ambito della fisica.
Naturalmente non vogliamo affrontare qui nel dettaglio l'affascinante argomento, che richiede la comprensione di molti aspetti anche fisiologici e percettivi, oltre che strettamente acustici, ma vogliamo mostrare che, almeno in alcuni casi semplici, poche elementari nozioni di base di fisica delle onde possono fornire previsioni piuttosto accurate, e chiarire grandemente alcuni aspetti essenziali della produzione del suono associato all'articolazione delle vocali.
Il suono vocalico
Il suono delle vocali è quello più facile da descrivere in termini fisici, perché è un suono quasi stazionario, prodotto senza che vi compaiano evidenti componenti di rumore, caratteristica tipica invece, ad esempio, dei suoni consonantici. Cosa distingue una vocale da un'altra? I suoni vocalici hanno colori diversi, ma si tratta di una componente del timbro sonoro che non ha nulla a che fare col timbro di voce del parlante. L'utilità di questo fatto è evidente: ci permette di riconoscere una A da una I quasi indipendentemente dalla particolare qualità di voce del parlante. Ispezionando i sonogrammi della figura è evidente che le diverse vocali abbiano suoni diversi, ma come sono legate queste differenze alle caratteristiche dello "strumento" che ha prodotto il suono? Per scoprire quali fattori influenzino le particolari caratteristiche timbriche che ci permettono di distinguere le vocali è utile creare un modello fisico del tratto vocale umano. |
|
Il modello più semplice possibile consiste in un tubo di diametro variabile, alla cui base è posta una sorgente di oscillazioni acustiche (la glottide), e la cui altra estremità è aperta (la bocca).
Nonostante la descrizione del tratto vocale in questi termini sia molto semplificata, essa fornisce comunque molte utili informazioni, e costituisce un modello per certi aspetti illuminante. Questo modello si presta ad essere simulato con la stessa tecnica che abbiamo utilizzato per gli altri tubi (si veda acustica di strumenti a fiato modello). Scopriremo nel seguito che le simulazioni risultano sorprendentemente accurate, rispetto alla semplicità del modello, e sono in grado di associare correttamente alcune caratteristiche morfologiche del tratto vocale con il suono delle diverse vocali.
Inutile sottolineare che la possibilità di simulare il suono porta direttamente alla possibilità di sintetizzarlo (cosa che oggi comunemente molti dispositivi elettronici anche portatili sono in grado di fare a partire, ad esempio, da un testo scritto).
Naturalmente molte caratteristiche fini sono invece perse, e alcuni suoni (come le vocali nasalizzate) che richiedono cavità risonanti supplementari, non possono essere simulate con accuratezza.
Dalla radiografia al modello
Il primo a praticare questo approccio fu lo studioso svedese G. Fant che, nel 1950, ebbe l'idea di dedurre le misure dei diametri del tratto vocale da un insieme di radiografie scattate mentre un soggetto pronunciava le sei vocali della lingua russa.
Nel seguito abbiamo utilizzato il nostro applet JPipes per simulare la risposta del tratto vocale basandoci sui dati di Fant.
Nei disegni a sinistra è rappresentata (solo schematicamente) la configurazione di lingua palato e labbra mentre il soggetto pronuncia la vocale corrispondente. Nel mezzo si vede la sezione del tratto vocale corrispondente semplificato in modo che abbia sezione cilindrica e asse rettilineo. Lo 0 è posto nella laringe in corrispondenza delle corde vocali, mentre il punto finale corrisponde alla bocca. L'intero tratto per questo soggetto misura all'incirca 16 cm di lunghezza. A destra è infine disegnata la risposta in frequenza calcolata con la simulazione numerica.
Si tenga presente che la risposta in frequenza non corrisponde allo spettro del suono della vocale, ma è una proprietà intrinseca del tratto vocale. Per ottenere il suono bisogna aggiungere le frequenze prodotte dalla sorgente (la glottide). Comunque il suono delle cinque vocali russe rappresentate è abbastanza simile a quello delle corrispondenti italiane.
Conclusioni
Abbiamo detto che le vocali rappresentate nel paragrafo precedente assomigliano abbastanza nel suono alle corrispondenti vocali italiane. Possiamo visualizzare queste somiglianze a partire dai nostri dati? Emerge uno schema comune?
Proviamo a paragonare le formanti ottenute mediante la simulazione per cinque vocali russe con le formanti delle corrispondenti vocali italiane, direttamente estratte dai nostri campioni sonori (Voce umana).
Siccome non è semplice confrontare direttamente gli spettri, proviamo a osservare le posizioni dei primi due picchi (gli addetti ai lavori le chiamano formanti).
Notiamo che la posizione assoluta delle formanti nei due casi non può essere esattamente la stessa perché il tratto vocale radiografato e simulato non è quello della nostra cantante, e quindi ha morfologia differente. In particolare il tratto della radiografia è più lungo, e quindi è caratterizzato da frequenze complessivamente più gravi.
Ciononostante, il paragone fa emergere chiaramente una struttura analoga in entrambi i casi, e, infatti, le vocali poste in punti equivalenti dei triangoli nella figura a destra sono riconosciute come identiche (o molto simili tra loro).
Il modello, cioè permette di descrivere con accuratezza le differenze tra le vocali in termini di posizione della prima formante, e distanza tra prima e seconda formante.
Per ulteriori discussioni, e approfondimenti sull'estrazione delle formanti dallo spettro sonoro si veda la pagina La vocale A.