Il suono: 2. La percezione
Nelle pagine relative all’onda sonora abbiamo trattato il fenomeno sonoro toccando esclusivamente questioni di pertinenza della fisica. In particolare ci siamo soffermati sulle due prime fasi del fenomeno, cioè la produzione delle onde sonore e la loro propagazione.
Passando ora alle due fasi successive, la ricezione e l’elaborazione del suono, dovremo giocoforza uscire dal campo della fisica, e accennare a concetti e nozioni di pertinenza di altre discipline, quali la fisiologia, la psicologia, la teoria musicale, ecc.
Non abbiamo la pretesa di approfondire tutti gli aspetti ma semplicemente di mostrare come la complessità del fenomeno sonoro renda illusoria la speranza di “ridurne” tutti gli aspetti ad un approccio di tipo esclusivamente fisico.
Il problema della percezione
Sottolineiamo innanzitutto la differenza tra l’approccio fisico all’oggetto suono e un approccio che tenga in considerazione anche i fattori percettivi.
Dal punto di vista fisico le domande tipiche sono:
- Quali sono le caratteristiche oggettivamente misurabili delle onde sonore?
- Quali sono le leggi fisiche che le governano?
Dal punto di vista della percezione, dovremo invece chiederci:
- Quali sono i parametri soggettivi che mi permettono di apprezzare un suono?
- Quali sono le caratteristiche soggettive del suono che percepisco?
Infine, cercando di collegare i due approcci potremmo domandarci
- Quali caratteristiche oggettive dell’apparato di ricezione (orecchio) ed elaborazione (cervello) danno luogo alle caratteristiche percepite a partire da date grandezze fisiche oggettive dell’onda sonora?
Se adottiamo questo punto di vista ci rendiamo conto che il fenomeno sonoro è costituito dall’interazione di molti fenomeni diversi che avvengono su molti piani distinti:
- il piano fisico della vibrazione del mezzo e della propagazione dell’onda sonora
- il piano fisico-fisiologico dell’interazione tra l’onda sonora e l’orecchio
- il piano fisiologico della trasformazione del segnale ad opera del sistema percettivo
- il piano fisiologico-psicologico del riconoscimento, della cognizione del segnale, e dei suoi correlati emotivi
e, proseguendo verso la musica (si veda la sezione dai suoni alla musica),
- il piano cognitivo-linguistico dell’interpretazione e attribuzione di un significato ai suoni
- il piano linguistico-formale del riconoscimento della struttura musicale dei suoni
- il piano antropologico-culturale riguardante lo sviluppo di particolari forme e linguaggi musicali da parte delle diverse società umane
… e, così proseguendo, il discorso si può allargare a piacere
Trasferendo l’attenzione sugli strumenti musicali potremmo porci domande analoghe:
- Quali caratteristiche oggettive di uno strumento musicale ne influenzano la qualità?
- Quali sono invece i fattori percettivi?
- Quali le componenti culturali?
In questa sezione, e in quelle relative agli strumenti musicali cercheremo di affrontare il discorso, ovviamente ponendo l’accento sulla parte che più da vicino riguarda la fisica.
Attributi del suono percepito
Nella pagina sull’onda sonora abbiamo elencato alcune delle caratteristiche oggettive misurabili tipiche delle onde sonore e dei fenomeni ondulatori.
Tuttavia, il linguaggio comune spesso usa altri termini per definire le qualità di un suono. Questi termini, in genere, ed anche quando accidentalmente hanno lo stesso nome di una grandezza fisica (come intensità), non si riferiscono a caratteristiche oggettive del suono, ma a caratteristiche della percezione del fenomeno sonoro.
Tutti abbiamo sentito parlare
- di suoni gravi o acuti: la caratteristica del suono percepito che ci permette di ordinare i suoni in una scala dal grave all’acuto è chiamata altezza del suono. Per i musicisti essa è la caratteristica del suono che che distingue le diverse “note” (un LA piuttosto che un DO);
- di suoni intensi o deboli: è ciò che volgarmente chiamiamo il “volume” o intensità del suono e che i musicisti, cercano di regolare, nei loro spartiti, con le indicazione di una “scala dinamica” che va da più che pianissimo (ppp) a più che fortissimo (fff);
- di suoni dal timbro differente (il timbro è, in sostanza la qualità percepita che ci permette di distinguere il suono di un pianoforte da quello di una chitarra che stanno emettendo la stessa nota, cioè un suono della medesima altezza).
Legame tra attributi del suono percepito e grandezze fisiche dell’onda sonora
Ora riprendiamo il ruolo del fisico-musicista (si veda il paragrafo “Sulla percezione dell’altezza di un suono composto” per un dialogo tra il fisico-musicista e il navigatore-curioso).
Ovviamente ci chiediamo:
- è possibile stabilire relazioni semplici tra le grandezze fisiche che caratterizzano l’onda sonora e gli attributi del suono che percepiamo?
- La risposta è: si, ma le relazioni non sono in genere mai semplici, proprio a causa della complessità del nostro sistema uditivo.
Spesso questa questione si vede risolta in questi termini:
Grandezza fisica relativa all’onda | termine musicale |
---|---|
frequenza | altezza |
ampiezza al quadrato | intensità (o volume) |
composizione spettrale | timbro |
In realtà, indagando più a fondo, (visita a questo proposito le pagine relative alla percezione dell’intensità, alla percezione dell’altezza, alla percezione del timbro e alla fisiologia del sistema uditivo), si scopre che queste relazioni valgono solo in misura approssimativa, e solo quando ci si riferisce a suoni puri.
La correlazione nel caso di suoni più “realistici” è ben più complessa di quella qui illustrata. Il momento percettivo introduce in tale correlazione notevoli complicazioni per cui, ad esempio, l’altezza di un suono potrà, più o meno debolmente, dipendere anche dall’intensità del suono e viceversa, il timbro variare al variare della frequenza, dell’intensità e dalla modalità di eccitazione della sorgente vibrante da parte dello strumentista, e così via…
Laboratorio virtuale
Se vuoi sperimentare la semplice correlazione illustrata nel paragrafo precedente, puoi eseguire nel nostro laboratorio virtuale, esperimenti nei quali è possibile variare i parametri di un’onda (sonora) a tuo piacimento. L’applet è molto intuitivo e di facile utilizzo. Nelle pagine seguenti sono illustrati alcuni esperimenti guidati. Ti invitiamo però a sperimentare liberamente seguendo la tua curiosità
Modifica della frequenza di un’onda in cui percepirai un cambio dell’altezza del suono;
Modifica dell’intensità di un’onda in cui percepirai un cambio del “volume” del suono;
Modifica del timbro di un suono in cui percepirai una variazione del tipo di suono. Nell’applet sono forniti anche suoni dai timbri predefiniti (es. oboe, clarinetto) costruiti mediante composizioni spettrali opportune.
Premessa
Poiché il suono è un’onda, anche per esso si può definire una grandezza fisica che misura la quantità di energia trasportata dall’onda, che passa attraverso una sezione di area unitaria nell’unità di tempo. Essa si misura pertanto in W / m2. Nel caso semplice di onde sinusoidali (o di suoni puri), essa è proporzionale al quadrato dell’ampiezza dell’oscillazione dell’onda. Tale grandezza fisica viene denominata intensità sonora. A livello percettivo essa è determinante (anche se non in modo esclusivo) per cogliere quello che chiamiamo correntemente il volume del suono o, parlando di musica, la dinamica musicale (cioè quelle indicazioni che negli spartiti dei musicisti vanno da (pianissimo) a
(fortissimo).
Le intensità udibili
La soglia di udibilità
Si definisce soglia di udibilità la minima intensità sonora che l’orecchio umano è in grado di percepire. L’esperienza mostra che tale soglia varia da individuo a individuo (per esempio si innalza all’aumentare dell’età del soggetto), e, soprattutto che, anche per un singolo individuo, essa dipende dalla frequenza del suono ascoltato.
In genere si usa riferirsi ad un valore convenzionale, ottenuto mediando la soglia di udibilità di molti individui per un suono puro di frequenza di 1000 Hz.
Il valore di tale soglia è estremamente piccolo: esso vale
e corrisponde ad una variazione di pressione rispetto alla pressione atmosferica in assenza di suono di soli 20 μPa (pari a circa 0,2 miliardesimi della pressione atmosferica).
La soglia del dolore
All’altro estremo del campo di intensità udibili si trova la soglia del dolore, cioè la massima intensità sonora che l’orecchio umano è in grado di percepire e oltre la quale il suono viene sostituito da una sensazione di dolore (si osservi però che il suono può nuocere in modo permanente all’udito anche ad intensità inferiori dipendentemente dalle condizioni di esposizione). Questo valore è uguale a
ed è mille miliardi di volte (1012 appunto) più grande della soglia di udibilità.
Il livello di intensità sonora in decibel (dB SIL)
Come è mostrato nel paragrafo precedente il campo di variazione delle intensità sonora è estremamente ampio: occupa circa 12 ordini di grandezza. Rapportato ad una scala delle lunghezze sarebbe come spaziare dalle dimensioni di un’ameba (circa 600 millesimi di mm) al diametro dell’orbita lunare (circa 600 mila km).
Questa grande variabilità, assieme al fatto che l’orecchio è sensibile alle variazioni di pressione, e non al valore assoluto della pressione stessa, determina la scelta di esprimere la misura dell’intensità del sono mediante una scala logaritmica.
Si definisce perciò il livello di intensità sonora come
-
(1)
dove
-
(2) .
Il livello di intensità sonora è un numero puro (quantità adimensionale) al quale si attribuisce però, per convenzione, un’unità di misura: il decibel (da A.G. Bell, scienziato statunitense) il cui simbolo è dB. Il dB è un’unità di misura che non appartiene al sistema internazionale e deriva appunto dal rapporto tra l’intensità sonora e la soglia di udibilità.
Vantaggi della scala in dB
Il misurare l’intensità sonora, anziché tramite il valore assoluto dell’energia sonora (o della pressione) che colpisce l’orecchio, con una scala logaritmica rapportata alla soglia di udibilità presenta una serie di vamtaggi:
- il valore di intensità relativo alla soglia di udibilità vale proprio 0 dB
- se infatti sostituiamo a I proprio il valore di Imin = 10 − 12W / m2 otteniamo naturalmente
- possibilità di rappresentare grandezze che presentano un grande campo di variazione
- nel caso del suono il campo di variazione è incredibilmente esteso: l’intensità sonora di un concerto rock (prossimo alla soglia del dolore, e non è questione di gusti!!) è 1000 miliardi più intensa della soglia di udibilità. Usando la definizione di I(dB), se al posto di I sostituiamo Imax, otteniamo:
- A livello percettivo l’orecchio sembra rispondere, approssimativamente, allo stimolo rappresentato dall’intensità dell’onda seguendo una scala logaritmica.
- il volume percepito non è in relazione lineare con l’intensità. Cioè raddoppiando l’intensità sonora (e questo può essere fatto oggettivamente in laboratorio) non si percepisce un suono di intensità doppia (qui entra in gioco la soggettività dei vari ascoltatori). Esperimenti ripetuti condotti su vari ascoltatori hanno mostrato che per ottenere suoni di intensità percepita doppia occorre aumentare, approssimativamente, di un fattore dieci l’intensità dell’onda sonora.
|
|
- la scala presenta il “giusto” livello di sensibilità
- ciò viene ottenuto premettendo il fattore 10 al logaritmo del rapporto delle intensità, come appare nella definizione (1). Tale fattore è opportuno (senza di esso avremmo ottenuto un’unità di misura dieci volte più grande del dB, il Bel appunto) in quanto il dB rappresenta, con buona approssimazione, la minima differenza di intensità tra due suoni che l’orecchio può percepire (è quello che nella letteratura specialistica si chiama il JND acronimo di Just Noticeable Difference). Vale a dire che l’orecchio coglie la differenza di intensità tra due suoni solo se il loro livello differisce per più di un dB. In questo senso abbiamo parlato di giusto livello di sensibilità: che senso ha. infatti, avere unità di misura più piccole del decibel se poi l’orecchio non è in grado di apprezzare la differenza? Sarebbe come avere un righello che riportasse i decimi di millimetro: il nostro occhio non riuscirebbe a risolvere la differenza tra due “tacche” consecutive.
Livelli di intensità sonora tipici
La seguente tabella riporta i livelli relativi di intensità sonora in scala logaritmica, cioè in dB, relativamente all’intensità standard del suono appena percepibile. Questi valori sono indicativamente associati ad alcune situazioni relative alla vita di tutti i giorni.
Sorgente sonora | Livello di intensità sonora in dB |
---|---|
razzo che parte – non tollerabilità | 170 |
aereo a reazione che decolla | 130 |
martello pneumatico | 120 |
a un concerto rock | 110 |
quando c’è molto traffico | 100 |
in metropolitana | 90 |
in una piccola fabbrica | 80 |
in strada di città | 70 |
quando si conversa | 60 |
in casa | 50 |
in biblioteca | 40 |
bisbiglio | 20 |
foglie che si muovono | 10 |
soglia di udibilità | 0 |
- Se l’intensità di un suono è compresa tra 0 dB e 60 dB questo è ritenuto silenzioso
- Se l’intensità di un suono è compresa tra 60 dB e 90 dB (come quella del traffico automobilistico) può essere pericolosa soprattutto se si protrae nel tempo
- Se l’intensità di un suono è compresa tra 90 dB e 120 dB (come ad esempio nelle discoteche, nei cantieri edili, negli aeroporti o vicino allo scoppio di un petardo) diventa veramente dannosa
- Si pensa che un rumore di 200 dB possa uccidere un uomo.
- Tutti questi valori sono puramente indicativi. Più rilevante, ai fini dello studio dell’inquinamento acustico è la rilevazione dell’intensità sonora per bande di ottava cioè in determinati intervalli di frequenza.
L’intensità sonora percepita (loudness)
L’intensità sonora I(dB) è una grandezza fisica che, oggettivamente, misura il flusso di energia trasportata dall’onda sonora. Tale grandezza non descrive correttamente però l’intensità percepita (in inglese loudness) in quanto essa dipende in modo decisivo dalla frequenza del suono, e in misura minore, anche dal timbro del suono stesso. Un esempio spettacolare di tale fatto può essere ottenuto ascoltando (in cuffia) questo suono di frequenza crescente con continuità (si va 20 Hz fino a 20000 Hz). L’intensità oggettiva del suono è costante, come dimostra l’immagine dell’inviluppo della forma d’onda riportata accanto al suono
![]() |
|
L’esperimento non lascia dubbi:
- l’intensità percepita aumenta sensibilmente per le frequenze centrali (sarai stato costretto ad abbassare il volume per sopportare il suono a tali frequenze);
- se regoli il volume in modo da “sopportare” il suono anche a tali frequenze e ripeti l’ascolto osserverai che le alte e, più marcatamente, le basse frequenze diventano praticamente inudibili.
L’intensità percepita presenta quindi un legame complesso con l’intensità sonora. Per descriverla adeguatamente si è pensato di ricorrere alla rappresentazione mediante curve isofoniche che riportano, al variare della frequenza, il luogo geometrico dei punti per i quali l’intensità percepita è costante. Esse vengono ottenute chiedendo all’ascoltatore, mentre ascolta suoni di diversa frequenza, di regolare la manopola del volume in modo da percepirli con la stessa intensità. Le curve che si ottengono, non del tutto inaspettatamente se hai compreso il senso dell’esperimento sonoro precedente, sono illustrate in figura per diversi valori dell’intensità sonora percepita (rappresentati dal numero sopra alle curve):
Dal grafico possiamo trarre alcune importanti conclusioni:
- convenzionalmente si fissa il livello di intensità percepita uguale al livello di intensità sonora I(dB) alla frequenza di 1000 Hz.
- se l’intensità percepita fosse determinata completamente dalla sola intensità sonora della sorgente le curve isofoniche sarebbero orizzontali. In effetti ciò è abbastanza vero per le frequenze che vanno da 200 a 6000 Hz (che tra l’altro sono le più importanti nella pratica musicale);
- alle basse e alle alte frequenze si ha un calo di sensibilità dell’orecchio. Per percepire un suono di frequenza di 50 Hz all’intensità di 10 dB occorre un’intensità sonora I(dB) di ben 60 dB (cioè circa 1000000 volte maggiore!). Lo si può vedere seguendo la curva isofonica a 10 dB, e leggendo in ordinata il valore corrispondente a 50 Hz. Allo stesso modo, e questo era già stato evidenziato nel paragrafo relativo, per udire un suono a 20 Hz la soglia di udibilità sale a 70 dB (circa 10 milioni di volte maggiore della soglia a 1000 Hz);
- seguendo stavolta una retta orizzontale (relativa ad esempio all’intensità sonora I(dB)=70 dB) fino ad incontrare la curva isofonica relativa a 40 dB ci s’accorge che tale intersezione avviene (circa) alle frequenze di 100 e 15000 Hz. A tali frequenze l’intensità percepita è di mille volte inferiore (da 70 dB a 40 dB) a quella percepita a 1000 Hz. Ciò rende conto del drastico calo di intensità percepita che, nell’esperimento sonoro, si verifica alle basse e alle alte frequenze;
- osservando le curve si riscontra la presenza di un minimo (cioè di un massimo di sensibilità) ad una frequenza di poco inferiore ai 4000 Hz; tale frequenza corrisponde alla frequenza di risonanza del condotto uditivo (vedi per maggior dettagli anatomia del sistema uditivo). La successiva frequenza di risonanza (3 volte quella fondamentale essendo il condotto trattabile come una canna chiusa) si trova circa a 12000 Hz e determina attorno a questa frequenza, quella “piega” che spiega il “rallentamento” nella perdita di sensibilità alle alte frequenze.
![]() |
AUDIO: clicca qui per ascoltarerumore_bianco_intens_crescente.wavIn questo esempio potete ascoltare un fruscio detto rumore bianco, che contiene tutte le frequenze dello spettro udibile. Esso ha una intensità crescente al ritmo di 3 dB per ogni secondo. Ciò significa che l’intensità (oggettiva) del segnale raddoppia ogni secondo. |
Un’altra unità di misura: il phon
Nel paragrafo precedente abbiamo misurato la intensità percepita e il livello di intensità sonora con la stessa unità di misura, il decibel. Poiché le due grandezze sono coincidenti solo al livello convenzionale di frequenza di 1000 Hz, si è pensato di introdurre una nuova unità di misura, il phon, per misurare la intensità percepita. L’utilità di questa differenziazione risiede nel fatto che essa permette subito di comprendere se si sta parlando di intensità sonora (in decibel) o di intensità percepita (in phon). Ad esempio possiamo dire, riformulando uno degli esempi di lettura delle curve isofoniche, che un suono a 70 dB viene percepito alla frequenza di 100 Hz a 40 phon; in tal modo non c’è più bisogno di precisare che i 70 dB si riferiscono all’intensità sonora e i 40 phon all’intensità percepita: questo è già ovvio nella definizione di phon!
Infine: in italiano può essere fonte di confusione il fatto che il termine “intensità” si possa riferire sia all’intensità oggettiva, sia a quella percepita. In inglese, invece si usano due parole distinte: intensity e loudness.
In questa pagina descriveremo una serie di fatti sperimentali relativi alla possibilità del nostro sistema percettivo di attribuire, a determinati fenomeni sonori, una ben precisa “altezza” (quella che in musica si chiama “nota”); tale possibilità, alla base della distinzione tra suono e rumore, è il primo passo per la costruzione della “musica” intesa come strutturazione consapevole di sequenze (melodia) e di generazione simultanea (armonia) di note. La spiegazione dei fatti presentati è ancora oggetto di studio; in ogni caso nella pagina relativa alla fisiologia del sistema uditivo troverai illustrati alcuni modelli interpretativi dei fenomeni percettivi qui descritti.
Percezione dell’altezza di un suono puro
L’altezza di un suono è quell’attributo del suono stesso che ci consente di percepirlo come “nota” musicale; tale attributo può poi essere adeguatamente trascritto con un sistema di simboli posti all’interno di un pentagramma. Come già detto nella pagina relativa all’onda sonora, il parametro fisico determinante per la generazione della sensazione di altezza di un’onda puramente armonica è la sua frequenza. Puoi sperimentarlo tu stesso ascoltando questi esempi relativi a “toni puri” (cioè ad onde costituite da una sola onda armonica, come sono, in prima approssimazione quelle emesse da un diapason). Ci si rende subito conto che il suono corrispondente diventa più acuto man mano che la frequenza aumenta e diventa più grave quando la frequenza diminuisce. Dunque l’altezza è una caratteristica del suono che consente di ordinare i suoni in una scala da gravi (o bassi) ad acuti (o alti).
forma d’onda (evidenziato un periodo) | ![]() |
![]() |
||||
---|---|---|---|---|---|---|
audio |
|
|
||||
forma d’onda (evidenziato un periodo) | ![]() |
![]() |
||||
audio |
|
|
Le frequenze udibili
L’orecchio umano è in grado di percepire un suono solo se la sua frequenza è compresa tra circa 16Hz e 20000Hz, valori detti limiti di udibilità, anche se in realtà, nella pratica musicale si utilizza un più ristretto intervallo di frequenze -dai 20 Hz ai 4000 Hz- che corrisponde alle sette ottave del pianoforte. L’orecchio infatti è maggiormente sensibile proprio in questa regione dello spettro sonoro, fatto da cui possiamo dedurre che la musica, attività evidentemente artificiale, è stata prodotta dalla civiltà umana entro le possibilità del nostro sistema percettivo con un meccanismo di selezione culturale. Parliamo di selezione culturale e non selezione naturale in quanto il meccanismo della selezione darwiniana avviene in un certo senso all’opposto: il sistema percettivo si è naturalmente strutturato in modo da essere in grado di percepire quei suoni naturali (es. l’avvicinarsi di una preda, lo stormire delle fronde, il respiro, …) la cui rilevazione permetteva la maggior possibilità di sopravvivenza. Non a caso, poiché l’ambiente naturale è simile per molte specie, il campo di udibilità delle varie specie animali è piuttosto omogeneo. Lo studio delle relazioni tra lo sviluppo della musica e quello del cervello e della cultura della specie umana è affascinante e complesso, e va oltre lo scopo di questo sito.
|
A lato riportiamo gli intervalli di frequenze, in Hz, di suoni uditi da alcune specie animali. Si noti la grande differenza che si riscontra nei delfini e nei pipistrelli dovuta al fatto che tali specie hanno sviluppato meccanismi di localizzazione e di comunicazione basati sulla proprietà di “sentire” onde sonore ad elevata frequenza (se sei interessato ad approfondire questo argomento visita la sezione relativa agli infrasuoni ed ultrasuoni). |
In conclusione non tutte le “perturbazioni” periodiche che si propagano nello spazio sono percepibili dall’orecchio umano, ad es. una pallina che oscilla, appesa ad un filo…..
Le ali di un colibrì (in inglese hummingbird = uccello ronzante) si muovono con una frequenza tale (circa 50 battiti al secondo) che è possibile percepirne il movimento come onda sonora (ronzio).
La lunghezza d’onda del suono
|
Noto l’intervallo delle frequenze udibili è utile calcolare la lunghezza d’onda dei suoni corripondenti. Assumendo una velocità v del suono in aria pari a 340 m/s, ricordando (si veda a questo proposito la pagina come si descrive un’onda?) che
e sostituendo alla frequenza f il limite inferiore (20 Hz) e superiore (20000 Hz) otteniamo, per le onde sonore, lunghezze d’onda comprese tra circa 1,7 cm (suoni acutissimi, ad alta frequenza) e 17 metri (suoni gravissimi, a bassissima frequenza). |
Questo dato è molto importante perché
- fornisce un criterio relativo alla capacità dell’onda sonora di aggirare gli ostacoli (ad esempio la nostra testa, o una colonna, un edificio, una montagna). Il criterio è il seguente: se le dimensioni dell’ostacolo sono minori o paragonabili alla lunghezza d’onda del suono, l’ostacolo non è in genere in grado di fermare il suono che lo investe. Non genera cioè una zona d’ombra sonora. A questo proposito visita le pagine relative e alla diffrazione in generale e più in particolare alla diffrazione del suono;
- fornisce un criterio di percepibilità dell’altezza di un suono in relazione alla dimensione degli ambienti in cui il suono viene prodotto:
-
- è possibile percepire l’altezza di un suono di lunghezza d’onda di 17 metri, in una stanza 10×10 metri?
- Come può essere colta la periodicità dell’onda se la dimensione della stanza non è sufficiente a contenere una sola onda completa, prima che questa venga riflessa dalle pareti?
- Chi, come chi scrive, ha avuto l’occasione di ascoltare in ambiente chiuso un octobass, una specie di contrabbasso gigante in grado di emettere suoni di frequenza prossima a 20 Hz, ha dubitato seriamente delle qualità musicali dello strumento: con fatica è stato possibile associare una sensazione di altezza precisa alle note più gravi. Probabilmente la percezione sarebbe migliorata all’aria aperta (si pensi ad esempio alle note gravi di un corno svizzero, alle quali è indubbiamente possibile associare una sensazione di altezza più precisa) ove l’onda sonora può “manifestare meglio il proprio carattere periodico senza che siano presenti fenomeni di riflessione.
Un dialogo: “Sulla percezione dell’altezza di un suono composto”
Illustrare i fenomeni fisici e percettivi collegati alla percezione di un suono composto (costituito cioè dalla sovrapposizione di più onde armoniche) è talmente complesso che abbiamo scelto, per affrontare il problema, di presentarlo sotto forma di “dialogo”. I protagonisti del dialogo sono il fisico-musicista (FM) e il navigatore curioso (NC) che ha avuto la pazienza di pervenire, emergendo dai meandri del sito, a questa pagina e che ha già letto quanto detto nel primo paragrafo.
NC: Nel primo paragrafo ho imparato che l’altezza di un suono puro è determinata dalla sua frequenza. Ma cosa accade se il suono, pur rimanendo periodico con frequenza f0, non è puro? Questo è sempre il caso quando l’onda, pur essendo periodica, non ha la forma di una sinusoide.
- FM: Il teorema di Fourier ci assicura che ogni onda periodica di frequenza f0 è costituita dalla sovrapposizione di un’onda armonica fondamentale della stessa frequenza f0 e di onde armoniche aventi frequenze tutte multiple intere di f0. Queste onde si chiamano parziali armoniche, o semplicemente armoniche. In questo caso particolarissimo il sistema percettivo, benché sollecitato simultaneamente da suoni a più frequenze, non percepisce effettivamente i singoli suoni distinti, ma li fonde in un unico suono al quale è in grado di attribuire in modo netto una sensazione di altezza. L’altezza percepita corrisponde all’altezza della sola fondamentale di frequenza f0, come puoi verificare in questo esempio.
onda periodica composta da 10 armonici | ||
---|---|---|
forma d’onda | spettrogramma | |
![]() |
![]() |
suono complesso con parziali armoniche | suono puro di altezza equivalente | ||||
---|---|---|---|---|---|
|
|
NC: E che fine fa, a livello percettivo, l’informazione contenuta le parziali superiori, visto che non sembrano contribuire alla sensazione di altezza percepita?
- FM: Le parziali superiori contribuiscono sempre ad un’altra qualità percettiva del suono, il suo timbro. A parità di frequenza della fondamentale, due suoni sono percepiti come differenti quando le loro parziali armoniche hanno diverse intensità. L’altezza non è certo l’unico attributo che associamo ad un suono. Pensa ad una stessa nota emessa da un violino e da una tromba.
Tromba | Violino | ||||
---|---|---|---|---|---|
|
|
Ma non divaghiamo: questo argomento è meglio affrontato alla pagina sulla percezione del timbro.
NC: D’accordo. Comunque so che molti strumenti, e in particolare le percussioni, come i timpani, assieme alla fondamentale, emettono parziali NON armoniche, e, talvolta, non è possibile stabilire con precisione quale sia l’altezza del suono che si sente. Questo vuol dire che le parziali contribuiscono non solo al timbro, ma anche all’altezza percepita?
- FM: Questa è un’ottima domanda! Possiamo rispondere direttamente con un esempio. Nella prima colonna trovi suoni complessi costruiti tutti sulla stessa fondamentale a 200 Hz, e con parziali di uguale intensità (quindi dovremmo percepire suoni con lo stesso timbro). Tuttavia, dal primo all’ultimo, le parziali sono in rapporti “sempre meno armonici”. Si parla di ottava allargata, perché il rapporto tra la fondamentale ed il primo armonico non è più 2:1 come nel primo suono, ma, rispettivamente, 2,01:1, 2.05:1, 2.1:1. Sorprendentemente, pur avendo la stessa fondamentale, i suoni complessi anarmonici vengono percepiti a diverse altezze. Per facilitare la verifica abbiamo messo, nella seconda colonna, suoni puri di riferimento pari all’incirca all’altezza percepita per ogni suono complesso. Osserva però che il suono complesso non contiene nessuna frequenza pari a quella del suono percepito.
Suono complesso | suono puro all’altezza percepita | ||||
---|---|---|---|---|---|
|
|
||||
|
|
||||
|
|
||||
|
|
In tutti i suoni inarmonici sono particolarmente evidenti i battimenti, che li rendono piuttosto fastidiosi. Consulta le pagine sui battimenti, le bande critiche e fisiologia del sistema uditivo per trovare maggiori informazioni.
NC: Per questo quando sento il piatto di una batteria o una campana la sensazione di percepire una nota è del tutto assente o comunque molto imprecisa (non si dice “stonato come una campana”?).
- FM Sostanzialmente sì. Molti strumenti musicali, soprattutto quelli a fiato e a corde, emettono “automaticamente” suoni con parziali armoniche. La geometria di questi strumenti, infatti, permette di selezionare solo determinate lunghezze d’onda, e quindi frequenze multipli della frequenza fondamentale: se sei interessato a capire come questo avviene visita le pagine ove si parla di interferenza tra onde riflesse e di frequenze proprie. Non a caso vi è un legame ben preciso tra le dimensioni di uno strumento e il tipo di “nota” che è in grado di emettere! Al contrario, gli strumenti musicali come le percussioni possono oscillare secondo frequenze NON multiple della frequenza fondamentale (le parziali non sono armoniche). Ciò è dovuto essenzialmente al fatto che la parte vibrante è, per così dire, bidimensionale (rispetto alle corde e alle colonne d’aria degli strumenti a fiato che sono sostanzialmente unidimensionali). Se vuoi vedere in quali modi può vibrare una membrana (ad. esempio la pelle di un tamburo) visita le pagine relative ai modi normali e alle onde stazionarie, oppure le pagine sulle percussioni. Per quanto riguarda le campane un intero capitolo andrebbe aperto sulla millenaria e difficile arte di forgiarle in modo che le loro parziali siano il più possibile armoniche.
NC: “Quindi se ho ben capito le percussioni emettono suoni non periodici (se lo fossero, per il tuo teorema di Fourier, tutte le parziali dovrebbero essere armoniche). È forse questo che distingue un suono (musicale) da un rumore: l’essere prodotto o meno da un’onda periodica?
- FM: In prima approssimazione potremmo dire così, anche se preferisco avere una posizione più “sfumata” al riguardo. Ascolta questi esempi: sono suoni o rumori? Percepisci ancora un’altezza, seppur in modo meno netto?
Forma d’onda | Spettrogramma | Audio | ||
---|---|---|---|---|
![]() |
![]() |
|
||
![]() |
![]() |
|
||
![]() |
![]() |
|
||
![]() |
![]() |
|
NC:Insisto: capisco che da musicista tu tenda a sopravvalutare il caso in cui la sorgente del suono sia uno strumento musicale, ma mi risulta che, oggigiorno, un computer sia in grado di “sintetizzare” suoni contenenti frequenze di qualsiasi valore. Il sistema percettivo non viene “confuso” se l’insieme delle frequenze che costituiscono l’onda sonora è del tutto casuale?
- FM: La confusione del sistema percettivo è, probabilmente, ciò che chiamiamo rumore. Se sei interessato ad approfondire questi aspetti puoi visitare la pagina suono o rumore?; scoprirai che, paradossalmente, c’è rumore e rumore come se il “caos” delle frequenze costituenti l’onda sonora avesse una specie di “ordine” gerarchico.
NC: Ma allora, se le parziali finiscono con l’influire sull’altezza percepita, è possibile sbarazzarsi del tutto della fondamentale?
- FM: In effetti, data una serie armonica senza la fondamentale, il sistema percettivo è in un certo senso in grado di “ricostruirla”. Cioè ad un suono complesso con parziali armoniche viene attribuita l’altezza che avrebbe la fondamentale, anche in assenza della fondamentale! Puoi verificarlo nei seguenti esempi, in cui un suono armonico complesso con fondamentale a 300 Hz viene progressivamente filtrato con un filtro passa-alto, in modo da sopprimerne progressivamente le parziali inferiori. Noterai che, mentre il timbro cambia piuttosto drasticamente tra un campione e l’altro, l’altezza sembra rimanere la stessa quasi fino all’ultimo, anche se in ogni suono un orecchio attento identifica abbastanza facilmente la parziale di maggiore intensità. Negli ultimi due suoni la sensazione di altezza diventa instabile, e molti ascoltatori si “sintonizzano” su una nuova fondamentale. Accanto ai suoni complessi riportiamo il suono puro di altezza percepita equivalente alla fondamentale e, negli ultimi due casi, l’armonico più intenso.
Spettro | Suono complesso filtrato | Suono puro di altezza equivalente | ||||
---|---|---|---|---|---|---|
![]() |
|
|
||||
![]() |
|
|
||||
![]() |
|
|
||||
![]() |
|
|
||||
![]() |
|
|
Si parla in questi casi di altezza virtuale del suono. Ne trovi un altro esempio alla pagina su effetti e illusioni acustiche. Inoltre puoi sperimentare direttamente tale fenomeno visitando la pagina percorsi guidati per applet analisi e sintesi di Fourier dove troverai istruzioni per eseguire un semplice esperimento nel nostro laboratorio virtuale. La spiegazione del fenomeno per il quale il nostro sistema percettivo riesce a creare altezze virtuali è ancora oggetto di discussione (visita a questo proposito la solita pagina fisiologia del sistema uditivo) ma la presenza dell’effetto è innegabile; esso viene utilizzato:
-
- negli strumenti che debbono generare note di frequenza molto bassa (es. fagotto, contrabbasso, tuba, pianoforte) che hanno, per problemi di adattamento di impedenza con la cassa armonica, l’armonica fondamentale molto debole;
- nella radiofonia e nella riproduzione sonora dove le basse frequenze tagliate dai sistemi elettronici di trasmissione vengono in parte ricostruite nel sistema percettivo dell’ascoltatore;
- nella teoria musicale del “Traité de l’harmonie” del 1722 di J.P.Rameau dove si elabora una teoria sulla consonanza delle triadi maggiori basata sulla presenza di un basso fondamentale (che non è altro che la nostra armonica fondamentale mancante).
NC: Questa proprietà di “fondere” i suoni costituiti da parziali esattamente armoniche in unico suono è straordinaria! Ovviamente mi aspetto che se le parziali non sono armoniche sentiremo più suoni contemporaneamente interpretando ciascuna parziale come un “suono puro”. Stanno così le cose?
- FM: La risposta è molto articolata:
-
- la perdita della capacità di fusione è graduale. Sono stati realizzati diversi esperimenti, dai quali si evince che il cervello, se sollecitato da parziali non esattamente armoniche, sembra adottare, per riconoscere configurazioni armoniche, due strategie complementari che utilizzano:
- il riconoscimento di un “pattern” simile a quello armonico per le parziali (quelle di ordine inferiore) che eccitano parti distinte della membrana basilare e per tale motivo si chiamano risolte (Goldstein [1]);
- l’interazione delle armoniche di ordine superiore che eccitando le stesse zone della membrana basilare (per tale motivo si chiamano non risolte) danno luogo ad un fenomeno di battimento della membrana stessa che permette di percepire la frequenza differenza (Schouten);
- la perdita della capacità di fusione è graduale. Sono stati realizzati diversi esperimenti, dai quali si evince che il cervello, se sollecitato da parziali non esattamente armoniche, sembra adottare, per riconoscere configurazioni armoniche, due strategie complementari che utilizzano:
In questo esempio tratto da A.Frova [2] si sovrappongono quattro parziali quasi armoniche di frequenza :
|
|
- dove il divisore è stato ottenuto dividendo la frequenza delle parziali per 3, 4, 5, 6 nell’ordine; un ragionevole divisore comune è circa 207 Hz: Nell’esperimento da noi effettivamente condotto l’altezza virtuale percepita risulta però circa 230 Hz (forse che tale valore si ottiene dal riconoscimento di una configurazione armonica “traslata”, secondo i dettami della prima strategia?). Ovviamente se la frequenze si discostano molto dalla configurazione armonica, il cervello perde la capacità di attribuire al suono un’altezza ben definita.
-
- utilizzando parziali dalle frequenze molto ravvicinate (ad esempio 200 e 210 Hz) si ha ancora una sensazione di altezza ben definita (pari alla frequenza media) ma si ha un fenomeno del tutto nuovo: l’intensità del suono sembra “fluttuare” producendo un particolarissimo effetto di tremolo. È il fenomeno dei Battimenti. Se vuoi “sentirlo” visita il laboratorio virtuale dove troverai un esperimento preconfezionato.
-
- se la distanza delle frequenze delle parziali aumenta il suono perde il carattere “tremolante” del battimento ed assume un timbro aspro e sgradevole. Solo al di sopra di una certa separazione delle frequenze riesci a percepire due suoni distinti (quello che musicalmente si chiama un bicordo). Troverai spiegazione di questo fatto nella teoria della banda critica
-
- vi sono poi altri fenomeni di mascheramento che impediscono al sistema percettivo di udire suoni ben separati in frequenza eseguiti simultaneamente qualora uno dei due suoni sia molto più “intenso” dell’altro.
NC: Mamma mia! Non mi aspettavo di suscitare un vespaio del genere! Ho ancora però un’ultima curiosità: come “funziona” tutto questo? Si, insomma tu mi hai descritto quello che accadde in vari esperimenti, ma cosa accade di preciso a livello del sistema percettivo?
- FM: Mi chiedi veramente troppo! Qui c’è bisogno del mio amico FFM (fisiologo-fisico-musicista). Ti rimando alle sue considerazioni.
Gli intervalli musicali
Nella pratica musicale ha poca importanza la capacità di associare ad una data nota l’altezza (o la frequenza) corretta: questa capacità è chiamata “orecchio assoluto”, e sono pochi i musicisti che, sentendo un suono isolato da qualsiasi contesto, sappiano indovinare di che nota si tratti. Questo fatto sorprende spesso i profani: sarebbe come dire che un pittore non riconosce i singoli colori di cui si serve per creare i propri quadri. In realtà, nella pratica musicale, è molto più importante la capacità di riconoscere l’intervallo formato tra due note consecutive, e di riconoscere e utilizzare la sua qualità di essere “consonante” o “dissonante”.
I termini consonanza e dissonanza sembrano introdurre elementi di soggettività (che certamente vedremo sono ben presenti) nel giudizio sui diversi intervalli, ma esistono anche precise basi fisiche e fisiologiche oggettive che fanno sì che tutte le civiltà, in luoghi e tempi molto diversi, abbiano individuato intervalli privilegiati da utilizzare nella propria musica.
Primo fra tutti per consonanza è l’intervallo di ottava. I quattro suoni che hai ascoltato nel paragrafo iniziale di questa pagina, sono separati, a due a due, da un intervallo di ottava. Ci si può chiedere quale relazione debba intercorrere tra le frequenze di due suoni per dar luogo ad un intervallo di un ottava. Nella tabella seguente sono riportate le differenze e i rapporti di frequenza
f1 | f2 | f2 − f1 | f2 / f1 |
---|---|---|---|
55 | 110 | 55 | 2 |
110 | 220 | 110 | 2 |
220 | 440 | 220 | 2 |
I risultati non lasciano dubbi: l’intervallo percepita è l’ottava se il rapporto tra le due frequenze è esattamente doppio. In generale dal nostro sistema percettivo
- due intervalli sono giudicati uguali se è identico il rapporto (e non la differenza) delle frequenze dei suoni dell’intervallo.
Tra gli intervalli percepiti in media come consonanti si sono individuate, oltre all’ottava, la quinta giusta naturale in cui il rapporto delle frequenze è pari 3/2 (anziché 2/1 come nell’ottava) e la quarta giusta naturale per la quale il rapporto diventa 4/3.
La teoria degli intervalli musicali conduce ben presto alla costruzione di una scala musicale: volendo ordinare i suoni in una successione (scala) musicale che abbia tutti i “gradini” (intervalli) uguali e che parta dalla nota più bassa dell’ottava per terminare in quella più alta si devono considerare suoni le cui frequenze stanno in progressione geometrica e (non aritmetica). Si osservi che nei normali gradini di una scala rimane costante la differenza (e non il rapporto) tra le altezze assolute (rispetto alla base della scala) di due gradini consecutivi!
Ovviamente non è detto che tale criterio matematico produca intervalli così “consonanti” come l’ottava. Nella scelta delle frequenze (e quindi delle note) da inserire nell’ottava ai fini di formare una scala musicale hanno storicamente giocato criteri estetici relativi alla consonanza degli intervalli interni alla scala stessa. La storia di come civiltà diverse abbiano prodotto differenti divisioni dell’ottava è assolutamente affascinante, intrecciata com’è di considerazioni “numerologiche”, estetiche in senso stretto, fisiche e di tecnica costruttiva degli strumenti musicali. Lo stesso vale per lo studio dell’evoluzione della musica prodotta nel tempo da ciascuna singola civiltà.
Ulteriori approfondimenti nelle sezioni Dal monocordo alle scale musicali, scala pitagorica, scala naturale, temperamento equabile.
Infrasuoni e ultrasuoni
- Non tutti i suoni possono essere percepiti dall’orecchio umano. In particolare per convenzione si considerano non percepibili i suoni con frequenze minori di 20 Hz, detti infrasuoni, e quelli con frequenze superiori a 20000 Hz, detti ultrasuoni. Per saperne di più sul meccanismo della percezione dell’altezza si veda la pagina sulle frequenze udibili
- A produrre infrasuoni sono tutte le vibrazioni meccaniche di bassa frequenza come i forni, alcune macchine con parti rotanti, i motori diesel, i compressori, i ventilatori, le vibrazioni del terreno quando passano pesanti autocarri, le onde longitudinali dei terremoti. Benché gli infrasuoni non possano essere uditi, essi, specie se si accompagnano ad onde di di elevata intensità sonora, sono percepibili attraverso lo scheletro, come chiunque ha sperimentato per esempio ponendosi in prossimità di un grosso diffusore in un concerto, o in una discoteca, e percependo “nel petto” anziché nelle orecchie le vibrazioni corrispondenti ai bassi ritmici.
- Gli ultrasuoni possono essere prodotti per esempio ponendo in vibrazione una sottile lamina di quarzo per effetto piezoelettrico, cioè sollecitandola con una tensione elettrica variabile alla frequenza di ultrasuono desiderata. Lo stesso dispositivo può funzionare all’inverso: se la lamina di quarzo riceve ultrasuoni, inizierà a vibrare producendo una corrente misurabile. Questo dispositivo può essere utilizzato per rilevare ultrasuoni nell’ambiente.
Tipi di ultrasuoni e loro utilizzo
Gli ultrasuoni si dividono convenzionalmente in tre bande di frequenza:
- ultrasuoni ad alta frequenza, da 1 MHz a 10 MHz, usati soprattutto come mezzo diagnostico in medicina;
- ultrasuoni a media frequenza, da 100 kHz a 10 MHz; usati ancora in medicina, ma con funzione terapeutica, perché causano un riscaldamento locale dei tessuti irraggiati che, se opportunamente dosato, è in grado di debellare microrganismi o essere terapeutico contro i reumatismi
- ultrasuoni a bassa frequenza, da 20 kHz a 100 kHz: vengono prodotti nell’utilizzo di certi impianti industriali che fanno uso di compressori, reattori o turbine a gas
- Gli ultrasuoni ad alta frequenza vengono usati in medicina come ad esempio nell’ecografia che permette di osservare, senza danno per il paziente, parti interne del corpo umano con una metodologia simile a quella basata sui raggi X, ma con un dettaglio di risoluzione e una penetrazione molto minori. Infatti, facendo vibrare cristalli di quarzo, si generano ultrasuoni che vengono diretti ad angolature diverse attraverso le parti da studiare. Si rilevano, molte volte ogni secondo, le onde riflesse, in modo da ottenere una serie di immagini che, rielaborate in sequenza, formano un filmato.
- Gli ultrasuoni vengono anche utilizzati per sterilizzare il latte, per scoprire impurità o anomalie nei metalli, per bucare dei materiali senza che questi vengano a contatto con una punta, per mescolare liquidi diversi o per pulire oggetti preziosi, per rimuovere incrostazioni da superfici come quelle dentarie.
- Anche il SONAR (SOund NAvigation and Rancing = navigazione e localizzazione mediante il suono) sfrutta le proprietà degli ultrasuoni che, tra l’altro, sono in grado di propagarsi in acqua per molti chilometri. Questo dispositivo permette di conoscere i valori della profondità del mare e di controllarne il fondo consentendo così di ricavare informazioni sull’ambiente naturale o sulla presenza di imbarcazioni affondate. Il meccanismo su cui si basa il SONAR è semplice: vengono generati ultrasuoni che poi vengono indirizzati verso degli obiettivi che li riflettono. Grazie a un rilevatore si raccolgono le onde riflesse e, nota la velocità del suono nell’acqua e il tempo impiegato dalle radioonde per compiere l’intero cammino di andata e ritorno, si riesce a calcolare a che distanza si trova l’oggetto in questione.
- Certi animali, come i pipistrelli, sfruttano gli ultrasuoni per muoversi nel buio o per catturare prede nella notte: essi dopo aver prodotto degli ultrasuoni e averli indirizzati verso ciò che devono rilevare, stimano il tempo “di andata e ritorno” e dunque la distanza del loro obiettivo.
- L’ecocardiogramma si basa sull’uso degli ultrasuoni: questa è una tecnica che permette di osservare le varie parti del cuore che avendo densità differenti, una volta colpite dalle onde sonore, le riflettono in modo diverso, consentendo, dopo un’accurata analisi dei dati, una diagnosi precisa delle patologie eventualmente presenti.
Che cos’è il timbro di un suono
Una definizione comunemente accettata di timbro è la seguente:
- il timbro è la qualità percepita di un suono che ci permette di distinguere due suoni che hanno la stessa altezza e la stessa intensità.
In parole più semplici il timbro è la qualità del suono che ci permette di distinguere la voce di un violino da quella di un flauto, quando i due strumenti stiano emettendo una stessa nota. Ascolta questi esempi nei quali un violino, un flauto ed una tromba stanno emettendo il Si bemolle dell’ottava centrale del pianoforte (circa 466 Hz).
Strumento | Forma d’onda | Spettrogramma | Audio | ||
---|---|---|---|---|---|
Violino |
|
![]() |
![]() |
||
Flauto |
|
![]() |
![]() |
||
Tromba |
|
![]() |
![]() |
||
Oboe |
|
![]() |
![]() |
Non c’è dubbio che gli strumentisti stiano emettendo note della stessa altezza eppure, anche un orecchio non musicalmente allenato è in grado di percepire la diversa qualità del suono. Per favorire anche l’occhio, abbiamo anche riportato la forma d’onda registrata in funzione del tempo, e lo spettrogramma.
Quali fattori determinano il timbro percepito?
Una risposta “statica”
La risposta a questa domanda diventa estremamente intricata non appena si cerca di definire il timbro non in base a quello che permette di fare (distinguere i diversi strumenti musicali) ma in base a parametri oggettivi e misurabili.
- Una prima risposta che spesso si legge è che il timbro di uno strumento è dovuto, in larghissima parte, alla composizione spettrale del suono che esso emette. Il concetto di contenuto spettrale è complesso (esso è ben illustrato nella pagina relativa al teorema di Fourier). Semplificando potremmo dire che quando uno strumento emette una nota di una determinata frequenza (ad esempio il Si bemolle ascoltato in precedenza) esso, a causa dei vincoli imposti dalla “geometria” delle parti oscillanti degli strumenti musicali, genera, insieme alla nota fondamentale, più note tutte di frequenza multipla intera della fondamentale (armoniche).
Lo spettro dei diversi strumenti differisce per la diversa distribuzione dell’energia (e quindi delle ampiezze) tra la nota fondamentale e le armoniche superiori. In effetti confrontando gli spettri dei tre suoni precedenti è possibile osservare il diverso contributo delle varie armoniche
- Ad ogni composizione spettrale corrisponde una ben precisa forma d’onda ottenuta “sommando” le varie armoniche (procedimento chiamato sintesi, quindi potremmo dire in modo più immediato che il timbro di uno strumento è dovuto, in larghissima parte, alla forma d’onda del suono che esso emette. Di seguito riportiamo le forme d’onda dei soliti tre suoni:
La differenza delle tre forme d’onda è evidente.
- Nel nostro Laboratorio virtuale troverai un applet con il quale può divertirti a sintetizzare nuovi suoni decidendo quali armoniche immettere e con quale peso (regolando, cioè, la loro ampiezza). L’applet consente di vedere in tempo reale l’azione della sovrapposizione delle varie armoniche sulla forma d’onda. In linea di principio potresti cercare di riprodurre in modo fedele le forme d’onda dei tre suoni reali precedenti agendo sulla frequenza della nota fondamentale e sull’ampiezza delle armoniche successive. Il risultato è deludente: quando anche la forma d’onda assomiglia molto a quella reale il timbro ottenuto è solo lontanamente somigliante a quello dello strumento reale. Teniamo a precisare che tale deludente risultato non è il frutto di approssimazioni introdotte dal “software” ma consegue dal tentativo di definire il timbro di uno strumento in termini statici.
Una risposta dinamica
|
Il fatto è che il suono è già di per sé un’entità “vivente”, e segue una parabola ben delineata e scandita da diverse fasi temporali: generalmente
Gli spettri mostrati nel paragrafo precedente, che “fotografano” il contenuto spettrale medio nel tempo di tutta la durata del suono, sono del tutto insufficienti a rendere ragione della complessa percezione del timbro. Sarebbe come avere la pretesa di comprendere un film osservandone un unico fotogramma. Gli spettri “statici” forniscono una discreta approssimazione del timbro reale solo per la fase di regime di strumenti quali archi o fiati nei quali è possibile “far durare” il suono. Anche se le fasi di attacco e di decadimento contribuiscono sempre alla determinazione del timbro, il suono prodotto da questi strumenti può essere mantenuto stazionario e prolungato a piacere. Negli strumenti percussivi, invece, il suono, dopo essere stato generato non è più sotto il controllo dell’esecutore. Il loro timbro non può in nessun caso essere sintetizzato a partire da uno spettro statico. È per tale ragione che nell’applet vengono riportati tentativi di riproduzione del timbro solo per pochi strumenti (oboe, clarinetto e violino). |
- Ricordiamo anche che un suono reale (ne troverai molti esempi nelle pagine relative agli strumenti musicali) contiene parziali anarmoniche (non multiple della fondamentale) generate dai “rumori” meccanici delle parti mobili degli strumenti. Anzi, a detta di molti, sono proprio questi piccoli rumori a rendere meno freddo il suono prodotto da uno strumento rispetto a quello sintetizzato.
Da queste considerazioni emerge una risposta alla domanda iniziale molto più articolata seppur, vedremo, non ancora soddisfacente: il timbro di uno strumento è determinato dall’evoluzione del contenuto spettrale del suono nel tempo. In effetti nell’analisi timbrica dei suoni si rivelano di fondamentale importanza i sonogrammi che non sono altro che la rappresentazione dell’evoluzione temporale dello spettro del suono (come un film è un insieme di fotogrammi).
Il concetto di inviluppo
L’utilizzo dei sonogrammi per cogliere l’evoluzione temporale del timbro viene spesso affiancata dall’analisi dell’inviluppo del suono prodotto. Con tale termine intendiamo indicare l’evoluzione dell’ampiezza dell’onda sonora nel tempo (i musicisti usano in luogo dell’ampiezza, il termine dinamica). Nell’inviluppo di un suono si distinguono sempre quattro fasi (non sempre tutte presenti):
- Attacco (attack) che corrisponde alla fase iniziale del suono e dura fino al momento in cui l’onda sonora ha raggiunto la massima ampiezza. Esso può essere molto rapido come negli strumenti a percussione e nel pianoforte (della durata di circa 1/100 di secondo) o maggiormente diluito nel tempo. Negli strumenti ad arco e a fiato l’esecutore può variare, a seconda delle esigenze musicali, i vari tipi di attacco modulandone la durata e le modalità di raggiungimento del picco di energia. È ovvio che ogni suono ha una fase di attacco, in quanto ogni sistema fisico vibrante risponde con un tempo caratteristico: il tempo necessario all’instaurarsi delle onde stazionarie, o all’affermarsi di un particolare modo di vibrazione del sistema. Ascolta gli esempi musicali qui sotto riportati eseguiti, per i nostri scopi, da veri strumentisti in sala di registrazione:
- Decadimento (decay), detto anche decadimento iniziale o primo decadimento. Esso è presente in quegli strumenti (es. tromba) in cui il suono scatta solo se un determinato parametro fisico (ad esempio pressione del soffio) supera una certa soglia. In tale casi il musicista corregge leggermente lo “scatto” dovuto al superamento della soglia, determinando, prima della fase di stabilizzazione del suono, una breve diminuzione dell’ampiezza.
- Tenuta (sustain). È la fase in cui il suono rimane stabile mentre l’esecutore continua a fornire energia. Ovviamente tale fase non esiste negli strumenti a percussione. È interessante osservare che tale fase sembra la più facilmente riproducibile da un sintetizzatore elettronico. In realtà nella fase di sustain l’esecutore introduce fatalmente qualche involontaria fluttuazione in ampiezza che caratterizza il suono da strumenti “veri” rispetto a quelli elettronici.
- Rilascio (release), detto anche decadimento finale – È la fase che inizia nel momento in cui l’esecutore smette di fornire energia allo strumento e il suono decade più o meno rapidamente. Tale fase può essere anche molto lunga negli strumenti a percussione (si pensi alle note base di un pianoforte, o al suono di un gong), mentre di solito è breve negli archi e nei fiati. Ovviamente tutti i suoni hanno un rilascio.
inviluppi della forma d’onda | ||||||||
---|---|---|---|---|---|---|---|---|
violino | flauto | tromba | ||||||
![]() |
![]() |
![]() |
||||||
|
|
|
I moderni sintetizzatori elettronici hanno una “circuiteria” finalizzata alla miscelazione di queste quattro fasi e del contenuto spettrale secondo parametri facilmente regolabili dall’esecutore. Il controllo timbrico raggiunto in tali strumenti ormai non è più finalizzato alla resa del suono di strumenti tradizionali; il suono “elettronico” ha ormai una sua esistenza autonoma (si compone ormai musica per sintetizzatori) che si arricchisce della possibilità (teoricamente illimitata) di costruire forme d’onda non generate dagli strumenti tradizionali.
La teoria delle formanti
La risposta data al paragrafo precedente seppur più attenta a cogliere gli aspetti dinamici connessi al timbro del suono è, a ben riflettere, ancora insoddisfacente per quel che riguarda gli aspetti più propriamente percettivi. Ciò per vari ordini di motivi:
- i sonogrammi di suoni di altezza differente generati da uno stesso strumento hanno evoluzione temporale differente, cioè non si ottengono semplicemente “traslando” le frequenze: ciò a causa della diversa evoluzione temporale delle varie armoniche costituenti i vari suoni (allora in teoria, per ciascun strumento dovremmo riconoscere un repertorio di timbri differenti, uno per nota);
forme d’onda | |||
---|---|---|---|
![]() |
![]() |
||
sonogramma | audio | ||
![]() |
|
- addirittura la stessa nota emessa secondo due modalità diverse (ad esempio il LA di un violino suonato sulla seconda corda vuota e generata sula terza corda diteggiata) hanno composizioni spettrali (anche istantanee) leggermente diverse (e ciò aumenterebbe il numero di timbri da associare allo strumento);
forme d’onda | |||
---|---|---|---|
![]() |
![]() |
||
sonogramma | audio | ||
![]() |
|
- in molti esperimenti possiamo, entro certi limiti, alterare il sonogramma di un suono pur continuando a riconoscere il timbro dello strumento che lo produce. Ad esempio riconosciamo abbastanza facilmente gli strumenti quando li sentiamo alla radio, nonostante essa attenui buona parte delle frequenze originali, agendo come un filtro. In un certo senso il nostro apparato percettivo è in grado di associare lo stesso timbro non solo ad un vasto repertorio di sonogrammi, ma anche un gran numero di deformazioni che essi possono subire.
Evidente c’è qualcos’altro che ci consente di individuare uno strumento che non sia solo l’evoluzione del contenuto spettrale del suono nel tempo. È quanto suggerisce la teoria delle formanti. Per comprendere appieno tale teoria ti invitiamo a leggere le pagine suono e risonanza e strumenti musicali; in ogni caso riassumiamo gli assunti fondamentali della teoria delle formanti.
Uno strumento musicale, dal punto di vista di un fisico è semplicemente un sistema atto a generare onde sonore ed irradiarle nell’ambiente. In particolare esso si compone (almeno) di:
-
- Una sorgente primaria di vibrazione (corda, membrana, lastra, aria) accordabile a diverse frequenze che genera la fondamentale e, secondo ampiezze in genere rapidamente decrescenti, le parziali (armoniche e non);
- Un risuonatore (cassa armonica, canna chiusa e aperta, tavola armonica) con la funzione di amplificare la vibrazione in modo selettivo in frequenza, e dare una nuova forma all’onda sonora rispetto a quella originariamente emessa dall’elemento vibrante;
- Un adattatore di impedenza tra il sistema vibrante e l’aria circostante per aumentare l’efficienza di irradiazione del suono.
La parte per noi più interessante è il procedimento di amplificazione selettiva che avviene ad opera del risonatore. La particolare conformazione di ogni strumento musicale è studiata perché il risonatore presenti determinate frequenze di risonanza. Ad esempio nel caso del violino, il risonatore è costituito dalla cassa armonica la cui forma irregolare seleziona frequenze risonanti attorno a 600 Hz e 1000 Hz (dette risonanze del legno) ed altre risonanze molto ravvicinate nella zona tra i 2000 Hz e i 4000 Hz. Vi è poi anche una risonanza dell’aria detta risonanza di Helmholtz dovuta all’aria che entra e esce dalla cassa attraverso i fori ad effe e che si colloca attorno alla frequenza di 300 Hz. Quando tale risonatore viene investito dalla vibrazione generata dall’elemento vibrante (l’accoppiamento tra elemento vibrante e risonatore è reso efficiente adattando l’impedenza tra cassa armonica e corda tramite il ponticello), esso “risuona”, cioè si mette in oscillazione, soprattutto alle frequenze vicine alla propria frequenza di risonanza e ciò indipendentemente dal contenuto spettrale del suono generato dalla sorgente primarie di vibrazione. L’effetto pratico è che il contenuto spettrale del suono originario viene modificato dall’effetto filtrante del risuonatore: si formano bande di frequenza dette formanti nelle quali l’emissione sonora dello strumento è dominante. Probabilmente la posizione delle formanti, essendo dovuta alla geometria dello strumento e non alla frequenza della nota emessa, e l’elemento determinante per la riconoscibilità del timbro di uno strumento. Un metodo pratico per ottenere le frequenze delle formanti che evidenziano le risonanze proprie dello strumento è di mediare gli spettrogrammi istantanei su intervalli di tempo sufficientemente lunghi; è importante eseguire la media su tempi lunghi e su brani che visitano l’intero spettro delle altezze dello strumento in modo da sollecitare tutti i modi normali della cassa armonica.
Da quanto detto in precedenza sembra che la qualità timbrica dello strumento sia completamente dipendente dalle caratteristiche geometriche dello strumento stesso. Il ruolo del suonatore, dal punto di vista fisico, viene svilito
- a quello di sorgente di energia meccanica atta a mettere in moto la sorgente primaria di vibrazione;
- a quello di selezionatore dell’armonica fondamentale (cioè della nota emessa) alterando le caratteristiche fisiche (ad esempio la lunghezza della corda) dell’elemento posto in vibrazione. (Tra l’altro, in molti strumenti, ad es. il pianoforte, l’altezza della nota emessa è già regolata dal tasto corrispondente…quindi lo strumentista sembra ancora più inutile!)
Non ce ne vogliano gli strumentisti veri!! In realtà siamo ben consci del fatto che quando uno strumentista genera un suono, egli può modificare, a parità di nota eseguita (cioè fissata la frequenza della armonica fondamentale), il modo e la rapidità con cui l’energia si distribuisce tra le varie armoniche (addirittura sopprimendone alcune). Una delle finalità della tecnica esecutiva (in una visione estremamente riduzionistica) consiste nell’acquisizione di un controllo completo del timbro del suono prodotto. Ogni strumento musicale pone, all’esecutore, problemi tecnici peculiari che derivano dalla diversa modalità con cui vengono condotte le quattro fasi di produzione del suono descritte in precedenza. Si pensi
- al “tocco” del pianista;
- all’attacco del suono di un trombettista che può essere rapido, producendo un “clic” caratteristico, o più diluito nel tempo;
- alla diverse modalità con cui un violinista utilizza l’archetto per produrre effetti timbrici caratteristici;
- alla diversità timbrica del suono di una chitarra a seconda venga suonata con il plettro o con le dita;
- alla diversità timbrica del suono prodotto dal piatto di una batteria a seconda che venga percosso nel centro o vicino al bordo;
- alle volontarie fluttuazioni di ampiezza e frequenza che il violinista introduce nel suono quando esegue, per rendere meno piatta e noiosa la fase di sustain, un tremolo o un vibrato;
- alla diversità timbrica del canto di petto (dei cantanti lirici) di gola (cantanti di musica leggera) e di naso o del falsetto.
Come il nostro sistema uditivo localizza la posizione di una sorgente sonora?
Il meccanismo fondamentale si basa sul fatto (un po’ come nella visione) di possedere due orecchie e non una sola. Tramite l’ascolto binaurale, cioè con entrambe le orecchie, il nostro sistema percettivo è in grado di confrontare le caratteristiche fisiche del suono che perviene alle due orecchie e di ricavare, da tale confronto, informazioni sulla posizione della sorgente che l’ha generato. Vediamo come.
Individuazione della direzione di provenienza del suono
Per chiarire la strategia che il nostro sistema percettivo utilizza per individuare la direzione di provenienza di un suono, immaginiamo di avere un altoparlante che genera un suono e un ascoltatore che ruota la testa in modo da avere il suo orecchio destro più vicino all’altoparlante di quello sinistro.
In tale situazione si verificano due effetti:
- essendo l’orecchio destro più vicino del sinistro esso raccoglierà, tramite i padiglioni auricolari, il suono in anticipo. La differenza dei tempi di arrivo del suono viene chiamata ITD (acronimo dell’inglese Interaural Time Difference). Una stima di tale grandezza si ottiene dividendo il maggior percorso che deve compiere il suono per arrivare all’orecchio più lontano (la “larghezza della testa”) per la velocità del suono in aria. Assumendo come larghezza della testa 0,25 m e come velocità del suono 340 m/s otteniamo come ITD:
cioè circa 0,7 millesimi di secondo. Tale tempo sembra straordinariamente breve tenuto conto anche del fatto che è il massimo ITD possibile (se le due orecchie e l’altoparlante non sono allineati l’ITD è ovviamente minore, visto che diminuisce la differenza dei percorsi). Tuttavia il nostro sistema percettivo è, in condizioni ottimali, capace di cogliere ITD dell’ordine 0,1 milionesimi di secondo e quindi è del tutto in grado di valutare i tempi di ritardo che si presentano nelle situazioni tipiche. Ruotando la testa si può fare in modo che l’ITD si annulli (o comunque scenda al di sotto del minimo valore rilevabile): in questo modo la retta che indica la direzione della sorgente giace in un piano perpendicolare al segmento che unisce le due orecchie e passante per il punto di medio di questo. Tale piano è, ovviamente, il luogo geometrico dei punti dello spazio equidistanti dai due padiglioni auricolari.
- L’orecchio più lontano si trova nella “zona d’ombra” creata dalla testa e riceve il suono con intensità minore. Tale differenza in intensità viene chiamata IID (acronimo dell’inglese Interaural Intensity Difference). Elaborando l’IID il sistema uditivo riceve ulteriori informazioni sulla direzione di provenienza del suono. Il più piccolo valore di IID che il nostro sistema uditivo può apprezzare è dell’ordine di 1 dB.
Le due “strategie” appena descritte presentano la loro massima efficacia in range diversi di frequenza:
- la prima strategia è molto efficace per onde di bassa frequenza (ed elevata lunghezza d’onda) per le quali l’ostacolo rappresentato dalla testa dell’ascoltatore è facilmente aggirabile (vedi a questo proposito la pagina relativa alla diffrazione del suono);
- la seconda strategia è molto efficace per onde di alta frequenza (e bassa lunghezza d’onda) per le quali l’ostacolo rappresentato dalla testa dell’ascoltatore è quasi insormontabile e determina un significativo decremento dell’energia sonora (intensità) che arriva all’orecchio più lontano dell’ascoltatore.
Un’ultima precisazione: i due effetti appena descritti sono efficaci se l’onda sonora che esce dall’altoparlante ha una direzione ben precisa (così che il suo percorso può essere rappresentato come un segmento di retta). Come spiegato nella pagina diffrazione del suono questa condizione è più difficilmente realizzabile per onde di basse frequenza; la sorgente di tali onde è quindi, in genere, meno facilmente individuabile.
Individuazione della distanza della sorgente
La misura dell’ ITD e dell’IID (a meno che la sorgente sonora non sia molto vicino alla testa) non permette di localizzare la distanza della sorgente ma solo la direzione di provenienza del suono. Il nostro sistema uditivo utilizza altri strategie per valutare la distanza della sorgente:
- in ambienti chiusi esso è in grado di valutare quanta dell’energia sonora catturata dai padiglioni auricolari arriva direttamente dalla sorgente e quanta da fenomeni di riflessione con le pareti: dalla proporzione di questi due contributi il sistema uditivo è in grado di stimare la distanza della sorgente;
- in ambienti aperti (se la sorgente è lontana) valutando, per esperienza, le modifiche del timbro del suono al variare della distanza (in questi casi l’esempio classico è quello del tuono che “suona” in un modo ben diverso a seconda della distanza da cui viene percepito).
Individuazione dell’elevazione della sorgente
Tra le informazioni che il nostro sistema uditivo utilizza per localizzare la sorgente vi è anche l’altezza (elevazione) della sorgente rispetto ai padiglioni auricolari. Esperimenti recenti hanno dimostrato che nel “catturare” tale informazione giocano un ruolo decisivo i padiglioni auricolari. Puoi provare a verificare tale ruolo:
- provando a tener, a forza, i padiglioni stesi lungo il cranio. Se incarichi qualcuno di generare un suono davanti a te (chiudi gli occhi) magari tintinnando con un mazzo di chiavi, troverai difficoltà ad individuare l’elevazione della sorgente;
- provando (ma l’esperimento è sconsigliabile anche se è stato effettuato) a riempire di plastilina tutte le pieghe de padiglioni auricolari fino a renderli una superficie piatta; ebbene, anche in questo caso, il sistema uditivo fatica ad individuare l’altezza della sorgente. Quest’ultimo esperimento, in particolare, dimostra che la particolare conformazione dei padiglioni auricolari gioca un ruolo decisivo nella determinazione dell’elevazione della sorgente: evidentemente i piccoli sfasamenti introdotti della riflessione del suono dalle molteplici pieghe presenti nel padiglione possono essere utilizzati a livello centrale, per ricavare informazioni di tipo direzionale.
—
Fonte: Tutto il materiale di questo articolo è tratto dal sito:
http://fisicaondemusica.unimore.it
Antonio De Lisa – Segni, Suoni, Scritture / Signs, Sounds, Writings
© 2000-18
Sede e Contatti – Location and Contacts: Antonio De Lisa
c/o LOST ORPHEUS MULTIMEDIA – Via del Popolo, 127/129
85100 POTENZA (ITALY) (0)39- 097137457 / Cell. 3333878854Site: www.adelisa.it
E-mail: lostorpheusmedia@gmail.com
Testi pubblicati per studio e ricerca – Uso non commerciale
Texts published for study and research-non-commercial useThis opera is licensed under a Creative Commons Attribuzione – Condividi allo stesso modo 3.0 Unported License.
Categorie:J10.10- Musiche di scena - Sound Scene, M01- Fisica Acustica - Physical Acoustics
Rispondi