Fenomeni coarticolator - LE VOCALI: ASPETTI QUALITATIVI E QUANTITATIVI 2.1 La qualità vocalica

LE VOCALI: ASPETTI QUALITATIVI E QUANTITATIVI 2.1 La qualità vocalica

2.1.3 Fenomeni coarticolator

La coarticolazione è una componente necessaria alla produzione della parola. In passato si pensava che la catena fonica fosse costituita dalla successione di elementi discreti, i quali si accostavano l‟uno all‟altro mantenendo intatte le proprie caratteristiche in una “perfetta corrispondenza biunivoca tra codice e segnale” (Calamai 2004a: 220). Se così fosse, però, parlare si rivelerebbe un‟attività estremamente laboriosa e la velocità di eloquio non potrebbe essere molto elevata perché gli articolatori dovrebbero compiere movimenti ampi e precisi per passare da un suono all‟altro; si avrebbe inoltre una percezione innaturale del parlato, il che comporterebbe difficoltà anche da parte del ricevente e non solo del locutore. Ciò che realmente si verifica è, al contrario, il susseguirsi di diversi suoni all‟interno di una catena fonica continua, prodotta dai movimenti simultanei e coordinati di tutti gli organi articolatori. Per questo motivo non si riscontra alcun isomorfismo tra la rappresentazione astratta in fonemi e la loro relizzazione fisica: quando gli organi si predispongono in una determinata configurazione articolatoria conservano ancora gli atteggiamenti delle articolazioni precedenti e si preparano ad affrontare quelle successive.

Le conseguenze di questo fenomeno sono chiaramente riscontrabili anche sul piano acustico. In uno studio sulla riduzione vocalica, Lindblom (1963) introdusse il concetto di target: una configurazione acustica ideale, indipendente dal contesto, a cui il pralante mira (come a un bersaglio, appunto) durante la produzione di una stringa vocalica. In pratica, durante il parlato è quasi impossibile raggiungere questi obiettivi, a causa del fatto che i gesti articolatori tipici di un determinato fonema non vengono mai riprodotti fedelmente, ma per lo più accennati in un movimento fluido e continuo. Questo conduce a due tipiche manifestazioni della coarticolazione: l‟undershoot, cioè il mancato raggiungimento della posizione prevista, e l‟overshoot, che equivale al superamento di tale posizione.

Nel suo modello, Lindblom (1963) attribuisce gli effetti di undershoot (tipicamente centralizzazione e assimilazione) a due variabili: il contesto e la durata. Quest‟ultima in particolare sembra rivestire un ruolo determinante, in quanto stabilisce l‟intervallo temporale a disposizione per il raggiungimento del bersaglio fonetico; minore è il tempo a disposizione per effettuare il movimento, meno ampio esso risulterà e maggiore sarà

l‟effetto assimilatorio al contesto adiacente. In realtà, nel corso di successivi studi, l‟autore ha rivalutato questa posizione, osservando che i parlanti sono in grado di calibrare i propri gesti articolatori indipendentemente dalla durata vocalica. Piuttosto, gli effetti coarticolatori andranno attribuiti alla capacità del parlante di adattarsi alla situazione comunicativa, dettata dalla collaborazione con l‟ascoltatore, il quale non necessita che il segnale linguistico contenga tutte le informazioni possibili, ma solo quelle non elicitabili dal contesto situazionale. Inoltre, il concetto di invarianza delle unità fonemiche fa in modo che esse funzionino da punto riferimento pur realizzandosi concretamente come “continue variabili nel concreto processo di produzione fonetica” (Marotta 2003: 5), permettendone il recupero sul piano percettivo. In sostanza, “speakers can adapt to different speaking situations and choose different production strategies to avoid reduction/coarticulation or to allow it to occur” (Farnetani 1997: 383): essi possono spostarsi lungo l‟asse diafasico da un estremo, in cui i valori target saranno disattesi e i fenomeni coarticolatori incideranno in misura maggiore (ipoarticolazione), all‟altro, in cui i foni saranno articolati in modo più dettagliato, fedele all‟ideale acustico (iperarticolazione).

La coarticolazione è quindi un fenomeno universale e imprescindibile nella produzione linguistica, che appartiene al livello della performance e si ripercuote sulla natura acustica dei fonemi. Indipendentemente da fattori di variazione diafasica o diastratica, comunque, esiste una “variabilità di tipo intersegmentale o contestuale (...) dovuta all‟interazione tra segmenti adiacenti e legata a fenomeni di coarticolazione, al tipo sillabico, al tipo accentuale” (Calamai 2004a: 227). Tale variabilità si manifesta quando uno stesso articolatore è coinvolto nella produzione di più foni adiacenti, oppure quando caratteristiche qualitative proprie di un determinato fono si estendono a segmenti adiacenti.

Il contesto consonantico, per esempio, esercita un‟influenza notevole sulla struttura acustica della vocale; infatti, come abbiamo già visto, questa dipende dalla conformazione assunta dal canale orale al momento dell‟enunciazione, perciò i movimenti necessari per passare da un suono consonantico a uno vocalico si ripercuotono inevitabilmente sulle formanti, alterandone i valori di frequenza. Le tracce acustiche di queste rapide variazioni prendono il nome di transizioni e, come vedremo più avanti in sede di analisi, esse sono ben visibili sullo spettrogramma sottoforma di spostamenti obliqui ascendenti o discendenti ai margini della struttura formantica. In particolare, la transizione della prima formante (F1) la quale, lo ricordiamo, è direttamente legata al grado di apertura vocalica, indica la presenza o meno di un‟occlusione, mostrando gli effetti legati alla chiusura temporanea del condotto vocale. La direzione della transizione di F2 è invece correlata al

luogo di articolazione della consonante. Pensiamo ad un contesto del tipo /Ca/: se la transizione è ascendente possiamo interpretare la consonante come velare, dal momento che in questo tipo di articolazione il dorso della lingua si trova in posizione piuttosto avanzata, il che contribuisce ad anteriorizzare la vocale seguente. Se, al contrario, la transizione è discendente, il luogo della costrizione sarà situato in area labiale e la vocale risulterà leggermente posteriorizzata rispetto alla realizzazione canonica.

Per quanto riguarda il ruolo dell‟accento, è noto che le vocali toniche mostrano in misura minore gli effetti della coarticolazione rispetto alle loro controparti atone, le quali, spesso anche in relazione anche a fattori di tipo diafasico o diastratico, subiscono effetti di riduzione o centralizzazione; inoltre, anche la posizione della vocale all‟interno della parola influisce sulle sue frequenze formantiche. Vayra e Flower (1993) hanno condotto una serie di esperimenti che mostrano una “progressive centralization of stressed /i/, /a/ and /u/ left-to-right in trisyllabic utterances” (Id.: 403) che sembra seguire un andamento a „V‟: la prima formante mostra un valore massimo in posizione iniziale, indipendentemente dalla tonicità o meno della vocale, e una diminuzione in sillaba mediana. Gli autori interpretano questo fenomeno come legato al progressivo fisiologico indebolimento dei gesti articolatori sopralaringali, dal quale dipende il classico effetto di declinazione della frequenza fondamentale (F0), il cui dominio si estenderebbe all‟intero livello frasale più che a quello, meno ampio, della parola.

Come vedremo nel prossimo capitolo, i fenomeni coarticolatori che caratterizzano la produzione del parlato appaiono subito evidenti ad un‟analisi acustica. Soprattutto in fase di segmentazione del segnale l‟analista incontrerà difficoltà dovute alla problematica individuazione dei confini tra foni, che sembrano sfumare l‟uno dentro l‟altro più che presentare un limite netto: in questo modo viene a mancare una “relazione [di tipo] „uno a uno‟ tra il segnale acustico e i segmenti che risultano dall‟analisi linguistica” (Calamai 2004a: 221).

Uno studio come il nostro, che si pone come obiettivo la descrizione di alcuni tipi vocalici, deve necessariamente fare i conti con questa situazione, in particolare quando si tratta di misurare la durata e i valori formantici propri di un determinato segmento. La transizione presente nel passaggio da consonante a vocale e viceversa, infatti, può incidere in misura variabile sulla struttura della vocale e deve essere esclusa dal fonetista durante le analisi; tale compito, però, non è sempre di facile esecuzione dal momento che l‟individuazione di una porzione stabile della vocale, il cosiddetto steady-state, dipende in larga misura dalla durata del segmento (connessa a sua volta alla velocità di eloquio) e varia per F1 e F2. I risultati di uno studio condotto da Blomgren e Robb (1998) mostrano

infatti che “the longer the overall vowel duration, the longer the vowel steady-state (VSS) duration” (Id.: 413) e si riscontra inoltre una maggiore durata della parte stabile della prima formante rispetto a F2, attribuibile, secondo il parere dei due autori, alla posizione della lingua: “the long F1 VVS could be interpreted to reflect a relatively quick an stable onset of tongue height position which is maintained throughout most of the vowel production. Alternatively, the short VSS duration found for F2 could represent a late onset and early offset of stable front-back positioning of the tongue” (Id. Ibid.).

Nel documento Grado di apertura e arretramento delle vocali medio-basse a Santa Croce sull'Arno. Un'analisi empirica acustica. (pagine 30-33)