• Non ci sono risultati.

Risultati dell‟analisi acustica

Dopo aver segmentato e annotato le registrazioni, così come indicato nel paragrafo 5.6.1, abbiamo effettuato le seguenti misurazioni, adottando come unità di misura i millisecondi:

la durata della vocale tonica V;

la durata della consonante target C;

la durata della seconda consonante nei nessi tautosillabici e eterosillabici C2;

la durata dell‟intero intervallo consonantico che segue la vocale tonica C1C2;

la durata dell‟intervallo V-to-V , dall‟inizio della vocale tonica all‟inizio della

vocale successiva (esclusa).

Al fine di osservare le variazioni di durata in relazione al diverso contesto fonologico, questi valori sono stati poi suddivisi in base al contesto (scempie, geminate, nessi tautosillabici, nessi eterosillabici) e per ognuno ne sono stati tratti il valore medio e la deviazione standard. Questa operazione è stata compiuta su ogni parlante preso singolarmente e per tutti e cinque gli informatori globalmente. Relativamente al campione preso nel suo complesso, ne sono stati estratti i valori medi prima includendo tutte le occorrenze e poi considerando separatamente le occorrenze contenenti /t/ e quelle contenenti /d/, con lo scopo di verificare le

62 eventuali oscillazioni di durata dovute alla sonorità della consonante, come indicato in letteratura33.

Consideriamo innanzitutto i valori assoluti della vocale, i quali potrebbero fornire delle prime preziose indicazioni per valutare eventuali differenze nella velocità d‟eloquio tra i vari informatori esaminati.

Dal confronto tra le durate rileviamo che i valori della vocale sono abbastanza omogenei tra i soggetti e si situano tendenzialmente al di sopra dei 100 ms. I valori più alti si registrano nel parlante 3, le cui esecuzioni superano anche i 200 ms (valore medio della vocale tonica in contesto CV.CV = 200,7 ms), seguito dal parlante 5 (in media 189,2 ms in contesto CV.CV). Questo dato lascia supporre che il parlante 3 sia più lento, vale a dire che abbia una velocità d‟eloquio leggermente superiore agli altri, subito seguito dal parlante 5.

Ricordiamo, tuttavia, che analizzando le variazioni di durata nel singolo parlante il numero delle osservazioni cala drasticamente: se l‟intero corpus conta 252 tokens, il numero di occorrenze per ogni parlante scende a 48, di cui solo 12 per ogni contesto esaminato (il numero è leggermente maggiore per il parlante 4, cha ha effettuato quattro ripetizioni al posto di tre).

È da notare che questi valori si riferiscono a un parlato di laboratorio, iperarticolato, e a parole pronunciate in isolamento: in tale situazione le misure temporali tendono a dilatarsi rispetto al parlato naturale34.

Se confrontiamo i nostri valori con quelli indicati in letteratura (ovviamente soltanto quelli relativi a parole isolate), essi si situano ad un livello intermedio tra i due estremi rappresentati dai valori dilatati di Josselyn (1900) e quelli più contenuti di Bertinetto (1981).

Analizziamo ora i valori durazionali della vocale tonica in relazione alla struttura sillabica, riportati in Tabella 8. In sillaba aperta, ovvero quando la vocale accentata è seguita da consonante scempia o nesso tautosillabico, la durata della vocale misura mediamente 160 ms per i parlanti più veloci, intorno ai 190 ms per i parlanti più lenti. In sillaba chiusa, invece, cioè in contesto consonantico postvocalico costituito da consonante geminata o nesso eterosillabico, i valori di durata si abbassano in

33 Vedi note 4 e 5.

34 Per un tentativo di integrazione delle variazioni della velocità d‟eloquio negli studi sulla durata vocalica cfr. Landi & Savy (1996).

63 proporzione variabile in base al parlante considerato. In tutti i soggetti, dunque, si registrano differenze di durata tra la vocale in sillaba aperta e in sillaba chiusa.

Tabella 8 Valori medi di durata della vocale tonica in sillaba aperta e chiusa, suddivisi per parlante e globalmente. Nell'ultima riga è riportato il grado di allungamento della vocale.

La vocale in sillaba tonica, così come previsto, è più lunga in sillaba aperta. La percentuale di allungamento è in media del 20%, un risultato che si allinea a quello di Vogel (1982), ma appare contenuto rispetto ai primi studi sull‟argomento, ma anche ai dati di Bertinetto (1981) (allungamento del 34% in parole isolate). È interessante notare che sussistono differenze significative tra i parlanti: si passa da un grado di allungamento consistente dei parlanti 1 e 2, del 32,3% e 26,9% rispettivamente, ad un allungamento davvero modesto dei parlanti 3 e 4, del 13% e 12,6%. Ciononostante, in termini assoluti gli scarti di durata rientrano tutti nel campo di percezione dei parlanti35, superando i 20 ms anche nel caso di allungamenti ridotti. I valori più bassi si riscontrano indistintamente nel parlante più lento, il 3, e nel parlante 4, mediamente più veloce. In caso di differenze tra soggetti, ci saremmo aspettati che la percentuale di allungamento minore avvenisse nel parlato più lento, ancora più scandito e marcato, nel comune contesto di parlato iperarticolato. Sembra invece che, a parità di condizioni, il grado di allungamento non dipenda dalla velocità di eloquio, ma dalle preferenze del parlante.

Potrebbe essere utile esaminare anche i rapporti reciproci tra vocale e consonante, normalizzando i dati secondo la formula di Parmenter & Carman (1932), che rapporta i suoni alla durata della consonante singola e permette di trascurare variazioni nella velocità d‟eloquio. Ricordiamo che la stessa operazione era stata eseguita anche da Bertinetto (1981), con le opportune cautele36.

Di seguito è riportata la formula relativa ai quattro contesti esaminati sulla base dei risultati comprensivi di tutti i parlanti:

35 Cfr. Lehiste (1970: 10-17). 36 Vedi § 1.2.1. 1 2 3 4 5 Media Sillaba aperta 158,1 160,5 197,4 160 187,6 171,9 Sillaba chiusa 107,1 117,4 171,7 139,8 155,3 137,5 Percentuale di allungamento 32,3% 26,9% 13% 12,6% 17,2% 20%

64 V: + C 1,8 + 1 V: + .C1(C2) 1,7 + 0,9

V + C: 1,5 + 2,1 V + C1.(C2) 1,4 + 1,3

La normalizzazione mette in evidenza i rapporti reciproci tra i foni, rendendo immediatamente manifesta la variazione della durata nei vari contesti sia della vocale che della consonante.

Dalla formula si possono trarre chiaramente le seguenti conclusioni:

a) La durata della consonante geminata è doppia rispetto alla consonante scempia; b) La vocale tonica si comporta in modo coerente nei contesti tradizionalmente

associati alla stessa struttura sillabica;

c) La vocale tonica è più lunga in sillaba aperta e subisce una riduzione in sillaba chiusa, sia in presenza di una geminata che di nesso eterosillabico.

Allo stesso tempo, però, uno studio che segua solo questo criterio di lavoro rischia di perdere una parte importante della variazione, in special modo se si intende fare una ricerca “a grana più fine” come la nostra. Come già sottolineato da Bertinetto (1981), è importante valutare in aggiunta i dati assoluti relativi ai parlanti.

Osserviamo i valori medi di durata estratti dal nostro corpus e restituiti in Tabella 9. A differenza della Tabella 8, dove li avevamo suddivisi per tipo sillabico, i valori di durata (di vocale tonica, consonante target, intervallo consonantico e V-to-V) qui riportati sono distinti per contesto, oltre che per struttura sillabica. In questo modo si vuole innanzitutto esaminare il comportamento della vocale tonica nei vari contesti, al fine di verificare se anche nei nostri dati si riscontrano i fenomeni transillabici discussi al cap. IV.

Se la durata vocalica non fosse influenzata da null‟altro se non dal peso della rima sillabica, allora la distribuzione dei valori di durata all‟interno dello stesso tipo sillabico dovrebbe essere uniforme. Se, invece, come appena suggerito in Farnetani & Kori (1986) e ipotizzato da Celata & Mairano (2014), la durata della vocale fosse in un certo modo condizionata da fattori transillabici, come l‟intervallo consonantico seguente, allora dovremmo riscontrare delle differenze di durata che vanno al di là del tipo sillabico di appartenenza.

Secondo questa logica, sostegno alla teoria “compensativa” di Celata &Mairano verrebbe da una distribuzione della durata vocalica del tipo: Bata > patron > batta, in cui all‟aumentare dell‟intervallo consonantico diminuisce il valore della vocale

65 tonica precedente. Questa distribuzione si oppone alla classificazione categorica classica del tipo Bata = patron > batta, in cui i contesti contrastano in modo categorico sulla base della struttura della sillaba.

La durata della vocale nel nesso tautosillabico costituisce quindi una spia del comportamento della vocale: secondo la proposta alternativa, la sua lunghezza dovrebbe essere intermedia tra la lunghezza della vocale in contesto di scempie e quella in contesto di geminate, dal momento che il nesso tautosillabico si pone in durata tra la scempia e la geminata.

Nei nostri dati riscontriamo una leggera variazione della vocale nei nessi tautosilabici: una contenuta riduzione è presente in tutti i parlanti e assomma in media a 7,5 ms. Solo nel parlante 4 lo scarto supera i 10 ms (12,6 ms). Si tratta di uno scarto assai ridotto, che comparato alla lunghezza vocalica negli altri due contesti non allontana affatto la vocale dei nessi tautosillabici dal contesto scempio. Una distribuzione sillaba aperta ~ sillaba chiusa sembra dai nostri dati ampiamente confermata.

Tabella 9 Durata media della vocale tonica, della consonante target, dell'intero intervallo consonantico e dell'intervallo V-to-V. Tra parentesi sono indicati i valori di deviazione standard.

Durata media V (σ) Durata media C target (σ) Durata media C1C2 (σ) Durata media V-to-V (σ) Sillaba aperta V.CV 175,6 (23,3) 97,4 (25,5) 97,4 (25,5) 273,0 (37,9) V.C1C2V 168,1 (21,8) 90,3 (17,7) 159,4 (20,6) 327,6 (37,5) Sillaba chiusa VC:V 142,2 (29,9) 200,6 (33,7) 200,6 (33,7) 342,7 (48,8) VC1.C2V 132,8 (23,4) 126,9 (26,1) 213,1 (26,8) 345,9 (42,0) Del resto, anche il grafico della distribuzione della lunghezza vocalica nel nostro corpus (v. Figura 11) mostra un raggruppamento dei valori di durata per tipo sillabico, dal momento che i valori del contesto scempio e del nesso tautosillabico da una parte e del contesto geminato e del nesso eterosillabico dall‟altra, sono sfasati.

La differenza tra contesti appartenenti allo stesso tipo sillabico è minima, soprattutto se confrontata con il grosso salto di lunghezza dell‟intervallo consonantico dalle scempie ai nessi tautosillabici (v. Figura 12). Lo scarto in quest‟ultimo caso è di ben 62 ms. Come si vede dal raffronto dei grafici in Figura 11 e Figura 12, la distribuzione della durata tra vocali e intervallo consonantico è

66 speculare. Tuttavia, i valori durazionali della vocale sono per lo più sovrapposti, mentre quelli dell‟intervallo consonantico sono più compatti attorno alla media e maggiormente distanziati l‟uno dall‟altro. Un altro punto da notare è la posizione del contesto scempio rispetto a quello geminato, che ancora una volta conferma il diverso status fonologico delle consonanti rispetto alle vocali: per quanto riguarda le consonanti, la sovrapposizione tra i valori di durata è essenzialmente nulla, al contrario delle vocali, dove risulta molto ampia.

Figura 11 Durata della vocale tonica nei diversi contesti: in ascissa il contesto fonologico e in ordinata la durata in ms.

Figura 12 Durata dell'intervallo consonantico nei diversi contesti: in ascissa il contesto fonologico e in ordinata la durata in ms.

67 Per verificare in maniera più rigorosa se e quanto la durata della vocale tonica è correlata alla durata dell‟intervallo consonantico seguente, indipendentemente dalla struttura sillabica, sul modello di Celata & Mairano (2014), abbiamo calcolato il coefficiente di correlazione r di Bravais-Pearson37 tra la durata vocalica e quella consonantica, appunto, sull‟intero corpus. Se le due variabili fossero indipendenti, il coefficiente di correlazione dovrebbe essere uguale o prossimo a 0; valori vicini a -1 o 1, invece, indicherebbero l‟esistenza di una correlazione tra durata dell‟intervallo consonantico e durata della vocale tonica.

In genere il coefficiente di correlazione r si applica a variabili distribuite normalmente. Tramite controllo visivo del grafico della densità e l‟esecuzione di un test statistico, il test di Shapiro-Wilks38, abbiamo verificato che la durata delle vocali toniche ha una distribuzione normale (p-value = 0.07785); la durata dell‟intervallo consonantico, al contrario, risulta non seguire una distribuzione gaussiana (p-value = 0.0006458). Ciononostante, il numero di tokens nel nostro campione (N=252) è sufficientemente alto tanto che un leggero scostamento dalla distribuzione ideale non va a inficiare i risultati. Per questo motivo si è deciso di ricorrere ugualmente al coefficiente di correlazione di Pearson. Date, quindi, le due variabili dette sopra (durata dell‟intervallo consonantico e durata della vocale tonica), abbiamo calcolato il grado di correlazione fra di esse. Il risultato è una correlazione moderata di tipo negativo (r= −0,34): sembra dunque esistere per queste due variabili una tendenza a covariare, in particolare la durata vocalica diminuisce al crescere della durata

37 In statistica, il coefficiente di correlazione r di Bravais-Pearson tra due variabili statistiche è definito come il rapporto tra la covarianza e il prodotto delle loro deviazioni standard.

Il coefficiente può assumere valori compresi tra 1 e -1. A seconda del valore, si riconosce il tipo di correlazione individuata secondo la seguente classificazione:

Coefficiente Intensità Tipo di Correlazione

0.7 < r ≤ 1 Estremamente alta Positiva 0.5 < r ≤ 0.7 Alta 0.2 < r ≤ 0.5 Intermedia (tendenza) 0 < r ≤ 0.2 Bassa (trascurabile) r ≈ 0 Assente Assente 0 > r ≥ -0.2 Bassa (trascurabile) Negativa -0.2 > r ≥ -0.5 Intermedia (tendenza) -0.5 > r ≥ -0.7 Alta -0.7 > r ≥ -1 Estremamente alta

38 Il test di Shapiro-Wilks è un test di non normalità: se il p-value è al di sotto della soglia fissata, la distribuzione della variabile in esame è non normale.

68 dell‟intervallo consonantico. Questo risultato concorda, del resto, con quello di Celata & Mairano (2014), che avevano trovato valori simili per i loro corpora (tra i - 0,18 ai -0,46 per il primo corpus)39.

Per verificare se questo risultato è statisticamente significativo o se è invece attribuibile al caso, abbiamo effettuato un altro test statistico sul coefficiente di correlazione, un test t di Student con n-2 gradi di libertà. Abbiamo appurato, dunque, che il coefficiente di correlazione trovato in precedenza è statisticamente significativo (p-value < 0,05) e quindi il nostro risultato può essere generalizzato.

Assumendo poi la durata dell‟intervallo consonantico come variabile indipendente e la durata vocalica come variabile dipendente, abbiamo voluto studiare quanto i valori assunti dalla variabile dipendente siano determinati da quelli della variabile indipendente. Se la correlazione tra le nostre variabili fosse abbastanza alta, potremmo prevedere i valori della durata vocalica a partire da quelli della durata consonantica. Abbiamo dunque rappresentato i nostri dati tramite un grafico a dispersione (o scatterplot) e abbiamo trovato la retta di regressione, ovvero l‟equazione della retta che meglio rappresenta i nostri dati. Nel grafico in Figura 13 si vede che i valori di durata seguono tendenzialmente l‟andamento previsto dalla retta di regressione, sebbene non siano compatti attorno ad essa; dall‟analisi dei residui della linea di regressione emerge, infatti, che la varianza residua, ovvero la percentuale dei valori non predetti dal modello, è molto alta (varianza residua = 0.88; in altre parole soltanto lo 0,11 su 1 della varianza è “spiegata” dal modello).

39 Vedi cap. IV.

69

Figura 13 Grafico di dispersione dei valori di durata dell‟intervallo consonantico e della vocale tonica e retta di regressione. I valori sono espressi in millisecondi.

La correlazione tra la durata della vocale tonica e la durata dell‟intervallo consonantico sembra dunque sussistere, nella tiepida forma di una tendenza, presente in italiano, ma comunque non incisiva al punto da poter spiegare da sola la variazione della lunghezza vocalica nella nostra lingua.

In quanto all‟intervallo V-to-V, possiamo controllare se esso si mantenga stabile nei diversi contesti, così come suggerito in Farnetani & Kori (1986). Ricordiamo che Farnetani & Kori proponevano quest‟intervallo come unità-chiave nella scansione e percezione del ritmo in italiano, denominandolo sillaba metrica e preferendolo alla sillaba fonologica usata dalla teoria tradizionale. Anche Mairano (2011) aveva proposto l‟intervallo V-to-V come indice ritmico più affidabile per l‟italiano, dal momento che era risultato il meno variabile in un campione di lingue (vedi in proposito cap. IV).

Facendo nuovamente riferimento alla Tabella 9, consideriamo allora i valori dell‟intervallo comprendente la vocale tonica e le consonanti seguenti. Com‟è facile notare, la combinazione V+C (vocale + consonante scempia; per esempio body) è la più breve; la differenza con gli altri contesti è considerevole, ben 60 ms circa. Nonostante la vocale in questo contesto sia più lunga, evidentemente non riesce a bilanciare la mancanza di un segmento, presente invece negli altri casi (in forma

70 reduplicata in contesto geminato, e.g. bodda; completamente diverso nei nessi, e.g.

Bodrum e podcast). D‟altronde, l‟allungamento della vocale tonica copre soltanto il

20% circa della durata totale dell‟intervallo, mentre la consonante geminata si allunga del 50% circa. E, in ogni caso, la vocale breve è mediamente più lunga della consonante scempia, cosicché viene a costituire un surplus di durata negli altri contesti. Pertanto, i rapporti complessivi non si equivalgono. Infatti, i contesti con consonante geminata e nessi sono mediamente più lunghi del contesto scempio, come dicevamo. L‟intervallo in contesto geminato e nei nessi eterosillabici è molto simile (342,7 ms e 345,9 ms rispettivamente). Leggermente inferiore, invece, il contesto VC1.C2V, ma comunque vicino a questi ultimi. La spiegazione potrebbe

essere legata in questo caso alla durata intrinseca del secondo elemento dei nessi tautosillabici, che, per questioni fonotattiche, è sempre /r/. Questo segmento, com‟è noto, è per natura molto breve.

Passiamo ora ad analizzare i valori di durata delle consonanti nel nostro corpus. In primo luogo, confronteremo la durata delle consonanti in relazione alla posizione assunta nella sillaba e, successivamente, compareremo le variazioni di durata in base alla sonorità della consonante.

Farnetani & Kori (1986: 23) riportano che la durata delle consonanti in italiano varia a seconda della posizione all‟interno della sillaba: le consonanti in posizione inziale sono più brevi rispetto alle consonanti in posizione finale di sillaba. Per gli autori questo risultato suggerirebbe che “the final boundary is marked by longer segmental durations”, in altre parole una durata delle consonanti in coda maggiore si spiegherebbe con la necessità di marcare il confine sillabico.

Abbiamo pensato, dunque, di verificare questa affermazione nei nostri dati, confrontando la durata media delle consonanti nelle seguenti posizioni:

a) in posizione intervocalica, quindi in attacco di sillaba (es. Bata);

b) come primo elemento di un nesso tautosillabico, cioè ancora in attacco (es.

pàtron);

c) come primo elemento di un nesso consonantico, ovvero in funzione di coda (es. batman).

Il raffronto dei tre contesti (vedi Tabella 10) indica che effettivamente le consonanti in coda sono mediamente più lunghe (126,9 ms) delle consonanti in attacco, sia singole (97,4 ms) che in nessi tautosillabici (90,3 ms).

71

Tabella 10 Durata media delle consonanti in posizione di attacco e di coda.

Attacco (CV.CV) Attacco (CV.C1C2V) Coda (CVC1.C2V) /t/+/d/ 97,4 90,3 126,9 /t/ 110,2 97,2 145,1 /d/ 84,7 83,4 106,3

La maggiore durata della consonante target in posizione di coda emerge chiaramente in Figura 14, dalla quale appare chiaramente che i valori del contesto 4 si collocano più in alto rispetto ai contesti 1 e 2.

Figura 14 Durata della consonante target in funzione del contesto: in ascissa il contesto di riferimento e in ordinata la durata in ms.

Ovviamente, il fatto di avere nel corpus gli stessi fonemi elimina un possibile fattore di disturbo legato alla durata intrinseca dei foni. In questo caso, la durata dei segmenti varia solo per la posizione all‟interno della sillaba e per il contesto fonotattico. Lo stesso modello è valido per le due occlusive prese separatamente: anche in questo caso le occlusive in coda risultano più lunghe di quelle in attacco (v. Tabella 10, seconda e terza riga).

L‟unico appunto è dato da un‟osservazione scaturita nel processo di annotazione del segnale acustico: spesso le consonanti occlusive nei nessi eterosillabici erano seguite da un breve momento di silenzio, prima dell‟inizio della consonante successiva (per esempio, in batman, l‟intervallo di assenza di segnale si situava tra la /t/ e la /m/); questo breve intervallo è stato incluso nell‟estensione temporale

72 dell‟occlusiva e potrebbe quindi influenzare per eccesso i valori delle consonanti in coda in contesto eterosillabico.

Occorre ora fare un ulteriore zoom sui nostri dati, distinguendo le nostre occorrenze per tipo di consonante target, ovvero per /t/ e per /d/.

Esaminiamo prima di tutto la durata delle consonanti, così da verificare se vi siano effettivamente in italiano le stesse differenze temporali legate alla sonorità già osservate in letteratura, soprattutto per altre lingue. In particolare, è stato osservato che la durata della consonante sorda è maggiore della sonora e anche la durata della vocale tonica varia in relazione alla sonorità della consonante seguente: la vocale seguita da occlusiva sorda è mediamente più breve rispetto a quando la stessa è seguita da consonante sonora.

I valori estratti dal nostro corpus sono riportati in Tabella 11. Prendiamo in considerazione la colonna relativa alla durata della consonate target. In tutti i contesti, la durata dell‟occlusiva sorda /t/ è maggiore della corrispondente sonora /d/ e lo scarto è quasi ovunque molto consistente, intorno ai 30 ms per le scempie e quasi 50 ms per la geminata (soltanto nei nessi tautosillabici lo scarto è ridotto, 13,8 ms). Parallelamente, la durata della vocale precedente varia in base alla sonorità, accorciandosi in presenza di consonante sorda (che è più lunga) e allungandosi in presenza di sonora (consonante più breve). In questo caso però la differenza è meno marcata: gli scarti si situano sui 20 ms in contesto scempio e geminato, sono inferiori ai 10 ms nei nessi.

Tabella 11 Valori di durata di vocale tonica, consonante target, intervallo consonantico e intervallo V-to-V suddivisi per contesto, per /t/ e per /d/.

C target Contesto V σ C target σ C1+C2 σ V-to-V σ

/t/ V.CV 165,9 20,9 110,2 27,0 110,2 27,0 276,1 42,5 V.C1C2V 164,7 21,2 97,2 17,4 164,7 21,3 329,4 39,5 VC:V 133,1 31,6 224,0 28,5 224,0 28,5 357,1 53,3 VC1.C2V 135,3 23,0 145,1 18,4 215,5 27,1 350,8 44,1 /d/ V.CV 185,2 21,9 84,7 16,2 84,7 16,2 269,9 32,9 V.C1C2V 171,6 22,2 83,4 15,4 154,1 18,7 325,7 35,9 VC:V 151,2 25,6 177,1 19,1 177,1 19,1 328,3 39,6 VC1.C2V 129,9 24,0 106,3 16,2 210,4 26,7 340,3 39,5

73

Documenti correlati