• Non ci sono risultati.

Sara vs. Sahara: uno studio sperimentale di fonetica articolatoria sulle vocali singole vs. ripetute nella lingua italiana, condotto mediante sonda ecografica

N/A
N/A
Protected

Academic year: 2021

Condividi "Sara vs. Sahara: uno studio sperimentale di fonetica articolatoria sulle vocali singole vs. ripetute nella lingua italiana, condotto mediante sonda ecografica"

Copied!
78
0
0

Testo completo

(1)

INTRODUZIONE

Questo lavoro di tesi si inserisce all'interno dei progetti in corso presso il laboratorio SMART (gruppo ELiTe) della Scuola Normale Superiore. Esso si propone di indagare uno degli aspetti meno studiati e meno chiari della fonetica della lingua italiana, vale a dire il tema degli iati costituiti da vocali aventi lo stesso timbro. A quanto ci risulta questo sembra essere il primo contributo che si propone di analizzare queste sequenze vocaliche particolari in chiave acustica ed articolatoria, dunque si tratta di uno studio pilota.

Anche nello stesso inventario fonetico ci possono essere differenze non banali tra i parlanti. Generalmente, ogni parlante è coerente con le proprie strategie articolatorie, ma non si può dire lo stesso per quei lessemi che contengono due vocali ripetute con lo stesso timbro, come nel caso di

Sahara o di coorte: infatti, sono parole poco frequenti e i parlanti possono non adottare una

strategia uniforme.

La scarsa frequenza di questo tipo di sequenza bivocalica è facilmente riscontrabile dovendo pensare a lessemi della lingua italiana che presentano due vocali ripetute per ogni vocale dell'inventario fonetico della nostra lingua: se può risultare facile trovare, ad esempio, degli iati formati da due vocali alte anteriori (cioè [ii]) nella prima persona singolare del passato remoto (sentii, aprii, inferii, ecc...), e qualche esempio di [ee] e [oo], altrettanto non si può dire per gli iati [aa] e [uu], la cui attestazione è decisamente più ridotta.

L'obiettivo che ci eravamo posti inizialmente era quello di "esplorare" i fenomeni che si verificano quando questi due tipi di vocali si ripetono l'una dopo l'altra. Riteniamo che in un parlato spontaneo, ad una velocità di eloquio sostenuta, possa scomparire la differenza fra parole del tipo Sara e Sahara, ma che invece nel parlato di laboratorio una differenza uditiva ci sia. Lo scopo di questo lavoro è quello di chiarire un punto fondamentale: esiste anche un qualche gesto articolatorio che accompagna questa differenza? Per rispondere a questa domanda, sono state pensate tre analisi: due di tipo qualitativo ed una di tipo quantitativo.

Il materiale a cui abbiamo fatto riferimento, e su cui sono state svolte le analisi, è un corpus formato da una quantità sufficiente di parole contenenti uno iato composto da due vocali adiacenti aventi lo stesso timbro. Tale corpus è stato pensato considerando la posizione dell'accento relativamente alla sequenza bivocalica, distinguendo così tre tipi di iato, ma considerando anche una lista complementare formata da parole foneticamente simili a quelle della prima lista, ma contenenti una sola vocale anziché due, vale a dire senza iato (ad esempio

(2)

sara per sahara, corte per coorte, re per ree, e così via). Tale lista complementare permette di

mettere in relazione parole contenenti due vocali adiacenti con parole foneticamente affini (ma che hanno con una sola vocale), permette di ridurre al minimo la differenza fra i contesti vocalici, e permette inoltre di fissare un modello di riferimento con il quale comparare i risultati ottenuti dall'analisi acustica e articolatoria degli iati. Le indagini qualitative si basano sul contesto di parola isolata, mentre l'indagine quantitativa non si limita a ciò e considera anche il contesto di frase: infatti, a questo scopo, sono state pensate delle frasi contenenti la maggior parte delle parole del corpus (sia iati che non).

La lista di stimoli, parole e frasi, è stata sottoposta a 6 soggetti di diversa provenienza regionale, ma tutti nati e cresciuti in nord Italia. Non sono stati scelti parlanti dell'Italia centrale perchè distinguono i timbri vocalici nei casi in cui sono coinvolte vocali medie, come in ree. Così se ad esempio un parlante pisano realizzerà ['rɛ:e] e [niɱ'fɛ:e] per le parole ree e ninfee, un parlante milanese realizzerà invece ['re:e] e [niɱ'fe:e] mantenendo lo stesso timbro vocalico nello iato.

L'intera seduta di registrazione dei dati è avvenuta all'interno di una cabina insonorizzata nel laboratorio SMART (gruppo ELiTe) della Scuola Normale Superiore. La fase operativa è stata condotta ricorrendo principalmente ai software PRAAT e Articulate Assistant Advance.

La prima analisi qualitativa è stata pensata per indagare la diversa evoluzione temporale dei gesti vocalici delle vocali singole e ripetute dal momento iniziale al momento finale, e per descriverne le differenze in termini articolatori. Il secondo tipo di analisi qualitativa, invece, è stato ideato allo scopo di individuare le divergenze nella dinamica generale comparata del gesto dei due tipi vocalici, e per descriverle ancora una volta in termini articolatori. Infine, il terzo tipo di indagine consiste in un'analisi quantitativa delle durate delle vocali singole e ripetute, e ha l'obiettivo di verificare se esiste anche un qualche indice acustico di differenzione.

Questo contributo non ha la pretesa di fornire una descrizione esaustiva delle dinamiche articolatorie dei due tipi vocalici, ma ha la modesta ambizione di svolgere una prima indagine in un terreno ancora poco indagato. Inoltre, il nostro obiettivo non era certo quello di analizzare esaustivamente tutti i materiali raccolti, date le ovvie limitazioni temporali di una Tesi di Laurea Magistrale. È stata pertanto portata a termine una selezione dei casi più interessanti, rimandando a studi futuri un'analisi completa di tutto il materiale.

(3)

INDICE

Introduzione

1. Incontri vocalici nella lingua italiana: iati e dittonghi

1.1 Principali caratteristiche degli incontri vocalici 1.2 Dittonghi

1.3 Iati

1.4 Discriminazione fra dittonghi e iati 1.5 Sequenze bivocaliche e marcatezza 1.6 Sequenze bivocaliche a confine di parola 1.7 Sequenze bivocaliche con lo stesso timbro

2. L'esperimento: materiali e metodologia

2.1 Materiali utilizzati

2.2 Soggetti e fase di registrazione

2.3 Fase operativa: segmentazione acustica con PRAAT 2.4 Fase operativa: analisi articolatoria con AAA

3. Risultati dell'esperimento percettivo

3.1 Prima analisi qualitativa: evoluzione temporale comparata dei gesti articolatori 3.1.1 Tendenze articolatorie generali

3.1.2 Tendenze articolatorie nei diversi tipi vocalici 3.1.2.1 Tipo [a] vs [a:]

3.1.2.2 Tipo [e] vs [e:] 3.1.2.3 Tipo [o] vs [o:] 3.1.2.4 Tipo [i] vs [i:] 3.1.2.5 Tipo [u] vs [u:]

3.2 Seconda analisi qualitativa: evoluzione dinamica comparata dei gesti articolatori 3.2.1 Soggetto 2

3.2.2 Soggetto 3 3.2.3 Soggetto 4 3.2.4 Soggetto 6

(4)

3.3 Analisi quantitativa delle durate e dei rapporti 3.3.1 Durate vocaliche del soggetto 2

3.3.1.1 Durate generali

3.3.1.2 Durate a velocità d'eloquio normale 3.3.1.3 Durate a velocità d'eloquio lenta 3.3.1.4 Durate in contesto di frase 3.3.2 Durate vocaliche del soggetto 3 3.3.2.1 Durate generali

3.3.2.2 Durate a velocità d'eloquio normale 3.3.2.3 Durate a velocità d'eloquio lenta 3.3.2.4 Durate in contesto di frase 3.3.3 Durate vocaliche del soggetto 4 3.3.3.1 Durate generali

3.3.3.2 Durate a velocità d'eloquio normale 3.3.3.3 Durate a velocità d'eloquio lenta 3.3.3.4 Durate in contesto di frase 3.3.4 Durate vocaliche del soggetto 5 3.3.4.1 Durate generali

3.3.4.2 Durate a velocità d'eloquio normale 3.3.4.3 Durate a velocità d'eloquio lenta 3.3.4.4 Durate in contesto di frase 3.3.5 Durate vocaliche del soggetto 6 3.3.5.1 Durate generali

3.3.5.2 Durate a velocità d'eloquio normale 3.3.5.3 Durate a velocità d'eloquio lenta 3.3.5.4 Durate in contesto di frase 3.3.6 Durate vocaliche generali

3.3.7 Analisi comparata delle durate

4. Conclusioni

4.1 Risultati della prima analisi qualitativa 4.2 Risultati della seconda analisi qualitativa 4.3 Risultati dell'analisi quantitativa

(5)

4.4 Possibili indici di differenziazione tra vocali singole e ripetute 4.5 Alcune osservazioni critiche

4.6 Suggerimenti per gli studi futuri

(6)

1. INCONTRI VOCALICI NELLA LINGUA ITALIANA: IATI E DITTONGHI

1.1 Principali caratteristiche degli incontri vocalici

Il tema degli incontri vocalici costituisce un oggetto di studio tradizionale in fonetica. In una lingua come l'Italiano, poi, tale argomento risulta particolarmente interessante, in quanto le sequenze vocaliche ricorrono con un'alta frequenza: Marotta (1985) e Salza (1986) riportano che, in base ad un'indagine svolta mediante l'ausilio di uno strumento informatico che aveva come punto di riferimento il Dizionario Ragazzini (1984), sono 17.121 i lemmi che presentano due o più grafemi vocalici contigui (senza considerare la <i> grafica e non fonetica) su un totale di 56.359, un dato rilevante perchè queste parole rappresentano all'incirca il 30% del lessico della nostra lingua.

Le grammatiche considerano il dittongo e lo iato fenomeni radicalmente diversi: con il termine dittongo si fa riferimento a una sequenza fonica composta da due vocoidi appartenenti alla stessa sillaba (e dunque tautosillabiche), se invece ciascuna delle due vocali mantiene il valore di nucleo sillabico (e cioè se sono eterosillabiche) si è in presenza di uno iato (dal lat.

hiatus «apertura»). Rispetto allo iato, la dittongazione viene considerata un fenomeno di

indebolimento, in virtù del fatto che uno dei due segmenti vocoidei perde il suo carattere sillabico.

Nella seguente trattazione saranno esposte le principali caratteristiche dei dittonghi (§1.2) e degli iati (§1.3), saranno poi fornite delle regole di discriminazione (§1.4) e fatte alcune considerazioni alla luce del principio di marcatezza fonologica (§1.5), saranno trattate le sequenze bivocaliche a confine di parola (§1.6) e infine quelle composte da vocali con lo stesso timbro (§1.7), l'oggetto di studio di questa Tesi di Laurea Magistrale.

1.2 Dittonghi

I dittonghi sono elementi presenti in molte lingue del mondo, visto che generalmente qualunque vocale può essere seguita o preceduta da un altro segmento vocalico (Marotta 2010a). Per quanto concerne la loro struttura si è soliti riconoscerne una testa, che fa riferimento all'elemento più forte e prominente della sequenza e che assume il ruolo di nucleo sillabico, e un elemento più debole, cioè il legamento (ing. glide), appartenente alla classe degli approssimanti [1], e che può ricoprire due diverse posizioni all'interno della sillaba, anche a seconda della lingua. Esso può essere associato in attacco oppure in coda: nel primo caso si parlerà così di

(7)

dittonghi ascendenti (ing. ongliding) mentre nel secondo di dittonghi discendenti (ing. offgliding)

(Salza 1991:4, Migliorini 1941:180 e 1950:3).

Quello delle sequenze vocaliche è uno degli aspetti più complessi e più difficile da definire in quanto a regole di sillabazione, anche da un punto dal punto di vista della fonologia autosegmentale. Ciononostante, visto che i dittonghi sono elementi che appaiono con un'elevata frequenza nella produzione fonetica delle lingue del mondo è tradizione delle grammatiche, non solo italiane ma dalle lingue romanze in generale, distinguere fra due tipi di dittongo in relazione alla natura del legamento: [2]

- Dittongo Ascendente, nel caso in cui le vocali alte [i] e [u] (le più adatte svolgere il ruolo di legamento) si trovino in prima posizione nella sequenza vocalica, in questo caso tale vocoide alto verrà realizzato come segmento semiconsonantico [j] o [w] rispettivamente, ad esempio: piede [ˈpjɛːde], biada [ˈbjaːda], fuoco [ˈfwɔːko], quando [ˈkwando].

- Dittongo Discendente, nel caso in cui i vocoidi alti si trovino in seconda posizione nella sequenza, sarà invece realizzata una semivocale [i̯] o [u̯], come ad esempio in: baita [ˈbai̯ta],

pausa [ˈpau̯sa], poi [ˈpɔi̯], Europa [eu̯ˈrɔːpa].

Che il legamento si trovi in una posizione di subalternità rispetto alla vocale che la segue o precede è indubbio. Infatti in un dittongo la maggiore debolezza del glide è manifestata sia per quanto riguarda il timbro, sia per quanto riguarda la lunghezza del segmento. Relativamente al timbro, i legamenti sono caratterizzati da una struttura formantica meno definita e meno intensa rispetto alle vocali corrispondenti; quanto alla durata del segmento è in particolare la durata delle semiconsonanti che viene ridotta (cfr. Salza, Marotta & Ricca 1987).

La combinazione di elementi vocalici non è comunque esente da vincoli, in particolare per quanto riguarda i vincoli sul timbro: infatti la probabilità di incontrare dittonghi formati da vocali che presentano uno stesso timbro sarà minore, in concreto le sequenze [ji], [wu], [ii̯] e [uu̯] sono sequenze sfavorite.

La scarsa frequenza di questi tipi di dittonghi ci appare giustificata se teniamo in considerazione che nelle lingue naturali esiste un criterio di distintività, il quale richiede che tra segmenti contigui ci sia una minima differenziazione, in maniera tale da discriminare più facilmente gli elementi (cfr. Jakobson 1966). Pertanto, le sequenze [ji], [wu], [ii̯] e [uu̯] saranno svantaggiate in confronto ad altre combinazioni possibili, in quanto sussiste un'eccessiva prossimità non solo articolatoria ma anche percettiva dei due segmenti contigui. Anche se in gran parte delle lingue del mondo tali sequenze non sono ammesse, non mancano comunque dei

(8)

controesempi: Loporcaro (1988) riporta che nella parlata di Altamura (Puglia) e in diverse parlate della Puglia settentrionale e della Campania sono possibili realizzazioni fonetiche sia con [ji] che con [wu].

Dalla distinzione fra dittonghi ascendenti e dittonghi discendenti deriva quella tra semiconsonanti e semivocali rispettivamente. Nella produzione fonetica di parole contenenti dittonghi si avrà un aumento, più o meno definito, del grado di apertura vocalica e di quello di intensità sonora passando da una semiconsonante a una vocale (come ad esempio in [ˈpjaːno]

piano, [ˈkwindi] quindi); viceversa, passando da una vocale ad una semivocale (come in [ˈflau̯to] flauto, [ˈlai̯do] laido) tali valori decresceranno. Tali affermazioni ci appaiono giustificate, poichè

il valore di sonorità dei segmenti vocalici e il loro grado di apertura sono tra di loro in un rapporto di proporzionalità diretta: ciò significa che maggiore sarà il grado di apertura associato alla vocale, e altrettanto elevato sarà dunque il suo valore di sonorità. Difatti, nella scala di sonorità assunta in fonologia si prevede che le vocali più basse e aperte (nel caso dell'italiano [a]) costituiscano il polo di massima sonorità, mentre specularmente le vocali più alte e chiuse (in italiano [i] e [u]) rappresentano invece il polo di minima sonorità. Valori di sonorità ancora più bassi sono invece associati alle approssimanti non sillabiche (Marotta 2010a).

La stessa Marotta (2010a) ricorda inoltre che il tenere distinte le semiconsonanti e le semivocali non è solo una questione terminologica, ma riflette invece delle differenze a livello sia fonetico sia fonologico:

- da un punto di vista fonetico, le semiconsonanti sono più brevi e più chiuse rispetto alle semivocali e alle vocali, inoltre sono caratterizzate da rapide transizioni e dalla mancanza parziale o totale di parte stabile nella loro struttura formantica (Maddieson & Emmorey 1985); viceversa le semivocali possono essere comparate alle vocali corrispondenti in termini di durata e di struttura formantica, inoltre la parte stabile predomina sulle transizioni nella loro rappresentazione acustica. Mioni (1986:56; e 2001:176 e segg.) a tale proposito scrive che nelle semivocali il bersaglio timbrico viene fondamentalmente raggiunto, anche se presenta una certa instabilità.

- Da un punto di vista fonologico, invece, distinguere semiconsonanti e semivocali è collegabile alla struttura sillabica, che assume due configurazioni diverse a seconda che si tratti di un dittongo ascendente oppure discendente. Nei dittonghi ascendenti, infatti, il legamento è associato in posizione di attacco sillabico, come ad esempio in: piuma, chiave, chiodo, fieno,

(9)

discendenti, comprendenti una semivocale, associano questo segmento alla rima, sia che si tratti del complemento del nucleo, sia che risulti associata alla coda sillabica (Marotta 1988).

Per quanto concerne la formazione dei dittonghi ascendenti in italiano, la combinazione di semiconsonanti e vocali non presenta restrizioni. Nel caso delle semivocali, invece, la distribuzione presenta delle lacune: ad esempio, sequenze formate da vocali posteriori medie seguite dalla semivocale [u̯] (cioè *[ɔu̯ ou̯]) non sono attestate, e lo stesso dicasi per la sequenza *[iu̯].

Infine, relativamente alla frequenza dei dittonghi nella nostra lingua, i dittonghi ascendenti sono molto più frequenti di quelli discendenti, per cause relative alla storia della lingua. Non a caso i dittonghi ascendenti rappresentano un’innovazione romanza importante rispetto al latino, mentre quelli discendenti sono presenti quasi solo nei latinismi (come Europa, aureo, laurea,

eufemismo), nei prestiti dalle lingue classiche o da quelle germaniche, oppure sono dovuti

all’incontro di morfemi. Da uno studio condotto da Marotta (1987) emerge infatti la diversa frequenza di queste due strutture nel lessico italiano. Se i dittonghi ascendenti registrano una percentuale di ricorrenza pari ad oltre il 61% sul numero delle sequenze di due vocoidi all'interno di parola, la controparte discendente registra invece una percentuale più esigua, inferiore al 12%.

1.3 Iati

Passando agli iati, ci sembra doveroso ricordare un'indagine condotta da Chiari (2002:221), in cui la studiosa riporta che essi ricorrono con una frequenza relativamente bassa sia nei lessici, sia nei corpora di italiano parlato. Inoltre, delle molte combinazioni vocaliche teoricamente possibili, soltanto una decina sono attestate con una certa frequenza. Dunque possiamo assumere che nel caso di una sequenza bivocoidea, l'italiano è più orientato verso il dittongo che verso lo iato.

Marotta (1987:870) individua cinque diversi contesti di ricorrenza per lo iato in italiano, facendo riferimento alle grammatiche tradizionali:

- il caso in cui i segmenti [i] e [u] siano tonici, essi non subiscono quel processo di indebolimento che li trasforma in legamento e, pertanto, rimangono con un timbro ben definito, costituendo così uno iato (ad esempio: faina, baule). Nel caso in cui invece la sequenza sia tonica e l'accento cada sulla vocale contigua a [i] e [u], è altamente probabile che si realizzi un dittongo. Pertanto, Salza (1991:5) sostiene che la tendenza alla dittongazione in questo caso costituirebbe una vera e propria regola fonologica. Questa regola accomuna l'italiano con altre lingue, visto che Borzone

(10)

de Manrique (1979) scrive che tutto ciò vale anche in spagnolo.

- le parole derivate da radici contenenti [i] o [u] tonici (ad esempio: via > viale, spia > spiare) - le parole composte che presentino a confine di morfema due vocali adiacenti (ad esempio:

riavere, chiunque, biennio, semiaperto, antiallergico, idroelettrico, ecc...)

- una <i> e una <u> che seguono rispettivamente una [r] iniziale di parola o una [n] in qualunque posizione tendono ad essere realizzate con un timbro vocalico ben definito (come ad esempio in

continuare)

- la sequenza <ri> + vocale (come in rione, riavere, ecc...) e parimenti la sequenza <lu> + vocale (ad esempio: Luigi, Luana; Marotta 2010b). Relativamente a quest'ultimo contesto occorre però fare alcune precisazioni per quanto riguarda la sequenza [r] + <i>: infatti secondo Marotta (1987:875) il contesto a favore dello iato e a sfavore del dittongo sembra essere più propriamente quello formato da un segmento ostruente più una liquida (muta cum liquida); per questo motivo, è più probabile che si realizzi uno iato in parole come cliente, Adriano, trionfo, congruo e

industriale.

- esistono alcuni vocaboli specifici in cui la sequenza vocalica forma uno iato senza però seguire una tendenza precisa; tali vocaboli vengono infatti valutati come eccezioni lessicali (ad esempio

arcuato, consueto, sontuoso, ecc...) [3]. Occorre tuttavia notare che le intuizioni dei parlanti

possono divergere, come più avanti si argomenterà.

1.4 Discriminazione fra dittonghi e iati

Due vocoidi che entrano a contatto possono formare un dittongo oppure uno iato. Le combinazioni di elementi vocoidei possibili in Italiano sono le seguenti: VV, GV, VG, GG (Marotta 1987:863). Si adotta qui la convenzione secondo la quale V si riferisce alle vocali [a], [e], [i], [o], [u]; mentre G fa riferimento ai legamenti (ing. glide), che di norma in italiano sono [j] e [w]. Tra queste strutture, la prima costituirà uno iato in ogni caso, mentre le restanti potranno costituire sia uno iato che un dittongo. [4]

Facendo ricorso alla definizione fonologica (o prosodica), si ha una distribuzione complementare tra dittongo e iato: si ha un dittongo quando due vocoidi adiacenti fanno parte di una stessa sillaba, viceversa lo iato si ha nei casi in cui tale incontro vocalico avviene tra sillabe diverse. In termini di tratti chomskiani, se in una sequenza bivocalica ciascun segmento riceve una marca positiva rispetto al tratto di sillabicità, saremo in presenza di uno iato; viceversa, nel caso in cui solo uno dei segmenti riporti la marca positiva per tale tratto, allora si tratterà invece

(11)

di un dittongo, ascendente nel caso in cui sia [+sill] la seconda vocale oppure discendente se lo è la prima.

La discriminazione percettiva del dittongo e dello iato risulta il più delle volte facile ad un parlante madrelingua italiano e altrettanto facile gli risulterà decodificare produzioni particolari come [fu'ɔko] o [pi'ɛde], sebbene queste pronunce marcate vengano sicuramente giudicate innaturali oppure scarsamente accettabili. Tuttavia, non si può parlare di automatismo nell' individuare delle regole predittive che rendano conto della distribuzione di queste due tipi di produzioni fonetiche, dato l'alto numero di incertezze ineliminabili e ambiguità irrisolvibili (Marotta 1987:869).

Possiamo affermare che funzionalmente l'opposizione tra dittongo e iato in italiano è poco operativa in virtù del fatto che sono pochissime le coppie minime rinvenibili: Lepschy (1964) e Muljačić (1972:59-60) ricordano a tale proposito:

- ['spjanti] da spiantare e [spi'anti] da spiare - [laku'ale] da lago e [la'kwale] pronome relativo - [arku'ata] da arcuare e [ar'kwata] località

Sebbene non sia sempre facile ricondrre la differenza fra iato e dittongo a una serie di regole, è comunque possibile fare qualche generalizzazione. Determinare la sillabazione nel caso in cui vi sia una sequenza vocalica è infatti uno degli aspetti più complessi e di difficile catalogazione in un sistema di regole.

Il parametro acustico è quello della durata dei segmenti: già dall'analisi acustica di Salza (1986) è emersa una maggior brevità segmentale nella produzione dei dittonghi rispetto agli iati. Inoltre, non è solo la durata complessiva della sequenza bivocalica ad essere più lunga nei casi in cui i parlanti hanno prodotto uno iato (con un rapporto medio tra le durate complessive di 1.7), ma anche le durate dei singoli segmenti (sia sillabici che non) riportano compressioni notevoli nei dittonghi rispetto ai corrispondenti iati.

Relativamente all'altezza vocalica, invece, è più probabile che venga realizzato un dittongo nel caso in cui ci si trovi in presenza delle vocali alte [i] e [u] atone. Tali vocali dal punto di vista fonetico sono le più adatte ad assumere la funzione di legamento e a perdere la sillabicità in quanto sono segmenti il cui valore temporale è più breve e, pertanto, che possono essere più facilmente ridotti; inoltre, sono più tesi e più chiusi rispetto alle vocali medie e delle vocali basse. Se la sequenza che contiene queste vocali alte è atona, allora sarà prodotto un dittongo, in quanto una vocale marcata positivamente rispetto al tratto di altezza è un segmento più debole rispetto

(12)

agli altri e, pertanto, è soggetto a fenomeni di riduzione. Ciò rende i segmenti [i] e [u] i migliori candidati a non fungere da apice sillabico, realizzando in questo caso un dittongo; viceversa, nel caso delle sequenze vocaliche costituite unicamente dai segmenti [a], [e] e [o], si realizzerà normalmente uno iato e mai un dittongo.

Nelle lingue del mondo sono comunque attestati anche legamenti di media apertura, come ad esempio nei dittonghi ascendenti della lingua rumena, che oltre a [j] e [w] presentano anche [e̯] e [o̯] [5]. Anche in italiano, nonostante la grammatica prescriva la formazione di dittonghi costituiti solo da elementi vocalici asillabici corrispondenti alle vocali alte [i] e [u], vengono ripetutamente prodotti dittonghi fonetici in presenza anche di vocali medie nel parlato connesso e non accurato, soprattutto se si tratta di parole di uso frequente come ad esempio: aereo, stereo,

video, meteo, ed altre ancora che presentano un certo grado di probabilità di essere pronunciate

con il dittongo [e̯o].

Altro fattore di differenziazione in gioco è quello della posizione della parola nel sintagma e nell’enunciato. Come è noto, alla fine di un'unità sintattica o intonativa si registra un allungamento segmentale fisiologico, pertanto una stessa parola può essere prodotta foneticamente come iato oppure come dittongo a seconda della sua posizione all'interno dell'enunciato. Marotta (1987) esemplifica questo contrasto con le frasi: poi veniamo e non l’ho mai visto prodotte con dittongo, contrariamente a veniamo poi e non l’ho visto mai, con iato.

Un ulteriore parametro di differenziazione ci viene fornito da Bertinetto & Gili Fivela (1999:134), i quali, facendo riferimento alla nozone di grado di familiarità [6], sostengono che in alcuni casi, quanto più una parola è frequente, si possa avere un dittongo, come succede ad esempio per straordinario, contrariamente a straorzare.

Gli stessi autori ricordano inoltre che anche la provenienza regionale può costituire un parametro capace di render conto delle diverse realizzazioni delle sequenze vocaliche.

Infine, Marotta (1987:876) mette in luce la rilevanza dello stile adottato e della velocità d'elocuzione: infatti nel caso di uno stile trascurato oppure di un'elevata velocità di eloquio sarà favorita la produzione di un dittongo rispetto a uno iato, dato che, come abbiamo detto, il parametro temporale gioca un ruolo determinante nel determinare la natura dei segmenti in gioco. Le variazioni di velocità del parlante hanno delle ripercussioni sulla realizzazione fonetica delle sequenze composte da due vocoidi adiacenti, determinandone lo statuto eterosillabico o tautosillabico. Adottando un eloquio lento e pausato, generalmente si tenderà a produrre più iati; al contrario, con un ritmo relativamente veloce sarà più probabile che vengano realizzati

(13)

dittonghi.

È però doveroso, a questo punto, fare una precisazione. Come notato dalla stessa Marotta (1987:876-877), ma anche da Bertinetto (1981:158), il condizionamento operato dalla velocità elocutiva è a carattere unidirezionale: se è vero che adottando un ritmo rapido le sequenze contenenti iato saranno più probabilmente prodotte come dittongo, è altrettanto vero che con una velocità di eloquio lenta gli iati rimangono tali (e dunque immutati) e lo stesso vale anche per i dittonghi (soprattutto quelli ascendenti), senza che si trasformino necessariamente nei corrispondenti iati. Pertanto, da ciò è possibile concludere che variazioni dello statuto sillabico della sequenza vocalica (eterosillabico o tautosillabico) agiscano soltanto in un senso, monodirezionalmente, per favorire la produzione meno marcata, cioè il dittongo.

1.5 Sequenze bivocaliche e marcatezza

Non sarà certo inopportuno ricordare in questa sede che le sequenze vocaliche tendono ad essere evitate nella fonologia delle lingue naturali. Tale osservazione era già stata mossa da Jackobson (1963), il quale scrive a tale proposito che "è il contrasto vocale-consonante che costituisce il principio cardinale della struttura sillabica, essendo la sillaba essenzialmente un gesto articolatorio che inizia con una chiusura e termina con un'apertura. Il tipo sillabico CV viene considerato di norma <<non marcato>> [...]". Questo tipo sillabico inoltre ha una particolare rilevanza in Italiano, infatti la sua alta frequenza tra i tipi sillabici possibili della nostra lingua ci è riportata da un'analisi statistica condotta da Bortolini (1976), la quale stima una percentuale di circa il 60%.

Va comunque detto che il solo principio di marcatezza fonologica in sé non è sufficiente per spiegare i molteplici esiti possibili che possono avvenire quando due elementi vocalici entrano in contatto. Senza dubbio grazie al parametro della marcatezza possiamo spiegarci come mai certe sequenze siano più o meno attestate nelle lingue del mondo, ma se considerassimo tale parametro come l'unico in gioco, allora non ci spiegheremmo l'esistenza di determinate realizzazioni fonetiche. In particolare, Marotta (1987:872) mette in luce altri fattori che interagiscono con la marcatezza o che addirittura possono annullarla.

In primo luogo viene messa in rilievo l'importanza dell'accento come fattore prosodico capace di determinare se la sequenza vocalica sia uno iato oppure un dittongo. L'autrice ricorda infatti che una vocale tonica sarà sempre marcata positivamente rispetto al tratto chomskiano di sillabicità: ciò implica che in presenza di sequenze bivocoidee, se uno dei due vocoidi è tonico

(14)

allora verrà sempre realizzato uno iato. (come ad esempio in mìo, tùo, sùo, baùle, faìna)

Anche la struttura morfologica delle parole composte svolge un ruolo importante nella discriminazione fra dittonghi e iati. Difatti, sembra che nelle sequenze bivocoidee formate da una <i> preceduta o seguita da un altro vocoide, e separate da una frontiera morfologica fra i due membri di un composto, sia preferita la realizzazione di uno iato. Questo esito è principalmente dovuto al fatto che tale frontiera impedisce la fusione dei segmenti in un dittongo, perché li tiene separati preservandone il carattere sillabico (come in appendiabiti, semiaperto, portaimmondizia,

multiutente), sempre tenendo conto del possibile effetto della velocità di elocuzione. Marotta

(1987:874) nota tuttavia che non viene costantemente prodotto uno iato quando [i] e [e] appartengano alla radice della parola, e riporta casi in cui lo iato è ben percepibile (come in

sciare, spiare, viale) e casi in cui non lo è (sciatore, spiavamo, vialetto).

Altrettanto rilevanti sono le parole derivate. Salza (1991:5) trova infatti un altro parametro di discriminazione considerando la derivazione lessicale: gli iati tendono a restare tali anche nella forma derivata (viale da via, dualismo da due).

Infine, Bertinetto & Gili Fivela (1999) hanno condotto uno studio volto a chiarire ciò che accade nelle sequenze vocaliche delle parole derivate per prefissazione. L'ipotesi di lavoro degli autori è che in tali incontri "si crei una tensione fra le diverse possibili realizzazioni, tra cui ci interessano in particolare le due seguenti: mantenimento dello iato e dittongazione". I parametri presi in considerazione sono: velocità di elocuzione, tipo di sequenza vocoidea, frequenza d'uso della parola, trasparenza semantica del prefisso.

1.6 Sequenze bivocaliche a confine di parola

Per una maggior chiarezza della trattazione riportiamo qui anche i fenomeni che possono verificarsi quando due elementi vocalici si trovano a confine di parola. Ciononostante, nel presente studio verranno considerate soltanto le sequenze vocaliche all'interno di parola.

Tradizionalmente le grammatiche distinguono quattro fenomeni diversi per quanto riguarda le sequenze vocaliche a confine di parola, e cioè quando una parola che termina in vocale è seguita da un'altra parola che comincia con una vocale. Tali fenomeni sono (Marotta & Sorianello 1997:103, Salza 1991:6)[7]

- Aferesi, nel caso in cui V2 venga eliminata (come in a pranzo ho mangiato solo ’n pezzo di pizza)

(15)

intermedio rispetto a quelli di partenza

- Sinalefe: nel caso in cui la sequenza vocalica sia completamente atona, oppure presenti una vocale atona, tali segmenti possono subire una dittongazione, o comunque vengono realizzati tautosillabicamente (come in buoni amici)

- Dialefe, ossia costituzione di iato; nel caso in cui entrambe le vocali siano toniche, l'accento della vocale finale tende ad arretrare (come in verrà oggi)

- Assimilazione; ossia, fusione di due vocali che presentano lo stesso timbro in un'unica vocale (come in cara amica); questo caso in pratica converge nel seguente

- Elisione, cioè la caduta di una vocale atona finale di fronte a una vocale iniziale seguente, che si attua per fluidificare la produzione articolatoria e evitare il formarsi di iati, come in "all'alba" o in "un vero affare" [un ,ver a'fːare]. Nell’ortografia, questa cancellazione di vocale è contrassegnata dall’apostrofo. Agostiniani (1989:36 e 44, in nota 45) ha notato che nell'italiano regionale la regola di elisione è insensibile ai condizionamenti sintattici, mentre è sensibile a restrizioni di tipo ritmico, dato che richiede che la sillaba successiva sia senza accento primario; si hanno dunque realizzazioni come ne ho visto un'immensa (di ville) o ne ho comprato un

azzurro (di vestiti), con accento primario sulla seconda sillaba; viceversa, non sono accettabili

combinazioni come *ne ho comprato un alto (di sgabelli), data la presenza dell'accento primario sulla prima sillaba.

1.7 Sequenze bivocaliche con lo stesso timbro

Veniamo adesso alle sequenze bivocaliche che più ci interessano ai fini della seguente trattazione, ossia quelle formate da due vocali eterosillabiche con lo stesso timbro: in sostanza, gli iati composti da vocali identiche fra di loro.

Studiosi come Valesio (1967) suggeriscono di aggiungere anche i fonemi relativi alle vocali lunghe /i:/ e /e:/ all'inventario fonologico della nostra lingua, in maniera tale da poter spiegare la differenza che esiste tra salì e salii e tra are e aree. [8] Ciononostante, questa soluzione dal punto di vista funzionale è scarsamente operativa, considerato che questa tipologia di iato ha una frequenza relativamente esigua in italiano; infatti se può risultare facile trovare, ad esempio, degli iati formati da due vocali alte anteriori (cioè [ii]) nella prima persona singolare del passato remoto (sentii, aprii, inferii, ecc...), e qualche esempio di [ee] e [oo], altrettanto non si può invece dire degli iati [aa] e [uu], la cui attestazione è decisamente più ridotta. Vediamo alcuni esempi di questi iati particolari in concreto [9]:

(16)

- Sequenza [aa]

La frequenza di questo iato è decisamente esigua nel lessico della lingua italiana, possiamo ricordare il prestito arabo sahara (pronunciato come [sa'a:ra]) ed il suo derivato sahariano. - Sequenza [ee]

Più numerose sono invece le parole che contengono ee. In fine di parola si trova nei plurali delle parole italiane in -ea (come cornea, marea) oppure -eo (come spontaneo), mentre la maggior parte di questi iati è formata da grecismi (calchee, eraclee); ricordiamo inoltre lineetta, il derivato di linea, guardalinee, veemente.

- Sequenza [oo]

Questa sequenza si ritrova perlopiù in tutte le parole contenenti il prefisso o suffisso -zoo «animale, vivente»: protozoo, spermatozoo, zoologo, zootecnica, lo stesso zoo, ecc..., ma anche parole come oosfera, zoosfera, cooperare, coorte, coordinare, cooptare, Laocoonte, Alcinoo. - Sequenza [ii]

Lo iato in [ii] si può trovare nei plurali delle parole in -io, quando essi non siano ridotti, come nell’uso attuale, a [i] (infatti corridoi è preferito rispetto a corridoii, lo stesso dicasi di

monopoli rispetto a monopolii, ecc.), nei passati remoti di prima persona singolare dei verbi in

-ire, come in dormii, partii, ecc..., oppure in qualche parola come pii, zii, piissimo, sciita. - Sequenza [uu]

Sembra che le uniche occorrenze di questa sequenza in italiano siano nelle parole derivate dal latino come duumviro, duumvirato, oppure in latinismi come continuum, perpetuum.

(17)

NOTE

[1] Occorre precisare che con il termine legamento facciamo riferimento a due diversi classi di foni, infatti nella tradizione italiana vengono distinte le semivocali [i̯] e [u̯], che seguono la vocale nucleica, dalle semiconsonanti [j] e [w], che invece la precedono.

[2] La distinzione tra dittonghi ascendenti e discendenti non è affatto antica: infatti nelle grammatiche classiche, come ad esempio in latino e in greco, con il termine dittongo ci si riferiva soltanto ai dittonghi discendenti, in cui la vocale sillabica è seguita da un legamento; questa distinzione rappresenta pertanto un’innovazione moderna. Nell'ampio e interessante studio condotto da Romeo (1968) sui dittonghi italiani, i termini ascendente e discendente vengono rispettivamente sostituiti con i termini ossitono e parossitono, i quali fanno riferimento alla posizione dell'accento all'interno della sequenza; le sequenze che, al contrario, sono prive di accento vengono invece classificate come atone. Marotta (1987:857) individua comunque tra i problemi della classificazione di Romeo una "proliferazione di termini, a nostro avviso immotivata oltre che inutile".

[3] Marotta (1987:870) considera questi vocaboli come dotati di "una certa carenza di chiarezza espositiva, oltre che esplicativa", inoltre riconosce che si tratta di parole in cui è osservabile uno iato etimologico (consu-eto) oppure una frontiera morfologica tra morfema e forma base (arcu-ato).

[4] Relativamente alla frequenza lessicale di queste combinazioni, l'Italiano è decisamente più orientato verso il tipo GV rispetto al tipo VG: da un'indagine condotta mediante l'utilizzo del

Dizionario Ragazzini (1984), è emerso che in 12.385 lessemi, i grafemi <i> e <u> sono seguiti da

una vocale, mentre invece solo in 1.582 casi la seguono. Per un'analisi dettagliata sulle sequenze bivocaliche possibili della lingua italiana, si rimanda a Romeo (1968).

[5] Mioni (2001:98) ricorda: beata [ˈbe̯ata] «ubriaca»; coarda [ˈko̯arda] «corda».

(18)

che a quella ben definita della frequenza d'uso "perchè molte delle parole da noi studiate, data la loro natura, non compaiono nei lessici di frequenza dell'italiano". Per riuscire a valutare in maniera adeguata tale grado di familiarità è stato condotto un test considerando un campione di 10 parlanti, i quali dovevano indicare quanto familiare fosse la parola presentata, mediante un valore numerico da 1 a 3 e corrispondente a:

- 1 = poco familiare - 2 = intermedio - 3 = molto familiare

[7] Laddove Marotta & Sorianello indagano sui possibili esiti nei contesti Ausiliare + Verbo e

Articolo + Nome, Salza adotta invece un'ottica più generale ed elenca tutti gli esiti

tradizionalmente riconosciuti dalle grammatiche italiane: nella seguente trattazione verranno esposti tutti assieme.

[8] Muljačić (1972:71) si mostra contrario a questa tesi, osservando che se venisse adottata si potrebbero trovare altri fonemi relativi a vocali lunghe, come /a:/ per differenziare la coppia sara e sahara, e via dicendo.

(19)

2. L'ESPERIMENTO: MATERIALI E METODOLOGIA

In questo lavoro sperimentale ci si propone di indagare uno dei temi meno studiati e meno chiari nell'ambito della fonetica della lingua italiana, e cioè quello riguardante gli iati composti da due vocali aventi lo stesso timbro (ad esempio: sahara, coorte, linee). A quanto ci risulta questo sembra essere il primo lavoro che si propone di analizzare queste sequenze vocaliche particolari in chiave acustica ed articolatoria, dunque si tratta di uno studio pilota.

L'obiettivo che ci eravamo posti inizialmente era solo quello di "esplorare" i fenomeni che avvengono quando si incontrano questi due tipi di vocali. Riteniamo che in un parlato spontaneo, a velocità di eloquio sostenuta, possa scomparire la differenza fra parole del tipo Sara e Sahara, ma che invece nel parlato di laboratorio una differenza uditiva ci sia. Il punto è: esiste anche un qualche gesto articolatorio che accompagna questa differenza? Se sì, occorrerà poi verificare se questo gesto si ritrova anche nel parlato spontaneo.

Questo capitolo è incentrato sulla descrizione delle fasi dell'esperimento condotto; in particolare, saranno descritti i materiali impiegati (§2.1), i soggetti e la fase di registrazione dei dati (§2.2), infine verrà fornita una puntuale descrizione circa la fase operativa, divisa in due momenti distinti: la segmentazione acustica mediante il software PRAAT (§2.3) e l'indagine ecografica (UTI) mediante il software AAA (§2.4).

2.1 Materiali utilizzati

Come base del nostro lavoro, inizialmente è stato creato (a cura di Pier Marco Bertinetto e

del personale del gruppo ELiTe, appartenente al laboratorio SMART della Scuola Normale Superiore), un corpus formato da parole contenenti uno iato del tipo che qui interessa, con una quantità sufficiente per ogni tipo di vocale. Questa lista di parole è stata creata seguendo due parametri fondamentali. In primo luogo, è stata considerata la posizione dell'accento relativamente alla sequenza vocalica, distinguendo così tre tipi di iati:

- Senza Accento (in totale dieci: patrii, arbitrii, linee, veemente, sahariano, Nausicaa, cooptare,

coordinare, Alcinoo, duumvirato)

- Con accento sulla V1 (in totale dieci: sentii, addii, pii, trii, rinvii, ree, cee, dee, Laa, Coo) - Con accento sulla V2 (in totale otto: piissimo, sciita, lineetta, Sahara, coorte, (io) coopto,

Laocoonte, duumviro)

(20)

foneticamente simili a quelle della prima lista, ma contenenti una sola vocale anziché due, vale a dire senza iato (ad esempio sara per sahara, corte per coorte, re per ree, e così via).

Adottando i suddetti parametri è stato possibile completare le seguenti tabelle. La prima riguarda gli iati atoni (a sinistra) e le relative parole foneticamente simili ma con solo una vocale (a destra):

La seconda lista è relativa agli iati che portano l'accento sulla prima vocale:

Infine, la terza riporta gli iati con accento sulla seconda vocale:

Queste tabelle sono da intendersi come linee guida dell'analisi comparata: esse ci permettono di mettere in relazione parole contenenti due vocali adiacenti con parole foneticamente affini ma con una sola vocale. Così facendo, si è ridotta al minimo la differenza fra i contesti vocalici e si è fissato un modello di riferimento con il quale comparare i risultati ottenuti dall'analisi acustica e articolatoria degli iati.

Inoltre, per non limitare l'indagine soltanto al contesto di parola isolata e poter quindi fare una comparazione ulteriore con il contesto di frase, sono state pensate delle frasi contenenti quasi tutte le parole del corpus (sia iati che non) per un totale di 30. A seguire, le riportiamo per intero:

(21)

IATO SENZA ACCENTO

- Rientrato nei luoghi patrii, si sentì finalmente appagato - Passando arditamente fra le linee, il plotone si salvò. - Con fare veemente, Armando si aprì un varco.

- La musica sahariana, benché poco nota, è affascinante. - Per meglio coordinare, il direttore convocò le parti. - In quanto membro del duumvirato, Pompeo si inorgoglì.

IATO CON ACCENTO SU V1

- Appena ho detto:"sentii", lui mi ha lanciato un'occhiata.

- Le due diaboliche ree, per nulla pentite, continuarono a delinquere. - Sotto il nome di Laa, si nasconde una temibile spia.

- L'isola di Coo, nel Dodecaneso, è legata a ricordi mitologici.

IATO CON ACCENTO SU V2

- L'islamismo sciita, come è noto, ha il suo epicentro in Iran. - Leo tirò una lineetta, e tutto si chiarì.

- Per attraversare il Sahara, bisogna fare molta attenzione. - Stringiamci a coorte, siam pronti alla morte!

- Pisone, ardito duumviro, dovette rassegnare le dimissioni.

VOCALE SENZA ACCENTO

- Completati gli atrii, il palazzo è davvero finito.

- Avvolta nelle sue trine, l'avventuriera lo guardò provocatoriamente.

- Il povero demente, senz'accorgersi, non faceva che peggiorare la situazione. - Avvisata Marica, tutti erano al corrente.

- Una volta deciso di lottare, bisogna andare fino in fondo. - Avendo fatto il duplicato, mi sento più tranquillo.

VOCALE CON ACCENTO

- Quando lei lo sentì, fu presa dall'irritazione.

(22)

- Giunto là, si chiese finalmente cosa ci stava a fare. - Attraversando il Po, si prova un misto di sensazioni. - Al termine della gita, l'atmosfera era molto fraterna

- Pulendo la tastiera della spinetta, produsse involontariamente dei suoni delicati. - La mia amica Sara, opportunatamente avvisata, se ne è tenuta alla larga.

- Una volta ammesso a corte, il principe si diede una calmata. - Avendo estratto il numero, non resta che attendere la sorte.

Come si può notare, non sono state realizzate delle frasi per tutti i target del corpus, infatti su un totale di 53 parole (sia con vocale scempia che adiacente) sono state realizzate 30 frasi. Questa decisione è stata presa in virtù del fatto che una seduta di registrazione in cui i parlanti devono pronunciare 53 frasi per 3 volte (più altre due ad una velocità d'eloquio più lenta), sarebbe risultata piuttosto dispendiosa in termini di tempo per i partecipanti. Per la selezione delle parole da inserire nelle frasi, si è deciso di mantenerne una per ogni tipo rappresentato nelle tabelle di cui sopra, e per fare ciò ci si è basati sulla frequenza e sulla familiarità laddove vi fosse la scelta (ad esempio, per quanto riguarda lo iato [ii] con accento su V2, è stata preferita la coppia sciita -

gita all'alternativa piissimo - Trissino). L'unica eccezione è stata fatta per la coppia veemente - demente, considerata anch'essa oltre a linee - trine, perchè la loro frequenza e familiarità è grosso

modo comparabile.

È necessario precisare che la posizione della parola target all'interno della frase non è casuale: infatti, è stata impiegata la strategia consistente nel posizionare le parole target subito prima di una virgola, per garantire una situazione prosodica controllata e limitare la variabilità delle realizzazioni.

Infine, per quanto riguarda la modalità di lettura, gli stimoli sono stati randomizzati, in maniera tale che il monitor riportasse prima una parola e poi una frase, in ordine sparso e distanziando i target in modo che essi non fossero collegabili fra loro. Questo ha favorito nei parlanti l'idea di un elenco di stimoli disposti casualmente o comunque in cui non traspare il vero obiettivo della ricerca. L'elenco completo delle parole e delle frasi è stato letto per un totale di tre volte a velocità normale da ciascun parlante. I locutori hanno inoltre letto l'intera lista altre due volte a velocità leggermente rallentata, secondo un criterio individuale di esecuzione.

(23)

2.2 Soggetti e fase di registrazione

La lista di stimoli, parole e frasi, è stata sottoposta a 6 soggetti di diversa provenienza regionale, ma tutti nati e cresciuti in nord Italia. Questa scelta è stata fatta perchè i parlanti dell'Italia centrale distinguono i timbri vocalici quando siano coinvolte vocali medie, come in ree. Così se ad esempio un parlante pisano realizzerà ['rɛ:e] e [niɱ'fɛ:e]per le parole ree e ninfee, un parlante milanese realizzerà invece ['re:e] e [niɱ'fe:e] mantenendo lo stesso timbro vocalico nello iato.

A seguire riportiamo i dati relativi ai sei soggetti che hanno preso parte all'esperimento divisi per nome, sesso, anno e luogo di nascita:

Soggetto 1

Nome: E. C. Sesso: F

Anno di nascita: 1994 Luogo di nascita: Biella (BI)

Soggetto 2

Nome: F. E. Sesso: F

Anno di nascita: 1992

Luogo di nascita: Brescia (BS)

Soggetto 3

Nome: C. P. Sesso: F

Anno di nascita: 1995

Luogo di nascita: Monza (MB)

Soggetto 4

Nome: I. O. Sesso: F

(24)

Luogo di nascita: Genova (GE)

Soggetto 5

Nome: I. R. Sesso: F

Anno di nascita: 1993

Luogo di nascita: Milano (MI)

Soggetto 6

Nome: M. S. Sesso: M

Anno di nascita: 1993

Luogo di nascita: Novi Ligure (AL)

Come si può vedere, ci sono tre lombardi, due piemontesi e un ligure, per un totale di cinque femmine e un maschio. Le loro età al momento della registrazione sono comprese fra 21 e i 24 anni. Inoltre, tutti erano in possesso di un titolo di studio universitario e nessuno presentava accentuate caratteristiche dialettali, difetti o particolarità di pronuncia. Questo ha permesso di confrontare un parlato articolato normalmente con uno iperarticolato. Ai soggetti sono state fornite indicazioni preliminari, per assicurarsi che comprendessero ciò che veniva chiesto loro. Oltre a questo, è stata richiesta una dizione chiara, fluente e senza pause, evitando qualsiasi tipo di enfasi.

Per quanto riguarda la registrazione dei dati, l'intera seduta di registrazione è stata effettuata all'interno di una cabina insonorizzata nel laboratorio SMART (gruppo ELiTe) della Scuola Normale Superiore di Pisa. Tale registrazione è avvenuta tramite un microfono Shure collocato nella cabina di registrazione. I soggetti hanno indossato un caschetto (Articulate Stabilization

Headset) in modo tale da stabilizzare i movimenti della testa, inoltre hanno mantenuto una sonda Mindray micro-convex ultrasound probe (#65EC10EA) collocata sotto il mento durante tutto

l'esperimento e collegata ad un ecografo Mindray UTI system (a una frequenza di 30MHz): così facendo è stato possibile non solo registrare un audio di qualità, ma anche ottenere le relative immagini dei gesti articolatori. [1] Il segnale acustico è stato poi campionato e conservato su computer per le successive analisi.

(25)

2.3 Fase operativa: segmentazione acustica con PRAAT

Per questo esperimento ci siamo serviti del software PRAAT allo scopo di segmentare le porzioni foniche che più ci interessano in questa sede, vale a dire i segmenti vocalici target (sia adiacenti che singoli) delle registrazioni precedentemente effettuate. [2]

Per questa procedura, si è operato sia sulle parole che sulle frasi. Laddove la parola contenente il segmento vocalico target si trovasse in contesto di frase, sono stati prima impostati i confini della parola contenente tale vocale e solo successivamente sono stati impostati quelli vocalici. Se invece il segmento vocalico si trovava in contesto di parola, sono stati impostati solo i confini del segmento target. Sia le parole che le vocali sono state opportunatamente annotate. La procedura di segmentazione dell'intero corpus è iniziata a Marzo 2017 e finita a Giugno dello stesso anno.

2.4 Fase operativa: analisi articolatoria con AAA

L'immagine ecografica è stata sincronizzata con il file audio della registrazione e con lo spettrogramma annotato di PRAAT. Per questa seconda parte della fase operativa ci siamo serviti del software AAA (Articulate Assistant Advance) [3] per l'analisi articolatoria dei dati, con debito addestramento e costante assistenza da parte del personale del laboratorio, in particolare le dott. Giovanna Lenoci, Irene Ricci e Chiara Bertini. Come riportato in §2.3, durante la registrazione i parlanti hanno mantenuto una sonda ecografica sotto il mento, in modo tale da registrare i movimenti della lingua ed avere dunque un’immagine del comportamento articolatorio. Le immagini prodotte attraverso il sistema ad ultrasuoni sono state poi esportate sul software AAA; che permette di visualizzarle simultaneamente con la annotazione audio e di disegnare i profili linguali per analizzarli ed esportarli.

Il procedimento adottato nell'analisi articolatoria mediante AAA può essere riassunto come segue. Inizialmente sono stati tracciati i profili linguali dei segmenti vocalici prodotti (sia scempi che adiacenti) per tutte le immagini ottenute tramite la sonda ecografica. Per fare ciò, in un primo momento è stato eseguito un tracciamento automatico da parte del programma stesso, successivamente è stata svolta una correzione manuale frame per frame, onde evitare errori nelle rappresentazioni [4]. Una volta ottenuti i profili corretti, essi sono stati esportati in immagini di formato .png, e su di essi sono state fatte considerazioni qualitative.

(26)

quello di esportare i profili delle vocali adiacenti assieme a quelli delle corrispondenti parole con vocale scempia (ad esempio re assieme a ree, Sara assieme a Sahara, ecc...). Ciò ha permesso di vedere in una prospettiva comparata i due gesti articolatori eseguiti in un contesto foneticamente simile. Per questo tipo di esportazione, si è riferimento al punto intermedio del segmento vocalico, considerando i tre frames precedenti e i tre successivi, compreso il mediano, per un totale di sette frames laddove fosse possibile. Per alcuni segmenti vocalici scempi non è stato possibile estrarre sette frames perchè la loro durata era minore; pertanto, in alcuni casi la comparazione tra le due parole è avvenuta sulla base di un numero ridotto di frames. I tracciati sono stati colorati in maniera diversa: per le vocali singole è stato scelto il colore rosso, per quelle adiacenti il blu. Le immagini ottenute sono state sovrapposte in sequenza, rendendo possibile l'ispezione comparata.

La seconda modalità di esportazione riguarda invece tutte le realizzazioni di una determinata parola di uno stesso soggetto (ad esempio le tre riproduzioni di corte, oppure le tre di coorte, e così via). Per ognuna di queste è stata studiata la vocale target per intero, frame per frame, avendo anche qui l'accortezza di colorare in maniera diversa i vari profili per non confonderli tra di loro. Questo secondo modo di procedere è stato pensato per mettere a fuoco le eventuali differenze che sussistono tra le produzioni dei diversi segmenti vocalici di uno stesso parlante.

(27)

NOTE

[1] Prima di iniziare la lettura della lista di stimoli, è stato chiesto a ciascun soggetto di bere dell'acqua; questo rende possibile effettuare il tracciamento del palato, che viene utilizzato come riferimento per i profili linguali delle vocali analizzate.

[2] Come è noto, il software PRAAT è un freeware aggiornato costantemente da Paul Boersma e David Wenink del Laboratorio di Fonetica dell’Università di Amsterdam, che consente di analizzare il segnale acustico in modi diversi e possiede molteplici funzionalità. Per la segmentazione sono state seguite le regole convenzionali, riportate sul sito http://www.fon.hum.uva.nl/praat/manual/Intro.html. La versione del software usata nell'esperimento è la 5.3.19, (http://www.praat.org).

[3] Questo software è stato creato dal professor Alan Wrench del Clinical Audiology, Speech and Language Research Centre (CASL); la versione che è stata usata nell'esperimento è la 2.16.15 (http://www.articulateinstruments.com/downloads/).

[4] In qualche caso le immagini sono risultate talmente scure, che una qualsiasi operazione di tracciamento sarebbe risultata un azzardo. Questi casi sono stati messi da parte e tolti dall'analisi.

(28)

3. L'ESPERIMENTO. RISULTATI OTTENUTI.

Come riportato in §2.4, inizialmente si sono tracciati i profili linguali dei segmenti vocalici prodotti (sia singoli che ripetuti) per le immagini ottenute tramite sonda ecografica. Per ottenere dei profili corretti, in un primo momento è stato eseguito un tracciamento automatico da parte del programma AAA. In un secondo momento è stata invece svolta una correzione manuale frame per frame [1], onde evitare errori nelle rappresentazioni. Questi profili sono stati infine esportati in immagini di formato .png.

Una volta ottenuti i profili corretti, sono stati messi a confronto quelli delle parole con vocali singole con quelli delle corrispondenti parole con vocale ripetuta (ad esempio re vs. ree, Sara vs.

Sahara, ecc...). Ciò ha permesso di vedere in una prospettiva comparativa i due gesti articolatori

eseguiti in un contesto foneticamente simile. Si è fatto riferimento al punto intermedio del segmento vocalico, considerando i tre frames precedenti e i tre successivi, compreso il mediano, per un totale di sette frames, laddove fosse possibile, ossia compatibilmente con la durata del fono. Successivamente, i tracciati sono stati colorati in maniera diversa per poter meglio osservare cosa accade. Per le vocali singole è stato scelto il colore rosso, mentre per quelle ripetute è stato scelto il blu. Infine, le immagini sono state sovrapposte in sequenza, rendendo possibile l'ispezione comparata.

Per la selezione del corpus da analizzare, sono stati presi in considerazione (tra quelli inizialmente selezionati) soltanto quei casi in cui l'evoluzione comparata del gesto articolatorio della vocale ripetuta presenta differenze significative. Così facendo, è stato possibile ottenere 13 coppie di parole (se pure di soggetti diversi) in cui i gesti della vocale singola e della vocale ripetuta sono sufficientemente diversi da non essere considerati gli stessi [2]:

PAROLE OGGETTO D'ESAME

- Corte vs Coorte (Soggetto 2) - Là vs Laa (Soggetto 2) - Re vs Ree (Soggetto 2) - Corte vs Coorte (Soggetto 3) - Là vs Laa (Soggetto 3) - Là vs Laa (Soggetto 4)

(29)

- Re vs Ree (Soggetto 4) - Corte vs Coorte (Soggetto 6) - Là vs Laa (Soggetto 6)

- Spinetta vs Lineetta (Soggetto 6) - Atri vs Patrii (Soggetto 6) - Re vs Ree (Soggetto 6)

Come si noterà, tra le coppie di parole non figura nessun caso relativo al soggetto 1 e al soggetto 5. Dal primo soggetto infatti, in fase di tracciamento dei profili linguali, si sono ottenuti molti casi in cui le immagini sono risultate talmente scure che una qualsiasi operazione di tracciamento sarebbe risultata un azzardo [3]. Pertanto, tutti i risultati di questi casi sono stati eliminati dall'analisi. Inoltre, questo soggetto non ha neppure prodotto tutti i materiali della lista completa.

Il soggetto 5 è stato escluso per altre motivazioni. In quasi tutti i casi appare che questo soggetto adotta due strategie articolatorie indipendentemente dal tipo di vocale (singola o ripetuta). Nella figura 1 riportiamo un esempio per la coppia di parole corte vs coorte, ricordando che per le vocali singole è stato scelto il colore rosso, mentre per quelle ripetute è stato scelto il blu. Come si può notare dalla colorazione dei profili linguali, questo soggetto fa ricorso a due diverse strategie articolatorie, senza tuttavia differenziare il contesto di vocale singola da quello di vocale ripetuta. Ovviamente, questo fatto è in sé interessante e meritevole di attenzione, ma ciò esula dallo scopo precipuo di questa tesi.

(30)

FIGURA 1

Quattro frames relativi alle vocali [o] e [o:] nelle parole corte e coorte, pronunciate dal soggetto 5.

Sui 13 casi selezionati, sono state effettuate due analisi di tipo qualitativo ed una di tipo quantitativo. Inizialmente, è stata svolta una prima analisi qualitativa basata sull'evoluzione temporale dei due gesti vocalici (§3.1), con l'obiettivo di individuare un possibile indice articolatorio che renda conto delle differenze nei gesti delle vocali singole vs. ripetute. Successivamente, è stata svolta un'altra analisi qualitativa (§3.2), sempre con lo scopo di individuare le differenze nella dinamica del gesto articolatorio dei due tipi di vocale. Infine, è stata svolta un'analisi quantitativa delle rispettive durate (§3.3). Per quest'ultima analisi non si è fatto riferimento al corpus di 13 casi selezionati, bensì è stato considerato tutto il materiale registrato raccolto, onde avere una base statisticamente valida.

3.1 Prima analisi qualitativa: evoluzione temporale comparata dei gesti articolatori

Per il primo tipo di analisi qualitativa si è tenuto in considerazione il corpus formato dai 13 casi selezionati (si veda sopra). Questa indagine è incentrata sul confronto tra la diversa evoluzione temporale dei due gesti vocalici, e aveva lo scopo di individuare e descrivere le differenze in termini articolatori. A tale proposito, l'indice articolatorio a cui abbiamo fatto riferimento è la relativa perifericità apicale, dorsale e radicale di uno dei due profili linguali (di vocale singola o ripetuta) rispetto all'altro. Intendiamo qui la maggior perifericità di un profilo linguale rispetto all'altro come la maggior prossimità tra tale profilo e il palato; pertanto un apice, un dorso o una radice di un profilo (es. quello delle vocali ripetute) saranno maggiormente periferici rispetto a quelli di un altro profilo (es. quello delle vocali singole) nei casi in cui i primi si trovino più vicini al palato degli ultimi. [4]

Quest'indagine ha preso in considerazione i sette frames ottenuti tramite il software AAA (§2.4) e relativi alle immagini dei due gesti vocalici sovrapposti in sequenza, in maniera tale da rendere possibile l'ispezione comparata. Abbiamo esaminato il primo, il quarto e il settimo frame, considerandoli rispettivamente il momento iniziale, centrale e finale dei due gesti articolatori. In alcuni dei casi presi in considerazione, la durata della vocale singola era troppo breve per poter estrarre sette frames (si veda ancora §2.4), perciò la comparazione del gesto è avvenuta sulla base di cinque frames. Di questi casi abbiamo esaminato il primo, il terzo e il quinto frame, considerandoli ancora una volta il momento iniziale, centrale e finale. Queste associazioni ci

(31)

hanno permesso di identificare analogie e differenze nell'evoluzione dei due gesti, pur consapevoli del fatto che i punti iniziale, centrale e finale di una vocale singola non sono gli stessi di una vocale ripetuta. A seguire, riportiamo le immagini ottenute per la coppia re vs ree del soggetto 4, basate su un numero di frames pari a cinque. Come si può notare, la radice della vocale singola e il dorso della vocale ripetuta sono maggiormente periferici durante tutta l'evoluzione del gesto articolatorio. Gli apici invece, da una posizione iniziale di maggior perifericità associata alle vocali ripetute, occupano posizioni simili alla fine del gesto:

FIGURA 2

Cinque frames relativi alle vocali [e] e [e:] nelle parole re e ree, pronunciate dal soggetto 4.

Per ognuno dei diversi momenti del gesto articolatorio (iniziale, centrale e finale) abbiamo osservato l'apice, il dorso e la radice dei due tipi di vocali (singola e ripetuta). Abbiamo segnato in quale caso si osservava una maggiore perifericità ('+' indica una maggior perifericità associata alle vocali singole, mentre '+' significa che vi è una maggior perifericità nelle vocali ripetute), o se entrambi i profili linguali apparivano simili tra di loro (caso contrassegnato dal simbolo '='). Il risultato di questo tipo di osservazioni è riportato nella Tabella 1:

(32)

TABELLA 1

Tabella raffigurante il giudizio assegnato in base alla maggiore o uguale perifericità.

I numeri si riferiscono a ognuno dei 13 casi presi in considerazione. Per comodità del lettore, li riportiamo in forma completa a segurire:

1 - Corte vs Coorte (Soggetto 2) 2 - Là vs Laa (Soggetto 2) 3 - Re vs Ree (Soggetto 2) 4 - Corte vs Coorte (Soggetto 3) 5 - Là vs Laa (Soggetto 3) 6 - Là vs Laa (Soggetto 4)

7 - Spinetta vs Lineetta (Soggetto 4) 8 - Re vs Ree (Soggetto 4)

9 - Corte vs Coorte (Soggetto 6) 10 - Là vs Laa (Soggetto 6)

11 - Spinetta vs Lineetta (Soggetto 6) 12 - Atri vs Patrii (Soggetto 6) 13 - Re vs Ree (Soggetto 6)

3.1.1 Tendenze articolatorie generali

Dalla Tabella 1 possiamo trarre alcune osservazioni preliminari da un punto di vista generale, relativamente ad ogni contrasto tra vocali singole e ripetute preso in considerazione.

(33)

Consideriamo, prima di tutto, ciò che accade nei frames iniziali, nei mediani e in quelli finali. Nei frames iniziali l'apice delle vocali singole è il più periferico nella grande maggioranza dei casi (10 casi su 13), il dorso pare invece essere maggiormente periferico nelle vocali ripetute (7 casi su 13), mentre la radice sembra indicare due risultati diversi: da una parte si presenta simile per entrambi i tipi di vocali (5 casi), mentre dall'altra risulta essere maggiormente periferica nelle vocali singole (5 casi). Passando ai frames centrali si può notare che l'apice delle vocali singole continua ad essere il più periferico, anche se in misura ridotta rispetto ai frames iniziali (8 casi), oltre a questo sono frequenti anche i casi in cui le due curve si presentano simili tra di loro (5 casi), mentre in nessun caso la maggior perifericità è stata associata alle vocali ripetute. Il dorso si presenta perlopiù simile per entrambi i tipi vocalici (7 casi), mentre la radice ancora una volta indica risultati divergenti. Infine, nei frames finali troviamo che l'apice ancora una volta risulta essere il più periferico per le vocali singole (6 casi), ma in altrettanti casi si presenta simile per entrambi i tipi vocalici. Il dorso riporta risultati diversi, con una leggera prevalenza di perifericità nelle vocali ripetute (5 casi), mentre la radice sembra indicare due possibili soluzioni: maggior perifericità delle vocali singole (6 casi), ma anche similarità per entrambi i tipi vocalici (5 casi).

Consideriamo adesso individualmente l'apice, il dorso e la radice durante l'evoluzione del gesto articolatorio.

Per quanto riguarda l'apice si osserva che inizialmente si ha una netta prevalenza di casi (10 in tutto) in cui esso è maggiormente periferico nelle vocali singole. Tali casi diminuiscono leggermente durante i frames centrali (8 in tutto) contemporaneamente all'aumento dei casi in cui le due curve appaiono simili tra di loro, che da due passano a cinque. Infine, i casi in cui la maggior perifericità apicale è associata alle vocali singole eguagliano quelli in cui c'è similarità di profili linguali (6 casi per ogni ricorrenza). Dai risultati ottenuti sembra dunque che l'apice sia maggiormente periferico per le vocali singole soprattutto durante la fase iniziale del gesto articolatorio, e che successivamente emergano due strategie articolatorie: quella di mantenere tale perifericità durante tutto il gesto (6 casi), oppure quella di farla decrescere a poco a poco fino a rendere il gesto simile a quello della corrispondente ripetuta (6 casi). Infine, appare rilevante il fatto che in quasi nessun caso la maggior perifericità sia stata associata alle vocali ripetute (2 casi su un totale di 39).

Per quanto riguarda il dorso e la radice, i risultati ci appariono più disordinati se comparati con quelli precedenti.

Riferimenti

Documenti correlati

Il rapporto tra i livelli serici e la dose di lamotrigina è risultato più basso durante la gravidanza e il parto che nel post-parto ed è stato diverso in una stessa paziente e tra

Un corpo di fabbrica, lungo 188 metri e alto 32, si aggancia al bastione est della Porta Tenaglia e prosegue rettilineo e parallelo a viale Pasubio, proteggendo dalla strada un

Through the connection of spatial and cultural transforma- tion, Buchanan’s contribution analyses Deidre Madden and Anne Haverty’s fictions, frames speculation as a parody of

The measurement and monitoring of basic performance parameters is discussed: ring radius resolution, ring centre resolution, single hit resolution and mean number of hits per ring..

Cercheremo di scoprire come sia possibile evidenziare analogie e similarità all’interno di un set di vocali adottando una prospettiva non-supervisionata, in cui cioè

Long, narrow gauge cannula (22), placed under ultrasound guidance in a good quality vein If needed for &gt;24. hours then ensure placement

secolo prima Paul Passy (1890, p. 225), il quale, a proposito dei ‘mutamenti combinatori’, indicava in generale l’abbassamento e l’apertura vocalica come

Every cyclic group is isomorphic to Z (zed, integers) or Z/mz (Integers modulo m) Z in a group with addiction. What