al ritmo di una varietà settentrionale di tedesco
In questo capitolo viene esposta la ricerca svolta, in cui è stato estratto l’indice CCI di Bertinetto & Bertini, descritto nel capitolo precedente, da alcuni dialoghi spontanei in lingua tedesca. L’indice è stato ottenuto da più parti d’enunciato appartenenti ad un corpus di parlato spontaneo contenente alcuni dialoghi nella variante settentrionale del tedesco standard. I risultati sono stati poi considerati, anche nell’ottica di una comparazione con l’italiano e di un inquadramento della lingua tedesca all’interno della collocazione delle diverse lingue sul piano elaborato tramite l’indice CCI.
Prima di considerare la ricerca svolta verranno descritte le caratteristiche della fonetica e fonologia del tedesco, e particolarmente gli aspetti che hanno influito nei diversi procedimenti adottati nel calcolare l’indice CCI, sia nell’ambito segmentale che in quello soprasegmentale.
Verrà poi descritto il materiale impiegato ed i metodi seguiti nello scegliere le parti e nell’applicare le formule tramite cui sono stati ottenuti gli indici CCI, spiegando i problemi che sono comparsi nel corso della ricerca. Come accennato sopra verranno poi riportati i risultati ed analizzati, comparandoli con quelli dell’italiano e d’altre lingue.
3.1. Cenni sulla fonetica e fonologia della lingua tedesca 3.1.1. Consonanti
La fonologia tedesca comprende 19 consonanti, che possono venire articolate in tre
luoghi, identificati ciascuno dall’articolatore attivo (le labbra e l’apice ed il dorso della
lingua). Inoltre, secondo il modo in cui gli organi entrano in contatto, le consonanti
tedesche possono essere occlusive, fricative, affricate, nasali, laterali, vibranti ed
approssimanti. I segmenti /h/, /j/ ed /r/ sono rispettivamente una fricativa glottidale,
un’approssimante palatale ed una – in realtà solo teoricamente – vibrante apicale e sono collocati in una parte a sé stante per il loro comportamento particolare.
labiali apicali dorsali
h j r Ostruenti
Occlusive p,b t,d k,g
Fricative f,v stretto: s,z
largo: ʃ,ʒ x
Sonoranti Nasali m n ŋ
Laterali l
Dove compaiono due suoni, il primo è forte e sordo, il secondo lene e sonoro; il tratto forte/lene riguarda l’energia articolatoria e la sonorità. In un suono forte la sonorità comincia dopo l’inizio del suono, mentre in un suono lene comincia con il suono stesso.
I suoni /h/ e /j/ vengono posti da Kohler (1995: 152) al di fuori della classificazione fonologica, poiché vengono definiti meglio tramite la loro occorrenza piuttosto che tramite i loro tratti distintivi. Il fonema /h/ si può trovare solamente all’inizio di morfema e non può comparire alla fine di una parola. Per quanto riguarda /j/, la distribuzione segue i medesimi criteri, ma è da aggiungere come siano state importate parole nel lessico tedesco che ammettono /j/ in nessi consonantici (come in Fjord
‘fiordo), dove normalmente non comparirebbe. Infine, ad /r/ corrispondono più foni, ed il loro numero rende impossibile assegnare ad esso determinati tratti fonologici, benché rientri, tuttavia, nelle sonoranti.
Kohler (1995: 153) individua tre classi distributive di consonanti, definite Ka, Kb e Kc, comprendenti rispettivamente le ostruenti, le sonoranti (compresa /r/) e /h/ e /j/. Ogni classe ha precise caratteristiche fonotattiche ed ammette la presenza di determinati altri suoni nel medesimo intervallo consonantico. La /v/ ha uno status particolare, in quanto può comparire dopo le ostruenti /ts/, /ʃ/ e /k/, dove le regole fonotattiche ammettono /m/
e /n/ (solamente dopo /ʃ/), /l/ ed /r/ (dopo /ʃ/ e /k/) e /j/ (in parole straniere dopo /k/).
Kohler (1995), pertanto, propone d’assegnare /v/ sia alla classe Ka che a quella Kc.
Nelle consonanti occlusive l’opposizione forte/lene è costituita, nell’ambito fonetico, dall’aspirazione delle occlusive forti, come ad esempio in tun ‘fare’, pronunciato [t
hu:n].
L’aspirazione ha poi una maggiore durata quando precede la vocale tonica. Quando la
consonante è preceduta da /s/ o da /ʃ/, l’aspirazione ha una durata minima, oppure è
assente, come in stehen ‘stare in piedi’. Se un suono è aspirato vuole dire che le pliche vocali non cominciano a muoversi immediatamente dopo il rilascio dell’articolazione, e nel momento compreso tra la fine dell’occlusione e l’attacco della sonorità vi è la fuoriuscita dell’aria, che dà luogo a [
h]. L’aspirazione ha inoltre durata maggiore dopo /t/, a cui seguono, nell’ordine, /k/ e /p/.
Le occlusive leni, all’inizio di morfema sono pronunciate nella prima parte sorde, ad esempio in Dorf ‘villaggio, paese’ [d̥ɔɐ̭f], ma non diventando un’occlusiva forte a causa della mancata aspirazione. Quando un’occlusiva lene viene a trovarsi alla fine di una sillaba diviene sorda, come in Weg [ve:k] ‘via’ e Feld [felt] ‘campo’. Rimane tuttavia un suono lene, non essendo aspirato.
Se il sollevamento del velo palatino e l’apertura della glottide avvengono, dopo una consonante nasale, prima che un’occlusiva od una fricativa vengano articolate, si forma un’occlusiva detta da Kohler (1995: 162) Sprosskonsonant (ted. Spross ‘germoglio’), che dipende dalla nasale precedente. Vengono aggiunte, così, [p] dopo /m/ (come in Gams ‘camoscio’, a volte pronunciato [gamps]), [t] dopo /n/, (come in Gans ‘anatra’, pronunciato [gants]), [k] dopo [ŋ] (come in Angst ‘paura’ pronunciato [aŋkst]), occlusiva labiodentale [p*] dopo [ɱ] (come in Senf ‘senape’, pronunciato [zɛɱp*f].
L’aggiunta di una consonante può avvenire anche dopo la laterale, come erhellst ‘II pers. sing. pres. di erhellen ‘rischiarare’’, che si viene così a confondere con erhältst ‘II pers. sing. pres. di erhalten ‘ricevere’’. Queste consonanti sono il risultato di uno spostamento nella coordinazione nei movimenti degli organi.
Può anche avvenire che ci sia la cancellazione di un’occlusiva preceduta da una nasale e seguita da un’altra consonante, come avviene, in alcuni casi, in Glanz ‘splendore’, pronunciato [glans]. Può venire cancellata anche l’occlusiva preceduta dalla laterale e seguita da /s/, come in erhältst, citato precedentemente, che viene pronunciato come erhellst. Come nelle consonanti aggiunte precedenti, anche qui la loro cancellazione deriva da un cambiamento nella sincronizzazione.
Alla fine di parole straniere, o d’origine straniera, ma integrate da molto tempo nel
lessico del tedesco, /v/ diventa sorda, come in aktiv [akˈtif], contrapposto ad Aktivität
[aktiviˈtɛt]. Inoltre, /f/ e /v/ sono le uniche fricative ad opporsi in inizio di parola, come
in finden ‘trovare’ ~ winden ‘intrecciare’.
Le fricative apicali /s/ e /z/ hanno contesti in parte complementari: la prima non compare all’inizio di morfema e la seconda non compare alla fine; le due fricative sono infatti rappresentate dal medesimo carattere -s-, quando la /s/ è in attacco di sillaba (ed anche alla fine di sillaba, dopo vocale lunga o dittongo) viene resa graficamente con -ß-.
La /x/ ha tre allofoni dipendenti dal contesto: [ç], dopo vocali anteriori e le consonanti /n, l, r/ ed in inizio di morfema (come nel diminutivo -chen); [χ] dopo /a(:)/ e [ɔ]; [x]
dopo [o:] ed /u(:)/.
Le affricate del tedesco sono /pf/, /ts/ e /tʃ/.
Questa ultima affricata non viene inserita nell’inventario da Kohler (1995: 167), tuttavia, a mio avviso, è da aggiungere anch’essa alle affricate del tedesco, per motivi legati alla storia della lingua ed alla fonotassi.
Storicamente, le affricate /pf/, /ts/ (e /kx/ delle varietà alemanne del tedesco) sono il risultato della seconda mutazione consonantica, che riguardò, tra il 500 ed il 1000, le occlusive delle varietà dell’alto-tedesco e venne compresa, poi, anche se non in maniera completa, all’interno del tedesco standard. Le affricate debbono tuttavia essere distinte, fonologicamente, dai nessi consonantici formati dall’incontro delle consonanti /p/ ed /f/, /t/ ed /s/ e /t/ e /ʃ/, benché abbiano il medesimo aspetto fonetico. Ad esempio, in Pfad
‘sentiero’ pf- è un’affricata, mentre in abfahren ‘partire’ [-pf-] si forma tramite l’incontro della -b (che diventa forte e perde la sonorità) del prefisso separabile ab- e la -f- della radice verbale; ganz ‘tutto’ contiene una affricata, mentre geht’s ‘va (impersonale)’ ha solo un incontro della -t della III persona singolare del verbo gehen e la ‘s del pronome neutro es; è presente infine un’affricata in tschilpen ‘cinguettare’ ed un incontro di consonanti in Ratschlag ‘consiglio’. L’inclusione del gruppo /tʃ/ nelle affricate è supportata dal fatto che, pur essendo piuttosto raro, nelle parole dove non derivi dall’incontro di un’occlusiva /t/ alla fine del primo morfema e di /ʃ/ appartenente al secondo, /tʃ/ è individuabile in parole provenienti da altre lingue, come in tschüß (it.
ciao), Gletscher ‘ghiacciaio’ (dal lat. glacies ‘ghiaccio’), Matsch ‘poltiglia’ (it. marcio) oppure in onomatopee, come in klatschen ‘battere le mani, applaudire’, quatschen
‘sciocchezze, fanghiglia’, platschen ‘sciabordare’, plätschern ‘gorgogliare’, ratschen
‘chiacchierare’, tratschen ‘spettegolare’. Più difficile da classificare, se come un solo
fonema o come due, -tsch in deutsch ‘tedesco’ e derivati, poiché deriva dall’antico alto
tedesco diutisc, formato dalla radice diut- ‘popolo’ e dal suffisso -isc (da cui -(i)sch),
ma i parlanti attuali non sono normalmente consapevoli di questa origine e percepiscono questa parola come formata da un morfema solamente.
Riporta Kohler (1995: 167) che Trubeckoy considera le affricate come un unico fonema per motivi fonotattici: il tedesco ammette, negli attacchi delle sillabe con due segmenti precedenti /l/, /r/ o /v/, oltre a /ʃpl/, /ʃpr/ e /ʃtr/, solamente /pfl/, /pfr/ e /tsv/, come in Pflanze ‘pianta’, Pfriem ‘lesina’ e Zwilling ‘gemello’; inoltre, nelle parole autoctone tedesche non sono tollerati nessi formati da occlusiva e fricativa, che sono sentiti, nelle parole che cominciano con questi gruppi di consonanti, come un elemento tipicamente straniero, come in Psalm ‘salmo’ e Xavier ‘Saverio’
1.
Tuttavia, Kohler (1995: 167) propende per una valutazione bifonematica delle affricate, poiché non ritiene che siano classificabili in maniera diversa /pf/ e /ts/ da /ʃp/ e /ʃt/, né che le parole che cominciano con /ps/ e /ks/ siano sentite di per sé straniere per la forma fonetica. Personalmente, però, ritengo che, pur non essendovi motivi particolarmente forti per considerare le affricate un unico fonema, esse lo siano prima di tutto per il fatto che storicamente derivano da singoli segmenti e come un’unica unità sono percepiti dai parlanti.
La consonante nasale dorsale /ŋ/ ha delle caratteristiche fonotattiche diverse dalle altre nasali /m/ ed /n/. Una parola non può cominciare con questo suono, che si oppone alle altre nasali davanti al confine di morfema, dove verrebbe inserita altrimenti una /g/.
Inoltre, il tedesco non ammette che vocali lunghe precedano /ŋ/. Questi due fatti possono essere spiegati tenendo presente che /ŋ/ deriva da un processo d’assimilazione ed elisione, in cui /n/, di fronte a /g/ diventa velare e /g/ scompare.
Tuttavia, Kohler (1995: 163) considera /ŋ/ un elemento a sé all’interno della fonologia della lingua tedesca, sulla scorta di come è comunemente percepita. Inoltre, non sempre -ng- dà /ŋ/, ma in alcuni casi viene pronunciato [ŋg], come nei composti angeben
‘dichiarare, stabilire, fissare’, Angabe ‘dichiarazione’ ed ungültig ‘non valido, nullo’, dove la -n- appartiene al prefisso e la -g- alla radice.
Si può, a mio avviso, includere il trattamento del nesso -ng- all’interno della questione più generale degli incontri di nasale ed occlusiva sonora, ossia -mb-, -nd- ed -ng-.
Diversamente da quanto avviene nell’italiano standard, si nota come in tedesco
1 Il toponimo Xanten, una città del Nordrhein-Westfalen, può essere ricondotto al basso-tedesco.
l’occlusiva venga ridotta ed assimilata; ciò avviene particolarmente nelle varietà settentrionali, dove -nd- diventa normalmente -nn-, come in anders ‘altro’, pronunciato più come anners. Peraltro è da notare che in diverse lingue scandinave questo passaggio è stato incluso nella fonologia, come si può vedere dal fatto che al tedesco anders corrisponde lo svedese annars. Questo si può interpretare come una prova del fatto che nel tedesco, ed anche nelle altre lingue germaniche, i nessi formati da nasale ed occlusiva vengono generalmente sottoposti ad un processo assimilatorio, in modo da ridurre il divario della sonorità tra due segmenti adiacenti. Ciò avviene anche in -ld- e - lg- tra due vocali e postonici, dove l’occlusiva viene notevolmente ridotta parallelamente, in alcuni casi, ad un allungamento della laterale, come in meldete, I e III persona singolare del verbo melden ‘annunciare’ e Folge ‘sequenza’, dove l’occlusiva viene pronunciata in una maniera più prossima ad una fricativa. Peraltro, anche in inglese, determinati incontri formati da -s- ed occlusiva vengono pronunciati assimilando quest’ultima al primo segmento, come in castle ‘castello’, pronunciato [kæsl̩]. Questi aspetti rispecchierebbero un bilanciamento nella sonorità, ottenuto tramite un processo compensatorio ed in alcuni casi assimilando il segmento con la sonorità minore. Nell’italiano, invece, nei nessi in questione l’occlusiva viene pronunciata normalmente e, secondo alcuni autori (ad esempio Bertinetto (1981)), si può parlare piuttosto di una semi-lunga: ciò costituisce un elemento della fonotassi nel quale l’italiano (e lo spagnolo) hanno un comportamento differente dal tedesco e dall’inglese, e che può venire riflesso anche nel ritmo.
Per quanto riguarda /r/, si deve prima di tutto distinguere i due contesti in cui si può trovare:
- in attacco di sillaba ed, in coda, intervocalico ed interno al morfema;
- in finale di morfema.
Nel primo contesto è presente all’interno dell’ambito linguistico tedesco un’ampia varietà d’allofoni, dipendenti dalle diverse varianti regionali ed anche dai singoli individui.
- La polivibrante apicale [r] è tipica del bavarese ed austriaco e dell’alemanno,
come anche dello Schleswig-Holstein, la regione tedesca più settentrionale, ed è
anche la variante che è considerata stilisticamente più elegante, ad esempio nel
teatro, anche se oggi il suo uso è fortemente ridotto, a vantaggio degli altri
allofoni (si veda Kohler (1995: 165); viene impiegata anche per dare enfasi ad una particolare parola (Raus!).
- La monovibrante apicale [ɾ] è presente nelle aree della [r] e rappresenta una sua variante.
- La vibrante uvulare [ʀ] compare soprattutto nelle aree della [r]; viene anch’essa impiegata per una maggiore enfasi.
- La fricativa uvulare sonora [ʁ] è l’allofono maggiormente impiegato, che sta prendendo piede nelle aree più a sud, soprattutto nelle città.
- La fricativa uvulare sorda [χ] è impiegata soprattutto come versione sorda della precedente, ad esempio dopo una consonante sorda, come in prallen ‘urtare’.
- La fricativa velare sonora [ɣ], soprattutto nel nesso gr-, come in grün ‘verde’.
- L’approssimante uvulare [ʁ̞] è, assieme alla fricativa sonora, la variante predominante.
Nel secondo contesto, la /r/ può corrispondere ad un vocoide. Tuttavia, nota Kohler (1995: 165), nelle aree dove la /r/ nel primo contesto, è pronunciata [r], anche nel secondo rimane una consonante, spesso perdendo la sonorità o, nella Renania, divenendo una fricativa, come in Dorf, pronunciato [dɔχf]. Normalmente, nelle regioni dove nel primo contesto /r/ è una fricativa od una approssimante, nel secondo contesto corrisponde ad un vocoide basso, che può venire identificato con il fono centrale basso [ɐ]. Quest’ultimo, dal momento che si trova dopo una vocale, diventa il glide di dittonghi formati, fonologicamente, da vocale seguita da /r/; quando la vocale è lunga, i dittonghi sono anch’essi lunghi. Esempi sono Heer [he:ɐ] ‘esercito’, hier [hi:ɐ] ‘qui’ e Dorf [dɔɐf] ‘paese’. Tramite la perdita dello schwa, vocale ridotta che corrisponde, tra l’altro, alla -e- del morfema del dativo -em e del morfema grammaticale
2-en, si può ottenere, particolarmente nelle parlate settentrionali, per ihrem, dativo di ihr ‘suo (di lei)’, [i: ɐm] e per anderem, dativo di andere ‘altro’ [an:ɐm], per anderen [an:ɐn] con - nd- > -nn-. Quando segue [a(:)] /r/ si fonde con la vocale dando [ɑ:], mentre quando è preceduta da /o/ forma la vocale lunga [ɒ:].
Prima delle vocali in sillaba priva d’attacco all’inizio di morfema e negli iati dove la seconda vocale è quella tonica (come in Beate) viene aggiunta, soprattutto a basse velocità e quando si vuole dare una maggiore enfasi, un’occlusiva glottidale. Questa
2 Il morfema -en può corrispondere, tra l’altro, all’infinito ed alla I e III persona plurali nei verbi, mentre, nei sostantivi ed aggettivi, al nominato od al dativo plurale.
non può essere inclusa nel sistema fonologico, in quanto non ha valore distintivo; al di là del fatto che venga pronunciata o meno, tuttavia, si può presupporre, a mio avviso, che essa sia presente nel programma articolatorio del parlante, anche se non come segmento consonantico alla pari degli altri, ma con uno status a sé, come un ‘modo’
d’articolare la vocale seguente. In alcuni casi l’occlusiva glottidale si trasforma in una pronuncia laringale della vocale, oppure non viene affatto pronunciata. Graefen &
Liedke (2008) notano come possa essere distinta una coppia minima dove l’occlusiva glottidale è l’elemento che differenzia le due parole: vereisen ‘ghiacciare’ (diviso in sillabe: ver-ˀei-sen), formato dal morfema derivativo ver- e da eisen, formato a sua da Eis ‘ghiaccio’ e dal morfema dell’infinito -en e verreisen (diviso in sillabe: ver-rei-sen)
‘andare, essere in viaggio’, composto dal morfema ver- e dal verbo reisen ‘viaggiare’.
La questione dell’occlusiva glottidale, così come altri aspetti della fonetica tedesca, mostra come sia rilevante il livello morfologico nel determinare certi comportamenti, tanto che il confine di morfema ha quasi lo stesso ruolo del confine di parola, come si può vedere anche per il nesso -ng e la pronuncia della -r dopo vocale.
3.1.2. Vocali
Il sistema delle vocali tedesche può essere suddiviso in monottonghi e dittonghi. I monottonghi comprendono vocali piene e ridotte.
Nel tedesco la quantità delle vocali piene è un tratto pertinente a livello fonologico:
tuttavia, per le vocali medie ed alte questa diviene, a livello fonetico, un’opposizione di tensione, dove le vocali lunghe sono pronunciate tese
3. Nella vocale bassa /a(:)/ può servire a distinguere la quantità solamente la durata del segmento, anche se, nel tedesco settentrionale, la /a/ viene articolata anteriormente rispetto alla /a:/. Nelle vocali anteriori è da aggiungere anche quella corrispondente alla -ä-, [ɛ(:)]/[æ(:)], la quale, però, ha una pronuncia distinta da /e(:)/ solamente in Baviera.
3 Per una valutazione dell’opportunità di considerare la qualità o la quantità come tratto rilevante fonologicamente si rimanda a Kohler (1995: 170). L’autore opta per il tratto di tensione come correlato sul piano della fonetica della quantità, pertinente fonologicamente.
Anteriori (non arrotondate)
Anteriori
(arrotondate) Centrali Posteriori
i, i: y, y: u, u: Alte
e, e: ø, ø: o, o: Medie
ɛ, ɛ:
a, a: Basse
La vocale ridotta schwa deriva dal processo tramite cui determinate vocali atone vengono ridotte, perdendo parte della durata e convergendo nel timbro in una centrale indistinta. Questo processo è tipico delle -e- atone, particolarmente in sillabe adiacenti rispetto a quella tonica, e pertanto di numerosi morfemi grammaticali e derivativi, sia prefissi, come ge-, che suffissi, come -e (nei verbi, I pers. sing.), -te (impiegati per formare il preterito nei verbi deboli), -et (per la III pers. singolare).
La vocale indistinta può venire ulteriormente ridotta, fondendosi con la consonante sonorante adiacente nell’ambito del medesimo morfema, se questa è preceduta a sua volta da una vocale. Nel morfema -en, impiegato per formare il plurale in sostantivi femminili e per l’infinito, lo schwa si va solitamente a fondere con la -n, che diventa il nucleo della sillaba, come in machen ‘fare’, pronunciato [ma:xn̩]. È da notare come alla inclusione della -e- nella -n corrisponda un forte allungamento della vocale della sillaba precedente, quasi come se il ‘peso’ di certe sillabe atone venisse concentrato su quella tonica, che è poi un fatto tipico delle lingue ‘accentuali’. Nel suffisso (derivativo deverbale e flessivo nominale per il plurale) -er, dove la -r ha una pronuncia vocalica, può avvenire l’elisione dello schwa, anche a causa del fatto che quest’ultimo e la [ɐ]
sono suoni molto vicini. La fusione con la -l è tipica del suffisso -el, con valore diminutivo, come in Mädel ‘fanciulla’.
L’inventario delle vocali tedesche comprende tre dittonghi discendenti, i quali
costituiscono tre elementi a sé all’interno del sistema fonologico e vengono considerati
(si veda Kohler (1995)) ciascuno come un solo segmento. Si nota una differenza nella
maniera in cui i dittonghi tedeschi vengono pronunciati, rispetto ai corrispondenti
italiani. In /ai/, /oi/ ed /au/ italiani sono maggiormente distinte le due parti del dittongo,
mentre in tedesco questo corrisponde piuttosto ad un movimento degli organi articolatori da un primo punto, rappresentato dalla prima parte del dittongo, ad un secondo, rappresentato dal glide, il quale, però, può non essere raggiunto, particolarmente nel parlato spontaneo; inoltre, in italiano le due componenti del dittongo sono maggiormente riconoscibili, mentre in tedesco queste sono meno nitide.
Vi sono inoltre alcuni, rari, dittonghi ascendenti, con il glide come primo elemento, presenti nel tedesco tramite diversi prestiti da lingue straniere. Essi sono formati dalle vocali alte rilassate anteriore [ɪ] o posteriore [ʊ] e da una qualsiasi vocale e possono, però, venire pronunciati anche come iati, oppure come [j]/[v] seguito dalla vocale.
Esempi sono speziell ‘speciale’ e Suada ‘profluvio di parole’.
Sono poi da aggiungere, a livello fonetico, i dittonghi discendenti formati da una vocale e dalla [ɐ] come glide citati sopra nella parte riguardante il trattamento della /r/
postvocalica.
3.1.3. La struttura della sillaba e la fonotassi
Come nota Kohler (1995), nella lingua tedesca la divisione in sillabe rispecchia prima di tutto la composizione delle parole, ed il confine delle sillabe coincide per lo più con il confine di morfema e di parole (nei composti). Ciò porta ad un’importante differenza rispetto all’italiano, dove la suddivisione in sillabe obbedisce quasi esclusivamente ad un principio fonetico, che può essere rappresentato dalla gerarchia di sonorità.
Di seguito è rappresentato (tratto da Kohler (1995:176)) il modo in cui i segmenti si possono combinare per andare a riempire le tre parti della sillaba, dove Ka, Kb e Kc sono le categorie in cui sono stati suddivisi precedentemente i segmenti consonantici.
Le diverse righe rappresentano le possibili alternative e gli elementi tra parentesi tonde possono comparire o meno e non modificano la struttura complessiva; le componenti precedute da ‘/’ sono separate da un confine di morfema.
Ka,b,c Ka,b (Ka) Ka Kb Kb Ka (Ka) Ka (/Ka)
Ka Kc V Kb Kb (Ka) /Ka (Ka)
Ka Ka
Attacco Nucleo Coda Coda
aggiuntiva
Nel tedesco sono possibili anche sillabe prive d’attacco, anche se, particolarmente nella pronuncia accurata e formale, o quando si vuole dare una maggiore enfasi, viene aggiunta un’occlusiva glottidale per formare un attacco: la presenza di questo fono, che non rientra nell’inventario fonologico, può essere predetta da una regola fonologica, anche se nell’eloquio spontaneo spesso non è concretamente pronunciata, sebbene si possa supporre che il parlante la comprenda mentalmente nei segmenti da articolare.
Nell’attacco più semplice, formato da una sola consonante, sono ammesse praticamente tutte le possibilità, tranne /s/ (tuttavia, nel tedesco parlato nel sud la s- viene pronunciata lene e sorda) e /ŋ/.
Nell’attacco (Ka)KaKb, il primo elemento, facoltativo, può essere solamente /s/ o /ʃ/, mentre il terzo elemento Kb non può essere una nasale, tranne quando il segmento precedente è un’occlusiva dorsale (come in Knie ‘ginocchio’ e nel toponimo Gmund) oppure nei prestiti, come in Tmesis ‘tmesi’. Il secondo elemento non può essere una affricata.
Nell’attacco KaKc, piuttosto raro, il secondo segmento può essere /j/, ma non /h/. Il fonema /v/ rientra in questo caso nel gruppo Kc, benché sia una ostruente, in quanto vi sono parole come Quelle ‘fonte’, schwer ‘difficile’ e Zwilling ‘gemello’ che hanno il nesso /kv/, /ʃ/ e /tsv/ in attacco. Vengono ammessi, però, solamente /k/, /ʃ/ e /ts/ come Ka.
Nell’attacco KaKa,b vengono inclusi nessi provenienti da parole d’origine straniera, come Psychologie ‘psicologia’, prevalentemente prestiti greci.
Si potrebbe ritenere che le parti consonantiche della sillaba abbiano una struttura
tripartita come quella della sillaba: un elemento centrale che viene riempito
necessariamente per primo ed altri due laterali, facoltativi. Le lingue avrebbero diversi
modi per riempire le parti laterali, ammettendo un numero più o meno ampio di
segmenti. Alcune lingue possono anche non ammettere nessun segmento in una parte
laterale, come ad esempio il giapponese, che non tollera più di una consonante
nell’attacco. Naturalmente, in certe lingue la presenza della coda stessa è fortemente
vincolata e talvolta questa parte non è ammessa. La realtà, tuttavia, non è così semplice,
in quanto numerosi sono i fattori che vanno ad influire sulla struttura della sillaba: si
presuppone, comunque, che esista un modello che permette di individuare gruppi di
lingue secondo la loro complessità fonotattica a partire dalle sillabe. Vi sarebbe, poi, un
contatto più stretto, all’interno delle componenti della sillaba, tra il segmento centrale ed il terzo nell’attacco e tra il segmento centrale ed il primo nella coda, che tra il segmento centrale e rispettivamente il primo e il terzo, ripetendo il modello della sillaba, dove esiste il livello della rima, distinta dall’attacco.
Per quanto riguarda la coda, di cui molte sillabe possono essere prive, nel caso più semplice, Ka,b, essa è composta da un’occlusiva od una fricativa, le quali diventano forti e sorde (fenomeno della Auslautsverhärtung), oppure da una consonante affricata o da una sonorante. Quando la coda è formata da due elementi, se il secondo è un’ostruente il primo può essere una sonorante (come in Amt ‘ufficio’, Dampf ‘vapore’
e Hilf- ‘soccorso’) oppure, se il secondo è un’occlusiva, il primo può essere anch’esso un’occlusiva (come in Abt ‘Abate’ ed in Magd ‘fanciulla’), oppure fricativa (oft
‘spesso’). La coda può essere poi composta da tre elementi: nasale, laterale, /r/ - ostruente - /t/, /ʃ/, /s/ (come in Pfingsten ‘Pentecoste’, Dienst ‘servizio’, Markt
‘mercato’).
La coda aggiuntiva può comprendere al massimo due consonanti ed ammette solamente /t/, /ts/ ed /s/; ad essa può corrispondere il morfema flessivo del genitivo -s e, nei verbi, della II persona singolare -st e della III persona singolare -t. In questi gruppo vengono anche incluse le componenti delle code di sillaba che sono precedute da un segmento occlusivo, come in Obst ‘frutta’.
Una prospettiva diversa sulla questione della sillaba proviene dalla nozione di ‘taglio
sillabico’ (Silbenschnitt), proposta da Sievers, per il quale sono due i modi per definire
le sillabe e stabilire il loro numero: la sillaba di sonorità, in tedesco Schallsilbe, che
corrisponde, nel nucleo, ad un massimo di sonorità, e la sillaba d’intensità, in tedesco
Drucksilbe, che coincide con un impulso, proveniente dalla pressione (in tedesco
Druck) polmonare, la quale si esaurisce nell’ambito della medesima sillaba. Queste due
sillabe coincidono in italiano, mentre in tedesco ciò non avviene sempre. Ad esempio,
alle ‘tutti’, contiene due sillabe di sonorità, al-le, ma una solamente d’intensità, che
comprende l’intera parola, in quanto la pressione, che ha il suo massimo in al- si
esaurisce con la seconda parte -le. Nella parola Ahle ‘lesina’ le sillabe d’intensità sono
due, poiché la spinta si esaurisce nell’ambito della prima vocale. Pertanto, la /a/ in alle è
detta ‘con taglio acuto’, o con un legame stretto rispetto alla consonante seguente (in
tedesco mit festem Anschluss), mentre la /a:/ in Ahle è detta ‘con taglio dolce’, o con legame sciolto
4.
La difficoltà di questa teoria è il fatto che non si è riusciti a trovare correlati fisici di questi due tipi di proprietà, ma è comunque una proposta molto interessante, che può aiutare a comprendere più chiaramente il ritmo della lingua tedesca, come anche del nederlandese e dell’inglese, soprattutto nel paragone con le lingue in cui sillaba di sonorità e di intensità coincidono. Questo aspetto, in aggiunta alla quantità ed alla qualità, può servire anche a comprendere come, a livello fonetico, si realizza la quantità delle vocali.
3.1.4. L’accento
Nella lingua tedesca le sillabe toniche vengono messe in risalto rispetto alle altre tramite una maggiore durata, un timbro più chiaro, una maggiore intensità ed un tono di solito maggiore (in alcuni casi può essere minore). Rispetto all’italiano, la sillaba tonica è fortemente prominente, risultando molto evidente all’interno del dominio dell’accento.
L’accento nelle parole tedesche può occupare sillabe diverse a seconda della loro morfologia. Nei termini semplici occupa di solito la penultima, ammesso che questa non sia una vocale ridotta e non formi uno iato con la vocale seguente. Nei sostantivi, sono prefissi accentati Erz-, Miß-, Un-, Ur-. I prefissi sono accentati, nei verbi, quando costituiscono anche parole a sé e, prima di sillabe atone i prefissi miß-, über- ed unter-. I suffissi accentati sono invece -isch e quelli d’origine latina o francese, come -(i)aner, - al, -ell, -ant(e), -ent(e), -ar, -ur, -at, -ität, -ion, -ie, -ier, -ist, -ei, mentre quelli atoni sono -heit, -keit, -schaft, -sam, -ig, -lich, -nis, -er, -in, -chen, -lein, -bar.
Inoltre, a causa della possibilità di formare parole composte, in quest’ultime vi è anche un accento secondario, o più d’uno, nei composti formati da più parole, che è l’accento della parola o delle parole che vengono subordinate. L’accento rappresenta così rapporti di dipendenza nell’ambito del composto, dove i diversi termini mantengono le proprietà della struttura temporale della singola parola, in quanto, ad esempio, le vocali lunghe delle parole subordinate rimangono della medesima quantità, mentre nei termini derivati le vocali atone che nella parola non derivata erano lunghe vengono accorciate. Oltre ai
4 Si rimanda a Maas (2002) e Restle (2003) e Vennemann (1991) per l’argomento.
composti con una parola dominante, ve ne sono altri dove i termini sono sullo stesso piano, come nei termini per i colori giustapposti, come in ‘blau’weiß ‘blu - bianco’.
3.1.5. Considerazioni sul ritmo in un’ottica comparativa tra tedesco ed italiano
Gli aspetti descritti fino ad ora vengono rispecchiati dal ritmo della lingua, il quale, come si mette in rilievo nel modello del controllo e compensazione, viene formato prima di tutto dalla struttura fonotattica. Il tedesco, rispetto all’italiano, permette incontri di consonanti più numerosi ed ammettendo consonanti del tipo Ka nelle code, è facile che, quando l’attacco seguente è costituito da una consonate del tipo Kb o Kc, l’attacco della seconda sillaba presenti una sonorità maggiore della coda della prima. La curva della sonorità ha così un andamento molto più irregolare nella lingua tedesca di quanto non lo sia nella lingua italiana, dal momento che nella prima sono numerosi i casi in cui non corrisponde alla tendenza secondo la quale l’attacco ha una sonorità maggiore della coda precedente. Ci si può attendere che i parlanti tedeschi operino determinate procedure compensatorie per rendere la frase facilmente pronunciabile, ad esempio aumentando o diminuendo la durata di certi segmenti, particolarmente nei nessi più ricchi.
Un altro elemento in cui il tedesco e l’italiano si comportano diversamente è la maggiore prominenza della sillaba tonica in tedesco, che porta a concentrare sui segmenti che la compongono gran parte delle energie in termini di durata, compressione polmonare e tensione degli organi, dedicandone una parte più ridotta alle altre. Ciò fa sì che in tedesco la vocale ridotta vada ad essere fusa con la consonante seguente, come in machen ‘fare’, haben ‘avere’ ed in Adel ‘nobile’, pronunciati [ma:xn̩], [ha:bm̩] e [a:dl̩].
Un terzo aspetto in cui il tedesco differisce fortemente dall’italiano, e che viene riflettuto dalla struttura ritmico-temporale, è la divisione in sillabe. Dal momento che in tedesco ciò dipende dalla morfologia, si può ritenere che questa unità prosodica abbia una maggiore irregolarità e ricopra un ruolo minore nell’ambito del ritmo linguistico, come conferma il fatto che il tedesco appartiene al gruppo stress-timed. In italiano, si può concepire la scansione in sillabe come una struttura che viene sovrapposta alla frase, in cui, secondo la loro sonorità, vengono disposti i segmenti.
Inoltre, in tedesco ha carattere distintivo la quantità delle vocali, mentre in italiano lo ha
la quantità delle consonanti. Tuttavia, a livello fonetico le vocali lunghe del tedesco non
sono la medesima cosa delle consonanti geminate italiane, in quanto, mentre quest’ultime sono pronunciate (almeno nelle varietà toscane e del centro-sud) chiaramente più lunghe e tese, le vocali lunghe del tedesco non hanno sempre una durata chiaramente più lunga.
3.2. Descrizione dell’esperimento 3.2.1. Materiali impiegati
Per l’applicazione del CCI alla lingua tedesca è stato impiegato il Corpus di Kiel, elaborato all’Institut für Phonetik und digitale Sprachverarbeitung (Istituto di fonetica ed elaborazione digitale del linguaggio) dell’Università di Kiel dal prof. Klaus Kohler e dai collaboratori Michael Scheffers e Benno Peters, nonché da alcuni studenti di fonetica della medesima Università. Il DVD contenente i materiali impiegati nel corso della ricerca è stato gentilmente concesso dal Prof. Klaus J. Kohler al Laboratorio di Linguistica della Scuola Normale Superiore, nei cui locali sono state svolte le diverse fasi della ricerca, sotto la supervisione del Prof. Pier Marco Bertinetto e della Dott.ssa Chiara Bertini.
Nella mia ricerca ho impiegato la parte del corpus chiamata ‘Lindenstrasse’. Essa consiste in una raccolta di sei dialoghi spontanei: in ognuno, due persone confrontano le due versioni di un filmato che hanno visto individualmente. Tutti i parlanti provengono dal Land dello Schleswig-Holstein e parlano tedesco standard, anche se con alcuni elementi caratteristici della pronuncia regionale del nord della Germania, come la tendenza all’assimilazione -nd- > -nn-, alla riduzione delle vocali atone e ad una generale riduzione nei segmenti (einmal viene pronunciato alcune volte eimma). Le registrazioni sono state effettuate nel corso del 2000. Questi dialoghi rappresentano una risorsa molto importante, non solo per chi voglia studiare vari aspetti della fonetica e fonologia tedesca, ma anche per studi sul linguaggio colloquiale e sulla conversazione.
Durante la registrazione, le due persone, che si conoscevano già, erano sedute in due
stanze diverse, silenziose ed insonorizzate e parlavano di un filmato che era stato fatto
loro vedere precedentemente, dove ciascuno aveva visto una versione leggermente
differente, confrontando pertanto ciò che avevano visto; esse non si potevano vedere e
comunicavano tramite il microfono e le cuffie. Vi sono quattro conversazioni (1-4) con parlanti femminili e due (5-6) con parlanti maschili.
Nella tabella seguente sono elencati i parlanti, con l’età, la professione e la durata dell’intera conversazione:
Dialogo Parlante Età Professione Durata (minuti)
1 CJE 28 studente
9:37
TEV 23 studente
2 AHA 22 studente
13:02
TLU 20 studente
3 APE 27 studente
10:03
KPA 32 designer
4 KTH 23 studente
9:23
CHE 23 studente
5 UHO 33 tecnico
15:27 JKO 31 commerciante 6 MPI 35 costruttore
navale 11:26 TRA 31 tecnico
Durata complessiva:
68:58
Il segnale è stato digitalizzato a 16 kHz direttamente su disco, dando luogo ad un file stereo per ogni dialogo ( _dual.wav); dal file stereo sono stati ottenuti due files mono, uno per ogni canale, che sono stati sommati dando luogo ad un file mono del dialogo ( _mono.wav).
Il DVD ‘Lindenstrasse’ contiene:
- file pdf di istruzione;
Per ogni dialogo:
- traslitterazione ( *.trl);
- registrazione su due canali (stereo) ( *_dual.wav);
- registrazione su un canale (*_mono.wav);
per ogni parlante:
- segnale completo del parlante (*.wav);
- etichettatura completa del parlante (*.s1h);
- etichettatura completa del parlante, in cui sono segnalati anche gli scambi di turno tra i parlanti (*.tur);
- banca dati del parlante (*.kdb);
per ogni sezione, dalla durata di circa 30 secondi:
- segnale acustico (*.wav);
- etichettatura, contenente la trascrizione ortografica, la trascrizione fonetica, l’etichettatura segmentale e prosodica e l’allineamento temporale per ogni etichetta (*.s1h);
- commento, contenente note riguardanti dettagli del registro, della velocità e degli aspetti soprasegmentali del volume e del tono, la qualità della voce, l’imitazione di un’altra voce, dialetto, ecc. ed altri problemi (*.kom).
I files con l’estensione .wav sono files audio, mentre gli altri possono essere elaborati come files di testo.
3.2.2. Svolgimento del lavoro
L’idea del lavoro era dapprima quella di considerare tutti i dialoghi, ma esigenze di tempo lo hanno impedito e la ricerca si è concentrata in un primo momento su due dialoghi: il n. 1, con due parlanti femminili, e il n. 5, con due parlanti maschili. Tuttavia, in entrambi i dialoghi i parlanti avevano una velocità d’elocuzione decisamente alta, ed è stato pertanto necessario, in un secondo tempo, importare delle porzioni d’enunciato più lente dai dialoghi 3 e 4, ambedue con parlanti femminili. Per questi dialoghi, ho curato la selezione e l’importazione delle parti nel foglio d’Excel e l’etichettatura, mentre la Dott.ssa Chiara Bertini ha calcolato l’indice.
La seguente tabella riporta, per ogni dialogo considerato, ed al suo interno per ogni parlante, il numero di porzioni d’enunciato, la durata complessiva e la velocità.
Porzioni Velocità media (segmenti/sec)
CJE 38 20,12 TEV 41 19,55
n.1 79 19,83
APE 10 20,99 KPA 6 18,42
n.3 16 19,71
KTH 16 17,74 CHE 10 18,86
n.4 26 18,30
UHO 33 18,70
JKO 27 21,52
n.5 60 20,11
Per ogni dialogo la ricerca si è articolata nelle fasi di:
- individuazione delle parti adatte;
- importazione della trascrizione fonetica nel foglio di calcolo;
- etichettatura;
- calcolo dell’indice CCI per le vocali e le consonanti.
3.2.2.1. Individuazione ed importazione delle parti d’enunciato su cui lavorare In un primo momento, ho individuato nella trascrizione di tutte le conversazioni sequenze che fossero comprensibili, senza pause, esitazioni e rumori vari, e che contenessero almeno otto sillabe, escludendo quelle dall’ultima sillaba accentata in poi, tranne il suo attacco, se presente, per evitare gli effetti dell’allungamento alla fine della frase. Inoltre, le sequenze dovevano appartenere alla medesima frase prosodica, in modo da evitare che contenessero rallentamenti dovuti ai confini frasali.
Non ho inoltre considerato ripetizioni di parole, routines discorsive (ad esempio «na ja», «na gut», «so»…), parole straniere (molto poche in realtà). Nell’individuare le sequenze da mettere nel calcolo ho impiegato sia le trascrizioni – dove sono annotati anche rumori, pause, false partenze – che le registrazioni. Queste ultime sono state importanti per stabilire se la punteggiatura della trascrizione rappresentava delle pause o rallentamenti nel parlato, oppure semplicemente un confine tra frasi all’interno del periodo, dal momento che le virgole sono obbligatorie nell’ortografia tedesca per segnalare il confine tra la frase principale e la subordinata, come in: Er sagt, dass er bald kommen wird ‘dice che verrà presto’, oppure in: Ich denke, es wird morgen regnen
‘penso che domani piova’. Pertanto, dal momento che la virgola può avere anche un valore puramente grammaticale – ad esempio prima delle congiunzioni subordinanti, che pur non essendo precedute foneticamente da una pausa, ortograficamente richiedono una virgola per separare la frase principale da quella secondaria – ho ascoltato attentamente le registrazioni, in modo da individuare quando le virgole segnalassero eventuali confini prosodici.
Per ogni dialogo ho copiato le trascrizioni ortografiche e le trascrizioni fonetiche delle
porzioni d’enunciato scelte in un file di testo assegnando a ciascuna un codice in cui le
prime tre lettere rappresentassero il parlante ed il numero identificasse la sezione
all’interno del dialogo, mentre un secondo numero, separato dal trattino basso ( _ ) identifica la singola parte.
Questa prima fase della ricerca ha richiesto assai tempo, a causa di dubbi sull’opportunità d’inserire alcune parti, dal momento che esse non erano facilmente comprensibili, essendo molto sostenuta la velocità in tutti i dialoghi.
Dopo aver scelto per ogni dialogo le parti adatte, ho proceduto alla loro importazione nel foglio di calcolo, per il quale ho impiegato lo stesso modello elaborato dalla Dott.ssa Chiara Bertini per la ricerca sull’italiano, strutturato come segue:
A annotazioni
B viene indicato se il segmento è una vocale o una consonante
C segmento (oppure etichette per fatti prosodici od altre informazioni, irrilevanti per la presente ricerca )
D tempo d’attacco del segmento E durata del segmento (in ms)
F durata del segmento, quando è una vocale G durata del segmento, quando è una consonante H colonna di separazione
I durata complessiva dell’intervallo vocalico
J numero di segmenti componenti l’intervallo vocalico K durata media dei segmenti dell’intervallo vocalico (=I/J) L durata complessiva dell’intervallo consonantico
M numero di segmenti componenti l’intervallo consonantico N durata media dei segmenti dell’intervallo consonantico O colonna di separazione
P durate medie dei segmenti vocalici in ogni intervallo (copiate dalla colonna K) Q valore assoluto delle differenze tra una durata media in un intervallo della colonna
P e la durata media di quello seguente R dà 1 per ogni durata della colonna P
S durate medie dei segmenti consonantici in ogni intervallo (copiate dalla colonna N) T valore assoluto delle differenze tra una durata media in un intervallo della colonna
S e la durata media di quello seguente U dà 1 per ogni durata della colonna S
Per ogni frase (o parte di frase) individuata è stata copiata nel foglio di calcolo la parte
della trascrizione fonetica corrispondente contenuta nei files etichettati .s1h, nei quali
per ogni segmento era riportato il tempo d’attacco in ottavi di decimillesimo di secondo.
Tramite la formula già inserita nella colonna E la durata del segmento diveniva subito visibile.
3.2.2.2. Etichettatura e calcolo dell’indice CCI
Ogni segmento è stato poi etichettato come consonante, con ‘c’, o come vocale, con ‘v’:
in seguito a ciò, veniva riportato, nelle colonne F e G, la durata del segmento rispettivamente se è una vocale od una consonante. Nelle celle I ed L (a seconda che i segmenti fossero vocali o consonanti) venivano sommate in maniera automatica le durate all’interno di un medesimo intervallo, nelle celle J ed M la formula dà il numero di segmenti per ogni intervallo e nelle celle K ed N viene effettuata la media delle durate segmentali all’interno dell’intervallo. Il file in cui ogni parte era trascritta foneticamente aveva, oltre ai segmenti, anche alcune sigle riguardanti fatti intonativi, poste nel confine tra una parola e l’altra. A causa della mia mancanza d’esperienza in questo tipo d’attività, per il primo dialogo ho mantenuto queste etichette, dovendo poi sommare le durate segmentali all’interno degli intervalli omogenei.
Il contenuto delle colonne K ed N è stato copiato poi nelle colonne P ed R e nelle colonne Q ed S, tramite una formula apposita, è stata calcolata la variazione della durata media tra i segmenti d’intervalli consecutivi.
Nelle colonne V e W, per ogni parte d’enunciato, vengono calcolati automaticamente:
interv V numero intervalli vocalici somma valori colonna R interv C numero intervalli consonantici somma valori colonna U
ΣV somma delle differenze tra intervalli vocalici contigui
somma valori colonna Q ΣC somma delle differenze tra intervalli consonantici
contigui
somma valori colonna T
Infine, nelle medesime colonne, viene calcolato l’indice CCI per le vocali e le consonanti della porzione:
CCI (v) Indice di Controllo e Compensazione per le vocali ΣV/10*(intervV-1)
CCI (c) Indice di Controllo e Compensazione per le consonanti ΣC/10*(intervC-1)
3.2.3. Diversi trattamenti
Nel calcolare l’indice di controllo e compensazione, le parti considerate potevano essere trattate in modi diversi, caratterizzati da una diversa etichettatura di determinati segmenti. Nel presente lavoro sono stati impiegati tre trattamenti, che qui verranno chiamati ‘trattamento profondo’, ‘fusioni’ ed ‘elisioni irregolari’.
- Trattamento ‘profondo’
Nel trattamento seguito in un primo momento si è cercato di rappresentare, etichettando le diverse parti, quello che i parlanti intendevano articolare, a livello di programma mentale, ed è stato pertanto denominato ‘profondo’, rappresentando la formazione del messaggio parlato come un processo in cui questo viene prima formato astrattamente ed emerge così in superficie, dopo eventuali trasformazioni. In questa prospettiva, così, è stato importante comprendere come considerare le elisioni, ossia i fonemi non pronunciati (ed inseriti comunque nella trascrizione): essi potevano corrispondere ad elisioni regolari, quando veniva impiegata una forma nella quale il fonema non pronunciato si era dileguato a causa di processi di mutamento della lingua, oppure ad elisioni irregolari, dovute, ad esempio, al bisogno di semplificare nessi complessi. In queste seconde elisioni, però, il segmento rimarrebbe comunque a livello mentale, e per questo è incluso nel calcolo. Parallelamente, le -e- atone fuse nella consonante seguente sono state comunque etichettate come vocali dalla durata nulla, venendo così ad inserire un intervallo vocalico all’interno dell’intervallo consonantico formato dalla consonante precedente e da quella seguente, che diventano due intervalli, come qui esemplificato per la parola machen ‘fare’, pronunciata [ma:xn̩]: nel trattamento che rispecchia di più l’aspetto fonetico, verrebbe etichettata come (c)(v)(cc) o eventualmente (c)(v)(c)(v), mentre nel trattamento ‘profondo’, e quindi più fonologico, come (c)(v)(c)(v)(c). Le due possibili etichettature a livello concreto sono dovute al fatto che la consonante sonorante nucleo di sillaba può essere vista sia come una consonante, attenendoci alle proprietà acustiche del suono in sé, che come una vocale, considerando il fatto che occupa il nucleo di una sillaba.
Un altro tipo particolare d’elisione è quello che riguarda la pronuncia della /r/
postvocalica come vocale: quando essa è preceduta da -e- viene fusa con quest’ultima,
mentre quando è preceduta dalle altre vocali forma in genere il glide di un dittongo
discendente, che è trattato qui come una singola vocale. Nel trattamento che considera il
livello fonologico, al segmento contenente la -r vocalizzata è stato aggiunto un fonema /r/ di durata nulla, etichettato come consonante. Così, la parola Mutter ‘madre’, pronunciata [mʊtɐ], verrebbe etichettata (c)(v)(c)(v) in un trattamento che sia aderente all’aspetto concreto, mentre nel trattamento profondo, aderente ad una prospettiva fonologica, verrebbe etichettata (c)(v)(c)(v)(c).
- Trattamento ‘fusioni’
Nel secondo trattamento, denominato ‘fusioni’, le -e- atone fuse nelle sonoranti non hanno ricevuto alcuna etichetta, non venendo considerate nel calcolo. La sonorante nucleo di sillaba ha mantenuto lo status di consonante. Quest’ultima è una scelta discutibile, in quanto sarebbe stato possibile anche etichettarla come vocale, come accennato sopra. L’etichettatura come consonante è più rivolta alle proprietà acustiche ed articolatorie del suono, mentre l’etichettatura come vocale è più attenta al fatto che, divenendo la sonorante un nucleo di sillaba, occupa il posto che spetta alle vocali, ed etichettarla come consonante non rispetterebbe la composizione della sillaba. È da notare, però, che una sonorante nucleo di sillaba non viene percepita alla pari delle altre consonanti: ciò vale a dire che una parola come Trst (‘Trieste’ in sloveno) ha qualcosa di diverso da parole come tast, test, tist, con il nucleo formato da una vocale. Mentre nella prima, infatti, l’aria trova un ostacolo nel fuoriuscire, in questo caso costituito dalla punta della lingua, che viene fatta vibrare, nelle seconde l’aria non ha alcun ostacolo e ciò si riflette nello spettrogramma in una struttura formantica precisa.
- Trattamento ‘elisioni irregolari’
È stato impiegato poi un’ulteriore trattamento per ottenere l’indice di controllo e compensazione, in cui i fonemi che non venivano pronunciati e che prima erano stati inclusi nel calcolo non stati considerati. Così, ad esempio, la parola wie(d)er ‘di nuovo’
[vi:ɐ] (dove non viene pronunciata la [d]), viene etichettata (c)(vv)(c), mentre nel trattamento ‘profondo’ era (c)(v)(c)(v)(c). In entrambi i casi è da notare come la /r/
vocalizzata sia inserita come fonema dalla durata nulla. Questo trattamento è stato
denominato pertanto ‘elisioni irregolari’.
Le assimilazioni non hanno ricevuto un trattamento particolare: una parola come anderen ‘altri’, pronunciata [an:ɐn], con l’assimilazione -nd->-nn-, viene etichettata (v)(cc)(v)(c)(v)(c) nel trattamento profondo, conformemente a come viene trascritta fonologicamente /anderen/, ed attenendoci all’aspetto superficiale, nel trattamento delle
‘fusioni’ (v)(cc)(v)(c).
In alternativa, le assimilazioni avrebbero potuto venire trattate come una singola consonante: ad esempio, la parola precedente sarebbe etichettata (v)(c)(v)(c)(v)(c) nel trattamento ‘profondo’ e (v)(c)(v)(c) nel trattamento delle ‘fusioni’. Ciò probabilmente non avrebbe portato grandi cambiamenti, in quanto avrebbe solamente fatto aumentare la durata media delle consonanti all’interno dell’intervallo. Non si può stabilire quale effetto l’inclusione delle consonanti assimilate in un solo segmento avrebbe avuto sull’indice CC, in quanto ciò dipende dagli intervalli adiacenti; tuttavia, si può dire approssimativamente che ridurre di una consonante rende il nesso più semplice ed una maggiore semplicità degli incontri di consonanti avvicinerebbe il tedesco al tipo detto ‘a controllo’. Contemporaneamente, le lingue ‘a controllo’ sono definite come quelle lingue dove in teoria ogni fonema riceve la medesima quantità d’energia, e pertanto, etichettare le consonanti assimilate come se questo mutamento non fosse avvenuto mette in luce il fatto che il fonema assimilato riceve un’energia articolatoria molto minore, che corrisponde poi alla durata ridotta, rispetto a quella che avrebbe isolatamente.
Un altro aspetto che non è stato considerato nell’etichettatura è stato quello della quantità delle vocali, dal momento che le vocali lunghe spesso non vengono pronunciate, concretamente più lunghe rispetto alle altre, come si è già visto nel descrivere l’inventario delle vocali della lingua tedeca. Potrebbe essere interessante, comunque, vedere come la struttura temporale rifletta la quantità.
3.2.3.1. Casi particolari e soluzioni adottate
Nella fase dell’etichettatura è stato necessario affrontare alcuni problemi, consistenti
nella mancata pronuncia di certi segmenti: questi venivano comunque segnalati nella
trascrizione con il segno ‘-’ ed avevano una durata nulla. Giacché si era scelto,
conformemente a quanto fatto anche per la ricerca sulla lingua italiana effettuata da
Bertinetto e Bertini, di considerare i bersagli fonematici del parlante, era importante potere comprendere se questa non pronuncia era il risultato di processi tipici del parlato ipoarticolato, che poteva eventualmente anche seguire delle caratteristiche regionali, oppure costituiva una forma contratta ormai tipica della lingua. Un esempio di quest’ultime è gibt’s ‘c’è’, da gibt es, come è anche sempre trascritto, con la vocale del pronome es segnalata come non pronunciata: tuttavia, si ritiene che un parlante tedesco che pronunci gibt’s intenda già nel costruire l’enunciato nella propria mente pronunciare /gibts/. Queste elisioni vengono qui chiamate ‘elisioni regolari’, poiché costituiscono delle varianti accettate dalla grammatica. Diversamente, un’elisione come quella della fricativa (resa con -ch) in doch ‘tuttavia’ si ritiene che derivi da una semplificazione tipica del parlato ipoarticolato. Queste vengono dette ‘elisioni irregolari’ e costituiscono, nell’ambito germanofono, un fenomeno tipico soprattutto delle parlate del nord della Germania, che sono connotate anche da una velocità d’eloquio di solito maggiore, che può anch’essa portare a processi di riduzione.
Accanto ai segmenti non pronunciati, nella ricerca si è scelto d’etichettare alcuni foni che hanno uno status difficile da stabilire nella fonetica e fonologia tedesche nella maniera seguente.
- L’occlusiva glottale prima delle vocali è stata etichettata come una vocale e non inserita nel numero di segmenti componenti l’intervallo vocalico; si è considerato pertanto questo suono come un modo di pronunciare la vocale.
Questo modo d’etichettare più aderente al livello della fonologia, però, non riflette il fatto che l’occlusiva glottale serve a ricostituire una sillaba con attacco, seguendo il modello più naturale.
- La durata dell’aspirazione, riportata sia dopo le occlusive forti che dopo quelle leni all’inizio di parola, è stata aggiunta a quella delle occlusive che la precedono, non considerandole nel numero di segmenti.
- Gli incontri di segmenti considerati come affricate sono /pf/, /ts/ e /tʃ/: dal
momento che nel file erano rappresentate le due componenti in maniera
separata, le durate sono state sommate ed è stato considerato ciascuno di questi
incontri come un solo segmento, a meno che le due parti non fossero di morfemi
o parole diverse.
- Le assimilazioni non sono state considerate: tuttavia, considerandole come un solo segmento verrebbe posto in rilievo il fatto che possono costituire un primo passo nel semplificare i nessi, riducendo il numero delle consonanti che li compongono. Ciò avrebbe portato l’indice CC ad essere troppo lontano dal lato teorico-mentale.
- Le consonanti aggiunte sono state etichettate come un segmento.
- La consonante /ŋ/ è stata considerata come un singolo segmento anche quando ad essa corrisponde graficamente -ng-, in linea con quanto afferma Kohler (1995).
- Le vocali lunghe sono state considerate come le altre, come anche le vocali ridotte, per evitare di complicare eccessivamente la ricerca. Mantenendo, però, un approccio che consideri i bersagli a livello mentale, il quale consideri comunque anche un eventuale programma temporale, l’alternativa sarebbe stata assegnare non 1 per ogni segmento, ma, ad esempio, 0,5 per le vocali ridotte ed 1,5 per quelle lunghe. Ciò avrebbe avuto, però, una troppo elevata arbitrarietà, in quanto non si può dire se una vocale ridotta venga veramente considerata come metà di una vocale normale.
- I dittonghi, tutti discendenti, sono stati considerati come gli altri segmenti, dal momento che il glide non era trascritto, nei documenti allegati al corpus, come un segmento a sé, probabilmente anche per il fatto che in tedesco è ancora più difficile distinguere chiaramente il punto in cui dalla vocale si passa al glide.
3.3. Risultati
Tenendo presente la seguente formula:
si nota che un mutamento sul piano segmentale, per incidere sul CCI ha bisogno d’attraversare le seguenti unità:
- Segmento
- Intervallo: può essere composto da uno o più segmenti ed è consonantico o
vocalico;
- Rapporto: tra la durata dell’intervallo ed il numero di segmenti che lo compongono (i fonemi, nel trattamento ‘profondo’);
- Differenza: rappresenta quanto varia la durata media di un segmento da un intervallo all’altro;
- Media: rappresenta quanto varia mediamente la durata di un segmento e corrisponde al CCI.
Un mutamento a livello segmentale, come ad esempio un’elisione, per venire riportata numericamente nel CCI, deve attraversare ben quattro passaggi: è difficile di conseguenza riuscire ad elaborare delle attese riguardo a come possa mutare il CCI in seguito ad un cambiamento od all’impiego di un diverso trattamento.
3.3.1. I trattamenti impiegati
3.3.1.1. Trattamento ‘profondo’
In un primo momento, l’indice è stato calcolato impiegando il trattamento ‘profondo’.
Questo modo di procedere ha il vantaggio di mettere in evidenza il fatto che determinate cancellazioni di fonemi possono essere in realtà il risultato di un processo di riduzione, più che d’elisione, e pertanto un tratto tipico delle lingue a compensazione, particolarmente per le vocali.
Le attese erano che il tedesco si collocasse, nel piano avente l’indice di controllo e compensazione per le vocali e per le consonanti rispettivamente come asse delle ascisse e delle ordinate, nella parte al di sotto della bisettrice, piuttosto distante da quest’ultima, Come si può vedere dai grafici, le parti considerate presentano una forte dispersione sul piano CCI(V)/CCI(C), ma, parallelamente, considerando tutti i parlanti della presente ricerca, la media tra le parti si colloca più o meno nel medesimo punto del grafico: il CCI(V) va da 3,31 a 4,03 ed il CCI(C) da 2,53 a 3,47, il rapporto tra i due da 1,21 ad 1,58, e ciò significa che il tedesco occupa la parte poco al di sotto della bisettrice. La durata delle consonanti oscilla maggiormente rispetto a quella delle vocali, anche se di poco.
Diversamente da quanto ci si aspettava, però, le parti in lingua tedesca si sono collocate attorno alla bisettrice e, anche se in maggior parte al di sotto, alcune erano al di sopra:
ciò ha portato a riformulare in maniera leggermente diversa l’ipotesi originaria,
affermando che le lingue a controllo si vanno a disporre nella parte del piano che
comprende l’area attorno alla bisettrice e quella al di sopra, mentre le lingue a compensazione occupano le aree attorno alla bisettrice ed al di sotto. Pertanto, l’area attorno alla bisettrice costituisce una regione in cui entrambe le categorie ritmiche convergono.
Il punto da cui parte il modello del controllo/compensazione è l’idea che la fonotassi costituisca l’aspetto primario che fa sì che una lingua appartenga ad una certa classe ritmica: una lingua con una fonotassi semplice tratterà in maniera omogenea i singoli segmenti, mentre una lingua con una fonotassi complessa distribuirà in maniera diversa l’energia articolatoria ai singoli fonemi, mettendone alcuni maggiormente in rilievo e riducendone altri. Si può ritenere che quest’ultimo gruppo di lingue si comporti in questo modo per ripristinare una struttura fonotattica più semplice, riducendo alcune consonanti. Tuttavia, può accadere anche che le riduzioni, quando riguardano le vocali, causino un aumento della complessità della fonotassi, poiché, quando una vocale viene ridotta fino ad avere una durata nulla, due intervalli consonantici si uniscono. Nel trattamento ‘profondo’, però, i due intervalli consonantici rimangono separati da quello vocalico con durata nulla: non risulta così un aumento della complessità della fonotassi, come invece verrebbe rispecchiato nel trattamento delle ‘fusioni’, bensì vi sarebbe un CCI(V) maggiore.
Chiaramente, la dispersione delle parti sul piano è dovuta prima di tutto alla diversa composizione delle frasi, le quali possono contenere parole formate da sillabe più o meno semplici; inoltre, anche aspetti della morfologia e della sintassi possono determinare in diversi modi la struttura temporale e quindi il ritmo. Tuttavia, venendo incluso un alto numero di frasi, il peso degli aspetti della lingua diversi da quelli prosodici è stato mitigato sicuramente.
3.3.1.2. Trattamento delle ‘fusioni’
In un secondo momento è stato impiegato
5il trattamento detto delle ‘fusioni’, in cui non venivano incluse nel calcolo le -e- fuse nelle sonoranti seguenti e le -r vocalizzate.
Per quanto riguarda la fusione delle -e-, ci si attende che ci sia un aumento del CCI(V), in quanto non sono più presenti alcuni intervalli di durata nulla e, contemporaneamente, un eventuale aumento del CCI(C), a causa della maggiore complessità del nesso
5 Questa parte della ricerca è stata effettuata dalla Dott.ssa Chiara Bertini, con l’impiego dell’applicazione RIE (Rhythmic Index Elaborator), sviluppata da Matias Ariel Taranto.