Composizione del vocabolario
6.1. Originali e semplificati: similarità e differenze.
L’analisi delle statistiche messe in luce dallo strumento di linguistica computazionale ha permesso di raccogliere una serie di caratteristiche che sicuramente sono ben distinte tra le versioni originali e le riscritture. Si può affermare che le caratteristiche di base (riguardanti la lunghezza della frase) e quelle sintattiche subiscono delle
94 modifiche tra le due tipologie. Le frasi sono più brevi, l’ipotassi diminuisce, in generale la struttura sintattica del periodo diminuisce la sua complessità.
Dal punto di vista invece morfosintattico e lessicale non sono state catturate eccessive differenze. Aumenta, nelle riscritture, il numero di vocaboli appartenenti al VdB, ma di poco; questo dato conferma quanto descritto nei capitoli iniziali a proposito del lessico dei testi specialistici, ossia che non può essere sostituito con lessico familiare, proprio per non perdere la sua caratteristica di documento tecnico.
La distribuzione delle catene morfosintattiche primarie, sostantivi, verbi e aggettivi, tra le due versioni, non subisce grosse modifiche. Un aspetto ancora non messo in evidenza, a proposito di complessità lessicale, è il rapporto tra i nomi e i verbi che, appunto, più è alto e più denota un testo poco leggibile. Nei moduli analizzati in questa tesi, sia gli originali che le versioni semplificate, il rapporto tra queste categorie morfosintattiche è alto.
MODULI Rapporto Nomi/Verbi
M218_Originale 2,44 M218_Semplificato 2,44 M98_Originale 2,11 M98_Semplificato 2,18 M86_Originale 1,79 M86_Semplificato 1,90
Tabella n. 19: Rapporto Nomi/Verbi
Ciò mette in luce il fatto che si tratti di testi altamente informativi (MONTEMAGNI: 2013) e, dato che il valore di questo rapporto in entrambe le tipologie è pressoché
95 uguale, è possibile dedurre che anche semplificando non sempre è possibile intervenire su questo aspetto.
96
CONCLUSIONI
L’idea di questa tesi è nata durante un tirocinio formativo di 150 ore presso il consorzio ICoN, Italian Culture On the Net, un consorzio di università italiane con lo scopo di promuovere e diffondere la cultura italiana nel mondo, attraverso il web e specifiche attività didattiche.
I risultati, mostrati nel capitolo finale di questa tesi, sebbene continuino a mostrare valori che rendono i testi in esame piuttosto difficili, presentano una situazione molto incoraggiante poiché, dopo gli interventi, le riscritture hanno mostrato un miglioramento su molti degli aspetti di complessità che rendono un testo poco leggibile. In particolare è molto migliorato l’aspetto che riguarda l’eccessiva lunghezza delle frasi e le conseguenze che lo snellimento o la divisione dei periodi porta con sé. Sono aumentate, infatti, le frasi principali in confronto a quelle subordinate, è aumentata la distribuzione delle congiunzioni coordinanti a scapito di quelle subordinanti, gli alberi sintattici sono meno profondi e i link di dipendenza e le catene di subordinazione si sono accorciati. Anche l’aspetto definito di base, cioè legato alle caratteristiche di lunghezza frasi e parole, è nettamente migliorato e ciò è riscontrabile anche dall’aumento dei valori dell’indice di Gulpease, che prende in considerazione proprio queste caratteristiche.
Per quanto riguarda l’aspetto lessicale non sono emerse grandi differenze tra i testi originali e le corrispondenti riscritture perché è il livello che è stato meno intaccato in fase di semplificazione. Il motivo è che, trattandosi di testi altamente specialistici, il lessico ricopre un ruolo determinante e quindi difficilmente sostituibile con una sua versione semplificata.
Sono state, inoltre, indagate differenze e similarità tra i testi originali e le riscritture per cercare, tramite la ricostruzione del profilo sintattico, di trovare aspetti che possano caratterizzare il genere accademico anche in versione semplificata. In questo senso è stato visto che i tratti costanti sono soprattutto quelli che riguardano il livello lessicale e morfosintattico, poiché la distribuzione di parole “facili” e delle categorie morfosintattiche primarie non varia molto tra le due tipologie.
In conclusione, alla luce di tutte le premesse e dei risultati raggiunti, si può affermare che le tecnologie linguistico-computazionali sono un valido aiuto nella valutazione
97 della leggibilità di testi. READ-IT, in particolare si è mostrato un efficace strumento per individuare i luoghi di complessità e poter, in questo modo, agire puntualmente sulle frasi dei testi ritenute poco accessibili.
Guardando al futuro, infine, un obiettivo interessante, e passo successivo di questa indagine preliminare, potrebbe essere quello di far valutare le riscritture da campioni differenti di apprendenti del corso di laurea in Lingua e Cultura Italiana per cogliere, eventualmente, un riscontro positivo. Sarebbe interessante, inoltre, procedere su diversi livelli di semplificazione, ad esempio insistendo, per ogni versione, su uno o più aspetti puntuali. Una volta ottenuto materiale sufficiente, semplificato per ogni aspetto di complessità, sottoporre le varie versioni a campioni di apprendenti potrebbe rivelarsi utile per vedere qual è l’aspetto di semplificazione più efficace nell’obiettivo della comprensione.
98
BIBLIOGRAFIA
ANDERSEN R. W. (1980) Creolization as the acquisition of a second language as a first Orientations in Creole Studies, New York, Academy Press. ATTARDI G., DELL’ORLETTA F., SIMI M., TURIAN J. (2009) Accurate Dependency Parsing with a Stacked Multilayer Perceptron. In: Evalita, 2009. BERRUTO G. (1990) Semplificazione linguistica e varietà sub-standard, in HOLTUS G., RADTKE E. (a cura di), Sprachlicher Substandard III, Standard: Substandard und Varietätenlinguistik, Tübingen, Niemeyer: 17-43. BERRUTO G. (2006) Corso elementare di linguistica generale, Torino, UTET
Università.
BRUNATO D., VENTURI G. (2014) Le tecnologie linguistico- computazionali nella misura della leggibilità di testi giuridici, rivista: Informatica e diritto, Edizioni Scientifiche Italiane. N. volume XXXIII, n. fascicolo: 1.
CHANG C., LIN C. (2001) LIBSVM: a library for support vector machines. Software disponibile all’indirizzo: http://www.csie.ntu.edu.tw/~cjlin/libsvm. CHRISTEN D. (2001) Un pensiero ben esposto, in Italiano e oltre (rivista),
Firenze, La Nuova Italia.
COPPOLA D. (2009) Comunicazione e processi di formazione. Un approccio interdisciplinare, Franco Angeli.
CORTELAZZO M. A. (1990) Lingue speciali. La dimensione verticale, Padova, Unipress.
DE MAURO T. (1980) Guida all'uso delle parole, Editori Riuniti.
DE MAURO T. (2000) Il dizionario della lingua italiana, Torino, Paravia. DELL’ORLETTA F. (2009) Ensemble System for Part-of-Speech tagging. In:
Evalita.
DELL’ORLETTA F., MONTEMAGNI S., VENTURI G. (2011) READ-IT: Assessing Readability of Italian Texts with a View to Text Simplification, in Proceedings of the Workshop on Speech and Language Processing for Assistive Technologies (SLPAT 2011), Edinburgh, July 30, pp. 73-83, http://aclweb.org/anthology/W/W11/W11-2308.pdf.
FIORITTO A. (a cura di) (1997) Manuale di Stile, Dipartimento della funzione pubblica, Bologna, il Mulino.
99 FLESCH R. (1949) The Art of Readable Writing, Harper & Row.
FRANCHINA V., VACCA R. (1986) Adaptation of Flesch readability index on a bilingual text written by the same author both in Italian and English languages. In Linguaggi (3), pp. 47–49.
FRATTER I, JAFRANCESCO E. (2003) Selezione, facilitazione e comprensione dei testi scritti e parlati nelle discipline di studio in ambito scolastico e accademico, in BOZZONE R., COSTA R, GRASSI A., VALENTINI A, (a cura di), L'italiano per lo studio nella scuola plurilingue: tra semplificazione e facilitazione, Perugia, Guerra.
HORMANN H. (1976) Psicolinguistica, Bologna, Il Mulino.
LAVINIO C. (2004) Comunicazione e linguaggi disciplinari. Per un'educazione linguistica traversale, Carocci.
LISCIA R. (2004) Osservatorio ANEE, E-learning stato dell’arte e prospettive di sviluppo, Milano, Apogeo.
LUCCHINI A. (2011) Acrobati di parole, Milano, Palestra della scrittura srl. LUCISANO I., PIEMONTESE M. E. (1988) GULPEASE: una formula per la
predizione della difficoltà dei testi in lingua italiana. In: Scuola e città, 3, 31, marzo 1988, La Nuova Italia.
LUMBELLI, L. (1989) Fenomenologia dello scrivere chiaro, Torino, Editori Riuniti.
MARINELLI R., BIAGINI L., BINDI R., GOGGI S., MONACHINI M., ORSOLINI P., PICCHI E., ROSSI S., CALZOLARI N., ZAMPOLLI A. (2003) The Italian PAROLE corpus: an overview, in A. Zampolli et al. (a cura di), “Computational Linguistics in Pisa”, XVI-XVII(1), Pisa-Roma, IEPI, pp. 401-421.
MILLER G. (1972) Linguaggio e comunicazione, trad. di SIMONE R., Firenze, La nuova Italia.
MONTEMAGNI S. (2013) Tecnologie linguistico-computazionali e monitoraggio della lingua italiana. In: Studi Italiani di Linguistica Teorica ed Applicata (SILTA) Anno XLII, Numero 1, pp. 145-172.
PIEMONTESE M.E. (1996) Capire e farsi capire, Teorie e tecniche della scrittura controllata, Napoli, Tecnodid.
100 SHUMANN J. H. (1974) The implications of interlanguage, pidgnization and creolization for the study of adult second language acquisition, in TESOL Quarterly.
SOBRERO A.A. (1997) Lingue speciali in Introduzione all’ italiano contemporaneo: le variazioni e gli usi, Roma, Laterza.
101
APPENDICE
Appendice A: Modulo M00095 (ORIGINALE): La lingua di Dante UD 1 - Lingua e letteratura a Firenze nell’età di Dante
1.1 - Lingua e letteratura in Italia alla metà del Duecento
Gli studi critici hanno riconosciuto da tempo che la lingua italiana si fonda storicamente sul fiorentino antico, in particolare sul modello dei sommi autori del Trecento: Dante, Petrarca [Fig.1] e Boccaccio. L’italiano standard dei giorni nostri, anche in virtù della codificazione grammaticale che muove a partire dal Cinquecento (promossa molto spesso da letterati non toscani), arricchito dal contributo di scrittori di tutta la penisola e con la vivacissima affermazione del parlato, che appartiene però solo all’ultimo secolo, poggia sulle strutture grammaticali del fiorentino dell’ultimo Duecento e del Trecento, sublimato e promosso ad altissimi livelli d’arte da quei tre grandi (le cosiddette "tre corone").
Molto meno scontata è invece un’altra realtà, dalla quale conviene prender le mosse per comprendere la straordinaria importanza di Dante nella nostra storia linguistica: all’epoca in cui visse Dante Alighieri (1265-1321), il fiorentino non era altro che uno dei tanti dialetti parlati nella penisola, quelli che designiamo come "volgari" (vedi il modulo Profilo di storia linguistica italiana: l’italiano delle origini, UD1) . Esso era già stato impiegato con fini artistici in poesia (molto meno in prosa), ma era ancora ben lontano dalla conquista di quel primato indiscusso di cui avrebbe goduto nei secoli successivi.
Negli anni intorno alla metà del XIII secolo, infatti, poteva vantare la più alta nobilitazione letteraria un altro volgare, il siciliano: raffinato e arricchito dal ricorso a elementi ripresi dal latino e dal provenzale, esso era stato lo strumento espressivo della prima scuola poetica italiana (vedi il modulo Profilo di storia linguistica italiana: unificazione, norma ed espansione dell’italiano, 6.1), fiorita intorno alla corte di Federico II di Svevia a partire dal terzo decennio del Duecento (ad essa diedero voce peraltro anche autori di altra provenienza regionale). Ma, ancora, esperienze di poesia didattica e moraleggiante si erano moltiplicate nell’Italia settentrionale; i primi saggi di prosa letteraria aveva tentato, nella prima metà del secolo, il bolognese Guido Faba, in un volgare locale impreziosito dalla presenza del latino; un importante filone di poesia religiosa stava prendendo corpo in Umbria, a cominciare dal celebre Cantico delle creature di San Francesco d’Assisi (consulta la biblioteca digitale), composto intorno al 1224-25.
1.2 - La situazione in Toscana
La Toscana non è assente dal panorama della neonata letteratura volgare in Italia (vedi il modulo La letteratura italiana del Medioevo, UD 3), tutt’altro: proprio in Toscana vediamo attivi, dalla metà del Duecento, i primi imitatori dei Siciliani: la poesia siciliana in Toscana venne conosciuta attraverso una serie di trascrizioni compiute da copisti locali, che alterarono in direzione toscaneggiante la lingua siciliana dei testi. Se non che, almeno sino alla generazione che precede quella di Dante, Firenze ha
102 nell’ambito dell’attività letteraria in Toscana una parte del tutto minoritaria; primeggiano piuttosto Lucca e Pisa, con le voci, rispettivamente, di Inghilfredi, Bonagiunta Orbicciani (più noto come Bonagiunta da Lucca, che ebbe parte decisiva nell’innestare in Toscana i modi siciliani) e di Galletto Pisano, Pucciandone Martelli, Tiberto Galiziani, con altri rappresentanti di quella che si suole designare scuola "siculo-toscana". Primeggia poi il centro letterario di Arezzo, dove Guittone (nato intorno al 1230; ed è la personalità letteraria forse più complessa e rilevante dell’età che precede Dante e il Dolce stil nuovo) dà corpo a una vasta produzione di Rime e a una poderosa raccolta di Lettere, in prosa.
Non si può dare qui conto dei caratteri linguistici di questa letteratura. Si dirà almeno, generalizzando entro una pluralità di esperienze relativamente eterogenee, che la lingua dei siculo-toscani è fortemente screziata di sicilianismi: per esempio i condizionali dei due tipi avria, vorria (= avrei/avrebbe e vorrei/vorrebbe), e amara, credera (= amerei, crederei); gli imperfetti indicativi in –ia: avia, volia (= aveva, voleva); i futuri in –aio e –aggio: ameraio, ameraggio (= amerò); le forme verbali saccio (= io so) e aggio (= io ho). Al prestigio del siciliano, ma anche a quello del latino e del provenzale, deve essere poi attribuita la presenza delle vocali semplici e o (con termine tecnico "monottonghi") in sillaba accentata (o "tonica") terminante per vocale: pensero, core, in contrasto con i dittonghi ie e uo (pensiero, cuore), che si erano invece affermati in Toscana; agli stessi influssi si deve il gradimento per l’altro dittongo au, variamente appoggiato dal latino (laude, laudare = lode, lodare), dal provenzale (augello = uccello), dal siciliano (aucidere = uccidere).
Assai rilevante anche nel lessico, accanto al latino, è l’influsso delle due grandi lingue di cultura dell’Europa letteraria: il provenzale, che già era stato il modello della poesia dei Siciliani, e il francese. "Gallicismi" correnti nella letteratura del Duecento (con questa designazione si è soliti accomunare voci di origine provenzale e francese, spesso non facilmente distinguibili) sono per esempio cera = viso, damaggio = danno, motto = parola, manto = molto, accanto ad altri destinati ad affermarsi in italiano: coraggio, malvagio, gabbare. Tipica di tutte le prime scuole poetiche è inoltre la frequenza di sostantivi con il suffisso -anza (-ansa nei toscano occidentali): amanza, orranza ( = onore), allegranza e altri numerosi, anch’essi da ricondurre a influsso del provenzale e del francese.
1.3 - L’affermazione di Firenze
In questo panorama, almeno sino ai primi anni dopo la metà del secolo, Firenze è assente. Anche dal punto di vista politico, del resto, l’affermazione di quella che sarebbe poi stata la capitale storica della regione, è tarda: esclusa dalle più dirette vie di comunicazione tra l’Italia settentrionale e Roma (che toccavano piuttosto Arezzo o Siena), soverchiata dalla potenza marinara di Pisa (e in passato, all’epoca della dominazione longobarda, il ruolo di capitale era spettato a Lucca), solo con gradualità Firenze acquista nel corso del Duecento un ruolo egemonico rispetto agli altri comuni toscani. Al periodo di conquiste intorno a metà secolo (presa di Volterra: 1254) segue il consolidamento del comune di Firenze come baluardo del guelfismo (vedi la voce guelfo), dopo il crollo degli Svevi (vedi la voce Hohenstaufen), alle battaglie di Benevento (1266) e Tagliacozzo (1268). Il vittorioso scontro nella piana di Campaldino (1289) (vedi la voce Campaldino (battaglia di)), al quale partecipa tra i reparti di cavalleria anche Dante Alighieri, sanziona la supremazia di Firenze sulla più
103 aspra concorrente in terra toscana, la ghibellina (vedi la voce ghibellino) Arezzo. Il dinamismo commerciale, l’intraprendenza economica e finanziaria dei mercanti e dei banchieri fiorentini, assicurarono poi negli ultimi decenni del XIII secolo a Firenze una posizione di prestigio economico e politico assoluto, in terra non solo toscana e italiana, ma internazionale (vedi la voce Firenze al tempo di Dante) .
1.4 - La letteratura fiorentina e la sua lingua
E di pari passo procede il prodigioso recupero, in letteratura, del ritardo iniziale. A Firenze, dagli anni intorno al 1255, convergono i risultati di tutte le principali esperienze, in prosa e soprattutto in versi. Qui confluiscono i testi della scuola siciliana, copiati, letti, imitati, e quelli della scuola siculo-toscana; qui prende corpo un filone di poesia, la cosiddetta lirica cortese fiorentina (sopra tutti sono i nomi di Chiaro Davanzati e Monte Andrea), che introduce alcuni tratti locali nel tessuto linguistico della tradizione: il dittongo in uomo, buono, tiene affianca per esempio, ma resta in larga minoranza, il monottongo di omo, bono e tene.
Siamo con questa scuola nella generazione che precede immediatamente quella di Dante. Ad essa appartiene inoltre un altro fiorentino, una singolare figura di verseggiatore: Rustico di Filippo (o Filippi), autore di 29 sonetti lirico-amorosi e di altrettanti sonetti di stile comico, che rovesciano i contenuti della lirica d’amore. Cantano i temi dell’amore carnale, del godimento della vita, e lanciano invettive violente. Rustico concede ampio spazio a un lessico realistico e crudo (puttana, rogna, cesso) e a tratti fonetici e morfologici municipali: il dittongo in uova, bestiuola; la riduzione di ai- ad a- in sillaba che precede l’accento (o "pretonica": per es. atare = aiutare); la consonante iniziale di boce (= voce); le desinenze in –aro per la terza persona plurale del presente indicativo (cascar = cascano) ecc.
Si ha notizia, tra le poche certezze intorno alla vita di Rustico, che egli fu in rapporti di amicizia con Brunetto Latini, il principale fra i maestri di Dante. Brunetto, che Dante collocherà nell’Inferno fra i sodomiti (i peccatori contro natura, Fig.1), è importante perché contribuì con i suoi volgarizzamenti dal latino e con opere didattiche e moraleggianti - ma la maggiore, il Tresor, fu stesa in francese - a consolidare l’uso del fiorentino anche nel settore della prosa, di una prosa con ambizioni artistiche. In sintesi osserviamo che anche in molta prosa del Duecento si coglie il forte influsso delle grandi lingue di cultura: il francese, il provenzale, con fitti apporti lessicali, e il latino, che incide soprattutto sugli andamenti sintattici e sull’ordine delle parole. Latineggianti sono per esempio la tendenza a privilegiare la subordinazione e la collocazione del verbo in posizione finale. Grazie a Brunetto e al contributo di altri scrittori (fra gli altri Bono Giamboni e l’anonimo autore del Novellino, che realizza un dettato molto semplice, con periodi brevi e preferenza per la coordinazione) la cultura fiorentina recupera così anche per gli impieghi prosastici il ritardo dei suoi esordi; essa affina il suo volgare e si pone come un centro alternativo a Bologna e soprattutto ad Arezzo, dove Guittone aveva dato con le sue Lettere l’esempio più rilevante di prosa volgare retoricamente impegnata (e si consideri che alla stessa città ci riconduce il più alto esempio di prosa scientifica del secondo Duecento, la Composizione del mondo di Ristoro d’Arezzo).
Si completa così per Firenze il quadro di una produzione letteraria tardiva nello scendere in campo ma, all’altezza della generazione di Dante, pressoché completa.
104 Autori fiorentini avevano ormai saggiato tutti i principali generi poetici, dalla lirica alla poesia didattica alle prove comico-realistiche, e si erano cimentati in prosa sia in scritture sollecitate da ambizioni artistiche e volontà di elaborazione retorica, sia nei generi più propriamente narrativi. Un pullulare di letterati e di esperienze che non era ancor tale, però, da garantire al fiorentino il primato linguistico rispetto agli altri volgari della penisola.
UD 2 - Il Dante delle esperienze giovanili