• Non ci sono risultati.

ARTICOLAZIONE INTERNA DELLA

5.1 Modulo M00095 “La lingua di Dante”

Il primo modulo preso in esame è quello che è risultato più complesso dall’analisi automatica (i cui risultati sono descritti nel capitolo 4). Il livello di analisi preso in considerazione per stabilire l’ordine di complessità dei moduli è stato il livello base, ovvero quello che indaga la lunghezza della frase e della parola (con attenzione maggiore sulla lunghezza della frase). In base a questo criterio, il modulo M00095 è risultato il più complesso, con le frasi lunghe in media 56,1 parole.

Il modulo è stato, in prima battuta, analizzato nella sua forma originale con READ-IT. Come spiegato nel paragrafo 2.2, è stata presa in considerazione solo la parte testuale eliminando, dalla valutazione, i titoli, i sottotitoli e le didascalie.

La seconda fase è stata condotta eliminando dal testo originale tutte le citazioni favorendo in questo modo un primo “snellimento” del testo. Un esempio tratto dal modulo:

È inoltre in fortissimo incremento, rispetto alle esperienze precedenti, l’enjambement, cioè la spezzatura, la dislocazione in due versi consecutivi di espressioni legate da forti vincoli sintattici, come se il singolo verso fosse insufficiente a ospitare l’urgenza dei sentimenti e richiedesse di essere dilatato in misure più ampie: "Fuggito è ogne augel che ‘l caldo segue / del paese d’Europa, che non perde / le sette stelle gelide" (Dante, Rime: 43, vv. 27-29).

72 Eliminando la citazione evidenziata, la frase è passata dall’essere lunga 71 parole a 47 parole. In tutto le citazioni eliminate sono 31.

Questo nuovo testo, privato dalle citazioni, è stato rivalutato con READ-IT. 5.1.1 Interventi sul modulo M00095

A proposito degli interventi, eseguiti valutando i risultati di READ-IT e quelli dell’analisi manuale, è doveroso ricordare che a proposito degli indici di leggibilità (v. capitolo 1) la leggibilità di un testo è influenzata da due variabili: la variabile sintattica e quella lessicale.

Per variabile sintattica si intende il numero medio di parole per frase: i testi, per essere leggibili, devono avere frasi brevi. (PIEMONTESE, 1996: 135). Per la lingua italiana, i testi sono altamente leggibili a persone con un’istruzione medio bassa se il numero medio di parole non supera le 20 unità. 10-15 parole, invece, dovrebbero comporre le frasi per testi ritenuti di altissima leggibilità da persone che, per varie ragioni, hanno necessità di facilitazione.

Un valore medio di 30 o più parole fa perdere chiarezza al testo, anche nel caso in cui sia destinato a lettori con istruzione media o medio-alta. Le frasi lunghe, infatti, sono tipicamente ricche di proposizioni subordinate e di incisi che distanziano gli elementi principali della frase.

Esempio tratto dal modulo M00095 (La lingua di Dante) redatto da Andrea Masini. L’italiano standard dei giorni nostri, anche in virtù della

codificazione grammaticale che muove a partire dal Cinquecento (promossa molto spesso da letterati non toscani), arricchito dal contributo di scrittori di tutta la penisola e con la vivacissima affermazione del parlato, che appartiene però solo all’ultimo secolo, poggia sulle strutture grammaticali del fiorentino dell’ultimo Duecento e del Trecento, sublimato e promosso ad altissimi livelli d’arte da quei tre grandi (le cosiddette "tre corone").

L’esempio mostra chiaramente ciò che è stato anticipato. Infatti, tra il soggetto L’italiano standard dei giorni nostri e il predicato verbale poggia sono interposte 41 parole di cui 7 compongono una frase parentetica e le restanti formano 3 subordinate (di cui una di secondo grado). È chiaro che l’esempio preso in considerazione

73 rappresenta un caso eccessivamente complesso, poiché la frase è composta da 72 parole, però risulta evidente che la lunghezza della frase è un elemento che può compromettere la leggibilità testuale.

Dopo questa fase di eliminazione delle citazioni sono stati eseguiti gli interventi di semplificazione. Il più incisivo fra tutti ha riguardato la lunghezza delle frasi, eccessiva ai fini della leggibilità.

Gli altri interventi, sulla base dei criteri di semplificazione, hanno riguardato oltre la lunghezza delle frasi:

- Lo scioglimento delle subordinate di livello superiore a 1 (conseguenza della riduzione della lunghezza della frase);

Basti qui dire dal punto di vista linguistico [PRINCIPALE] che il Fiore in particolare, la più corposa fra le due opere, si caratterizza per l’altissimo numero dei gallicismi, [SUB 1°], molti dei quali non attestati […] [SUB 2°], e molti altri, un po’ sospetti in un autore come Dante, [SUB 2°], che in tutte le sue opere è […]. [SUB 3°] > Dal punto di vista linguistico, il Fiore in particolare, la più corposa fra le due opere, si caratterizza per l’altissimo numero dei gallicismi. Molti di questi non sono neanche attestati nelle altre opere dantesche.

- L’eliminazione della forma negativa;

La Toscana non è assente dal panorama […] > La Toscana è presente nel panorama […];

Un quadro non dissimile ci offre per la Commedia […] > Un quadro simile ci offre per la Commedia […];

Analogamente ricorrono nella prosa contemporanea a Dante altri due tratti non infrequenti > Analogamente ricorrono nella prosa contemporanea a Dante altri due tratti frequenti;

- La riduzione di perifrasi;

[…] l’affermazione di quella che sarebbe poi stata la capitale storica della regione > […] l’affermazione di Firenze;

74 - L’eliminazione di espressioni idiomatiche;

In esso Dante pesca a piene mani […] > A esso Dante attinge molto […];

Dante semina a larghe mani nei tre sonetti della tenzone voci realistiche e quotidiane […] > Dante usa molto nei tre sonetti della tenzone voci realistiche e quotidiane […].

- La riduzione di frasi parentetiche e incidentali;

[…] che procurò intorno al 1355 un’imponente mole di manoscritti - un centinaio - frutto di una vera […] > […] che procurò intorno al 1355 un centinaio di manoscritti, frutto di una vera […];

[…] e procede con un ritmo ternario nel quale ogni rima, come si è visto, si ripete per tre volte > […] e procede con un ritmo ternario nel quale ogni rima si ripete per tre volte;

- L’eliminazione di espressioni retoriche (interrogative) e forme verbali in prima persona singolare o plurale.

[…] la straordinaria importanza di Dante nella nostra storia linguistica > […] la straordinaria importanza di Dante nella storia linguistica italiana; Questa immagine, che ci consegna […] > Questa immagine, che consegna. […] ma è del tutto probabile, possiamo dire certo, che […] > […] ma è del tutto probabile, anzi certo, che […].

- La limitazione di parole poco frequenti;

[…] nell’alveo della prosa letteraria fiorentina del Duecento > […] nell’ambito della prosa letteraria fiorentina del Duecento.

Prima di fare delle riflessioni sulla valutazione della leggibilità del testo riscritto in maniera semplificata è interessante vedere come lo strumento READ-IT recepisce a livello di frase le modifiche apportate al testo. Le due figure successive mostrano l’interfaccia grafica di READ-IT nella valutazione frase per frase. Come si può notare dagli indicatori cromatici, i vari livelli linguistici hanno subìto un forte miglioramento.

75 Escludendo il livello lessicale che è quello meno trattato in fase di semplificazione, gli altri livelli passano da un punteggio di complessità alto a uno nettamente più basso. La porzione di testo riportata nelle figure prende in esempio tre frasi nella versione originale. Ognuna di essa è molto lunga tant’è che il livello base ne risente molto. Migliora nettamente anche il livello sintattico.

Questo esempio, in particolare, mostra molti dei criteri di semplificazione su cui si basano tutti gli interventi. Innanzitutto la lunghezza della frase: da tre frasi si passa a otto, non rinunciando a nessun elemento contenutistico. L’ipotassi, poi, subisce un ridimensionamento, semplificando, per esempio sintagmi, come la poesia siciliana venne conosciuta attraverso una serie di trascrizioni compiute da copisti locali in la poesia siciliana venne conosciuta attraverso le trascrizioni di copisti locali. Il senso della frase rimane inalterato ma si elimina una subordinata (compiute da copisti locali). In questo esempio, tra l’altro, si elimina anche la forma passiva del verbo compiere riducendo ancora la complessità.

Un altro criterio esemplificato dalla porzione di testo è la sostituzione della forma negativa non è assente in è presente.

Seguono, infine, sostituzioni a livello lessicale, ad esempio la congiunzione con valore eccettuativo Se non che viene sostituito da Tuttavia, congiunzione di uguale significato ma composto da una sola parola e non tre; in direzione toscaneggiante viene sostituito con verso il toscano.

76

Figura n. 8 Proiezione sulla leggibilità del testo modulo semplificato

5.1.2 Analisi del modulo M00095 semplificato

I risultati delle tre analisi sono riportati nelle seguenti tabelle.

LIVELLO BASE ORIGINALE SENZA

CITAZIONI SEMPLIFICATO NUMERO FRASI 296 294 490 NUMERO TOKEN 16612 15332 14998 LUNG.MEDIA FRASE 56,1 52,1 30,6 LUNG.MEDIA PAROLA 5,1 5,2 5,2 GULPEASE 43,5 43,2 47,8

Tabella n. 6: Livello base + Gulpease

Tra il testo originale e il testo privato delle citazioni non risulta esserci una grande differenza a livello di leggibilità. Il numero di frasi è lo stesso (due frasi in meno nel testo senza citazioni); cambia ovviamente il numero delle parole che compongono il documento: il testo senza citazioni ha 1280 parole in meno. La lunghezza media della frase passa da 56,1 parole nell’originale a 52,1 parole. La vera differenza si nota nel terzo blocco testuale, quello semplificato. Il numero di token totali diminuisce rispetto al testo privato delle citazioni e rispetto all’originale (l’intervento sul testo è stato fatto

77 non sul modulo originale ma su quello senza citazioni); questo perché, sebbene non siano stati fatti interventi drastici sul contenuto, alcune informazioni ridondanti o ininfluenti sono state eliminate.

Il risultato più evidente è il numero di parole medio che compongono la frase, con un valore di 30,8 parole. Si tratta di un valore che READ-IT ancora considera complesso superando di 4 parole circa, il risultato medio per i testi di Repubblica, ma, considerato il punto di partenza, può essere considerato un valore positivo ai fini della semplificazione. Le successive tabelle mostrano infatti valori migliorati.

La lunghezza media della parola (poco influente in questa fase) resta inalterato, passando solo da 5,1 caratteri in media per parola del testo originale a 5,2 negli altri due documenti.

L’indice Gulpease risente di questo intervento alzandosi a 47,8 (più il valore è alto è più i testi sono leggibili).

La tabella 7 riporta i valori globali per i tre documenti.

LIVELLO