• Non ci sono risultati.

GLI INDICI DI LEGGIBILITÀ

Comando Polizia xxx

2.2 GLI INDICI DI LEGGIBILITÀ

Attualmente sono stati sviluppati dei metodi per calcolare il grado di difficoltà della leggibilità di un testo scritto: i cosiddetti indici di leggibilità. Un indice di leggibilità è una formula puramente matematica che, utilizzando dei calcoli di natura statistica, è in grado di predire la difficoltà di un testo rispetto alla capacità di comprensione del lettore.

I principali indici di leggibilità sono: – l'indice Flesch – Vacca;

– l'indice Gunning's Fog;

– l'indice Kincaid;

– l'indice Gulpease

– l'indice Read-it

Il primo indice fu ideato nel 1948 da Rudolf Flesch, uno scrittore austriaco con cittadinanza americana. Flesch ideò una formula matematica abbastanza semplice basata sulla lunghezza in sillabe delle parole e sulla lunghezza in parole delle frasi. Questo metodo, studiato per la lingua inglese, fu poi adattato per la lingua italiana da Roberto Vacca (da cui il nome). La formula Flesch – Vacca per la lingua italiana è:

206 – 0,65 S – W

dove 206 e 0,65 sono due costanti, S è il numero di sillabe per cento parole e W il numero medio di parole per frase su un campione di cento parole.

A seconda dei risultati che vanno da zero a cento, si ha la seguente scala di riferimento:

VALORE DIFFICOLTÀ DI LETTURA EDUCAZIONE SCOLASTICA

90 – 100 80 – 90 70 – 80 60 – 70 50 – 60 30 – 50 0 – 30 Molto semplice Semplice Abbastanza semplice Normale Abbastanza difficile Difficile Molto difficile

Inferiore alla scuola elementare Scuola elementare

Inferiore alla scuola media Scuola media

Diploma di maturità Laurea di base

Ho preso in esame un verbale di S.I.T. e ho applicato l'indice Flesch-Vacca. Il risultato che ne è derivato è 38, quindi un testo difficile per quanto riguarda la leggibilità, adatto per lettori che abbiano conseguito almeno una laurea di base.

L'indice Gunning's Fog è una derivazione dell'indice Flesch e misura il numero minino di anni di istruzione necessari per comprendere un testo scritto. Questo indice è stato ideato nel 1952 e la sua formula è:

0,4 x (numero medio di parole per frase + percentuale di parole difficili contenute in una frase). Ricordo che il numero medio di parole per frase si calcola con numero di parole/numero di frasi e la percentuale di parole difficili contenute in una frase si calcola con numero di parole difficili/numero di parole x 100. Preciso inoltre che questo indice considera le parole “difficili” quelle con più di due sillabe. L'indice Fog viene usato generalmente per testi non particolarmente lunghi e di scrittura in ambito professionale. I testi che sono concepiti per avere un vasto pubblico richiedono un indice Fog minore di 12 punti. I risultati oltre 17 vanno riportati come 17 e indicano un livello post-laurea mentre i testi che richiedono una comprensione pressoché universale generalmente richiedono un indice minore di 8 punti. In questo lavoro ho calcolato l'indice Fog per lo stesso campione utilizzato precedentemente e ne è risultato 15,9. Deduco, quindi, che per la comprensione dei verbali delle forze di polizia occorre che il lettore abbia almeno un titolo di studio corrispondente alla laurea triennale.

Anche l'indice Kincaid indica gli anni approssimativi di scuola necessari per comprendere il testo. La sua formula è:

(0,39 x W) + (11,8 x S) – 15,59

La scala dei risultati va da 0 a 12, ricordando che i numeri negativi vengono considerati come 0 e i numeri oltre 12 vengono riportati come 12. Per valori compresi tra 6 e 10 il testo può essere compreso con facilità dalla maggior parte delle persone mentre i documenti “tecnici” hanno generalmente un valore superiore a 10. Il campione che ho esaminato ha riportato il risultato 14 (da considerare sempre 12), quindi il lettore per comprendere il testo deve avere un elevato grado d'istruzione.

A differenza dei tre precedenti indici, l'indice Gulpease è stato ideato dal gruppo GULP1 sulla base della lingua italiana e non sulla lingua inglese. La sua formula è:

89 – LP/10 + FR x 3

dove LP = numero lettere x 100 / totale parole e FR = numero frasi x 100 / totale parole

Questo indice prevede una scala che va da 0 a 100: i lettori che hanno un’istruzione elementare leggono facilmente i testi che presentano un indice superiore a 80, i lettori che hanno un’istruzione media leggono facilmente i testi che presentano un indice superiore a 60 mentre i lettori che hanno un’istruzione superiore leggono facilmente i testi che

presentano un indice superiore a 40. Ho calcolato questo indice sul campione che ho preso in esame: il risultato che ne è derivato è 44. Un verbale con indice Gulpease 38 risulta molto difficile per un lettore con la licenza media e contestualmente di media difficoltà per un lettore con diploma di scuola superiore.

Infine, voglio illustrare il più recente indice di leggibilità denominato Read-it, studiato appositamente per la lingua italiana e basato su strumenti di Trattamento Automatico del Linguaggio. A differenza degli indici Flesch-Kincaid e Gulpease, questo tipo di indice non si basa unicamente su caratteristiche generali e formali del testo come la lunghezza della frase e la lunghezza delle parole, ma utilizza parametri più complessi che sembravano essere irraggiungibili se non attraverso un minuzioso lavoro manuale. L'indice Read-it è stato sviluppato dall'Italian Natural Language Processing Laboratory (ItaliaNLP Lab) dell'Istituto di Linguistica Computazionale (ILC) “Antonio Zampolli” del Centro Nazionale delle Ricerche (CNR) di Pisa, ed è stato concepito anche per fornire un supporto alla redazione semplificata di un testo attraverso l'identificazione dei suoi ambiti di complessità. Il Read-it permette di calcolare la leggibilità dei testi dei quali il corpus è composto classificandoli come testi di facile o difficile lettura. In pratica, un classificatore statistico associa i testi introdotti a due classi di lettura stabilite a priori: la prima classe è formata da testi tratti dal corpus Due Parole2, la seconda classe da testi tratti dal corpus La Repubblica (corpus considerato di difficile lettura). L'appartenenza a una delle due classi è stabilita sul grado di similarità tra la distribuzione di alcune delle caratteristiche monitorate: la ricchezza lessicale, la lunghezza delle relazioni di dipendenza, lunghezza di sequenze di componenti preposizionali modificatori di teste nominali, ecc. (Brunato – Venturi 2016 : 131).

Una peculiarità innovativa di Read-it consiste nella valutazione della leggibilità basata su due livelli: sia la singola frase che un intero documento. Intendo soffermarmi sul secondo livello sottoponendo all'applicativo demo disponibile in rete3 una parte del corpus che ho preso in esame. Una volta che gli strumenti di Trattamento Automatico del Linguaggio hanno analizzato linguisticamente il testo in input, è possibile visualizzare i risultati del calcolo della leggibilità nella scheda Analisi globale della leggibilità. Riporto qui di seguito i risultati ottenuti:

2 Due Parole = un giornale scritto con una lingua giornalistica volutamente semplificata per essere

compresa da persone con un basso livello di scolarizzazione o con disabilità cognitive (Brunato – Venturi 2016 : 131)

Il Read-it, oltre al calcolo del valore Gulpease, conduce una valutazione globale della leggibilità del testo rispetto a quattro diversi indici calcolati sulla base d quattro diversi criteri:

– BASE : in questo indice, le caratteristiche considerate sono quelle utilizzate nelle misure tradizionali della leggibilità di un testo (cioè la lunghezza della frase e la lunghezza delle parole);

– LESSICALE : si focalizza sulle caratteristiche lessicali del testo (cioè la composizione del vocabolario e la sua ricchezza lessicale);

– SINTATTICO : si basa su informazioni di tipo grammaticale come la combinazione

di tratti morfosintattici e sintattici;

– GLOBALE : è il risultato della combinazione di tutti i tratti considerati dagli altri modelli.

Per ogni indice, la percentuale esprime il livello di difficoltà: espresso in altri termini, la percentuale di probabilità di appartenenza del testo in esame alla classe dei testi di difficile leggibilità. I punteggi di leggibilità di Read-it vanno dunque da 0 a 100, più il valore percentuale è basso, più il testo esaminato è semplice. La barra posta a fianco di ogni valore

esprime visivamente questo valore, dove il rosso rappresenta la probabilità di appartenenza alla classe dei testi difficili e il verde a quelli di facile lettura.

Nel corpus sottoposto a esame, l'indice globale ha un valore di difficoltà di lettura del 100%. A differenza del punteggio di leggibilità Gulpease, pari al 52,5%, Read-it fornisce un punteggio diverso a seconda del modello di calcolo della leggibilità considerato. Rispetto, ad esempio, all'indice base, il corpus considerato si rivela non eccessivamente complicato, con un livello di difficoltà pari al 45%; analogamente, anche sulla base del livello lessicale, il corpus risulta semplice (11,1%) rispetto al modello globale basato sull'intero insieme di caratteristiche linguistiche. Quest'ultimo risultato è presto motivato: il corpus dei verbali che ho sottoposto a analisi presenta alcuni termini (burocratici) che sono spesso ricorrenti e che quindi vengono ripetuti nel testo all'interno di formule fisse e stereotipate (che tratterò in questo stesso capitolo). I predetti risultati che possono trarre in inganno, vengono, infatti, immediatamente smentiti con l'indice sintattico che è pari al 99,3% e con l'indice globale al 100%.

Entrando più nello specifico, se consideriamo i tratti della ricostruzione del Profilo di base, notiamo che il corpus analizzato presenta frasi con una lunghezza media pari a 19,1 token per frase, una lunghezza che si avvicina molto a quella dei testi di facile lettura. Anche per questo risultato, la difficoltà non riguarda tanto la lunghezza della frase quanto la quantità di informazioni contenute all'interno della frase stessa.

L'applicativo Read-it fornisce, inoltre, una serie di informazioni utili per valutare la leggibilità di un testo. Riporto di seguito i risultati ottenuti:

2.3 LE PROPOSIZIONI

Esistono diversi approcci importanti nelle scelte di costruzione del periodo. Dal punto di vista sintattico, le varie proposizioni possono essere coordinate e subordinate. La parola coordinazione deriva dal latino co-ordinatio che significa “ordine sullo stesso piano” mentre la parola subordinazione deriva dal latino sub-ordinatio che significa “sotto ordine”. Quindi, sempre rimanendo da un punto di vista esclusivamente sintattico, quando due proposizioni sono del tutto autosufficienti o messe sulle stesso piano gerarchico, abbiamo la coordinazione; diversamente, quando una proposizione dipende dall'altra, abbiamo la subordinazione.

Il legame tra le proposizioni di una frase incide notevolmente sulla comprensione di un testo. La frase complessa fondata su rapporti di subordinazione conferisce una struttura orizzontale e gerarchizzata, mentre la frase complessa fondata su rapporti di coordinazione conferisce una struttura orizzontale, disponendo le proposizioni coordinate sullo stesso piano l'una accanto all'altra.

Dal punto di vista logico-semantico, non vi sono suggerimenti utili per indicare di utilizzare l'uno o l'altro tipo (Pellegrino – Cortelazzo 2003 : 79) Le proposizioni coordinate sembrano, però, meno problematiche sul piano della comprensione, in quanto queste sono sintatticamente e semanticamente autonome, cioè sono frasi dotate di senso proprio e compiuto. A conferma di ciò, voglio far riferimento su come il funzionamento del linguaggio contribuisce a manifestare le caratteristiche generali della mente. Noi esseri umani abbiamo due tipi di memoria. La prima è la memoria a lungo termine (MLT) che immagazzina tutto ciò che “sappiamo”: nomi, volti, numeri, immagini, luoghi, nozioni, strade, ecc. e contiene svariate informazioni a cui non stiamo pensando. La seconda è la memoria a breve termine (MBT), cioè una memoria che contiene in ogni momento l'informazione “attiva” (i concetti a cui stiamo pensando e che stiamo mettendo in funzione). Quest'ultima è una memoria “volatile”, proprio come la ram di un computer, ciò che contiene viene continuamente rimpiazzato da qualcos'altro, seguendo il corso dei nostri pensieri. Il motivo per cui l'informazione non rimane a lungo nella MBT risiede nella sua capienza molto limitata e ricerche specifiche hanno dimostrato la sua capacità di contenere circa sette informazioni per volta (più o meno 2). Facendo dei test su molti soggetti, si è visto che tutti ricordano senza problemi sequenze fino a cinque, sei o sette elementi. Oltre questi valori le prestazioni delle persone sottoposte ai test peggiorano, e il peggioramento avviene in maniera drastica e non progressiva (Lombardi Vallauri 2007 : 221).

Detto ciò, un testo contenente un elevato numero di proposizioni subordinate rende la lettura più difficile rispetto ad un testo con prevalente presenza di coordinate: quest'ultime, avendo un senso autonomo e compiuto, danno la possibilità al lettore di “archiviare” l'informazione assimilata e di procedere progressivamente con la lettura. Le proposizioni subordinate, invece, gerarchizzano le informazioni che si incastrano l'una con l'altra, rendendo una o più proposizioni indispensabili per poter capire il concetto

che si sta leggendo.

Da un attento esame del corpus che ho considerato, emerge che le proposizioni coordinate sono preferite nel narrare una sequenza di fatti, mentre le subordinate sono usate nei riferimenti normativi. Questo è un fenomeno anche abbastanza naturale in quanto le proposizioni coordinate si prestano bene all'esposizione progressiva di azioni presentate in ordine cronologico. Riporto un esempio di una sequenza di proposizioni coordinate tratto da un verbale di denuncia di rapina:

(2) …... si avvicinava un signore a piedi, mi sferrava diversi calci sulla gamba destra, mi colpiva sullo sterno con un pugno e mi strappava una collana d'oro ...

Per quanto riguarda l'utilizzo di proposizioni subordinate che rendono difficoltosa la lettura e la comprensione del testo, propongo il seguente esempio tratto da un verbale di identificazione, elezione di domicilio e nomina di difensore. In questo caso, oltre all'eccessiva lunghezza della frase che impedisce di seguire il filo del discorso, la proposizione principale si trova solo alla fine:

(3) Invitato a dichiarare od eleggere domicilio a norma dell'art. 161 c. 1-2 C.P.P., con l'avvertenza che ha l'obbligo di comunicare ogni mutamento del domicilio dichiarato od eletto e che in mancanza, di insufficienza o di rifiuto di eleggere domicilio, le notificazioni saranno eseguite mediante consegna al difensore, lo stesso dichiara di eleggere domicilio presso lo studio dell'avv...,

Le strutture sintattiche che ho preso in esame rivelano abbastanza alto il numero delle presenze di enunciati monoproposizionali. Ma quando si tratta di inserire nel discorso l'enunciazione di circostanze accessorie, la tentazione della subordinazione a oltranza sembra non trovare resistenze. L'abitudine a esprimere con incastri di subordinate la densità e la tortuosità delle precisazioni relative alle varietà delle situazioni possibili persiste nel tempo.

Vorrei fornire delle delucidazioni in merito alla definizione di paratassi e ipotassi. Parlando di coordinazione e subordinazione si prende in considerazione il rapporto tra le proposizioni; parlando di paratassi e ipotassi si prende in considerazione la mera disposizione delle proposizioni nel periodo. Quindi il rapporto paratassi/ipotassi, a differenza di ciò che affermano molti manuali, si sofferma sull'analisi della forma, cioè osserva la realizzazione formale di un esito sintattico (e non della sintassi intesa come rapporto tra le proposizioni). Pertanto, se vi sono congiunzioni (coordinazione o subordinazione esplicita), ci troviamo di fronte alla sindesi4 o all'ipotassi; se abbiamo una costruzione implicita (asindetica5), ci troviamo di fronte comunque a una paratassi

4 Sindesi = presenza di una congiunzione per collegare unità sintattiche. 5 Asindetica = priva di connettivi.

(Andorno 1999 : 124). A questo punto affermo che paratassi e coordinazione abbracciano due aspetti diversi che possono anche non coincidere: per esempio, possiamo notare il seguente costrutto con la proposizione completiva che risulta essere una subordinazione paratattica:

(4)il sig. Rossi dichiarava voler eleggere domicilio presso …...

mentre nell'esempio

(5)il sig. Rossi dichiarava di voler eleggere domicilio presso …...

risulta essere una subordinazione ipotattica. In tal modo i concetti di paratassi e ipotassi vengono a coincidere con quelli di sindesi e asindeto: cioè paratassi = accostamento, giustapposizione di proposizioni senza congiunzioni; ipotassi = accostamento di proposizioni mediante congiunzioni (tanto coordinative quanto subordinative).

A questo punto, per deduzione, si può affermare che l'ipotassi, fatto formale, distribuisce e ordina una reggenza gerarchizzata – una gerarchia che può anche non essere formalmente “segnalata”: la paratassi. Oppure, l'unione per semplice accostamento o giustapposizione si chiama paratassi. Per antitesi, si chiama ipotassi il rapporto esplicito di subordinazione (Bertotti - Traina 2003 : 321). Alfonso Traina, noto filologo latinista, non soltanto distingue la coordinazione dalla paratassi (appoggiandosi anche sulla loro diversità etimologica), ma distingue anche la subordinazione dall'ipotassi, sostenendo che è un costrutto ipotattico la sola subordinazione esplicita (es. «se si studia, s'impara»), mentre annovera la subordinazione implicita («studiando, s'impara») tra i costrutti paratattici.

Vorrei ricordare la distinzione delle proposizioni in base al modo del verbo. Le proposizioni si chiamano esplicite quando il verbo è di modo finito, ossia all'indicativo, al congiuntivo, al condizionale o all'imperativo; sono implicite, invece, quando il verbo è di modo non finito, cioè all'infinito, al gerundio o al participio (Pellegrino – Cortelazzo 2003 : 81).

Riporto come esempio la seguente frase tratta da un verbale di perquisizione:

(6) Trattandosi di perquisizione locale eseguita nei confronti di persona sottoposta alle indagini ed essendo questa presente si è provveduto ad invitarla a dichiarare o eleggere domicilio per le notificazioni ex art.161 C.P.P., avvertendola dell'obbligo di comunicare ogni mutamento del domicilio dichiarato o eletto e del fatto che, in mancanza di tale comunicazione o nel caso di rifiuto di dichiararlo od eleggerlo, le notificazioni verranno eseguite mediante consegna al difensore ancorché d’ufficio.

Il corpus che ho preso in esame contiene numerosi casi di proposizioni subordinate. Vediamo quelle con il gerundio. Nel caso precedente, la proposizione principale “si è provveduto” regge diverse proposizioni implicite con il verbo al gerundio e quindi privo di accordo verbale di persona e di numero, tra queste “trattandosi di perquisizione locale”, “essendo questa presente” oppure ancora “avvertendola dell'obbligo”. Dal

punto di vista morfologico, una proposizione subordinata di modo finito è più ricca di informazioni rispetto alla proposizione subordinata di modo non finito, in quanto rinvia direttamente al soggetto del verbo e può dare indicazioni sulla modalità dell'azione. Considerate le scarse informazioni veicolate dai modi non finiti, il lettore ha bisogno di un numero maggiore di operazioni per comprendere le proposizioni implicite rispetto a quanto gli occorre per quelle esplicite (Pellegrino – Cortelazzo 2003 : 82). Il gerundio non rende visibile il soggetto della frase. Infatti, il soggetto di una proposizione gerundiva è nullo, vale a dire non è realizzato da un nome o da un pronome ed è coreferente col soggetto della frase principale o, in alcuni casi, con l'agente. Inoltre, la proposizione al gerundio consente di condensare in un'unica frase il contenuto di due o più frasi. Ma come detto precedentemente, una frase che contiene troppe informazioni obbliga il destinatario a una lettura impegnativa (cfr. cap. 2, par. 1). Infine, in una proposizione al gerundio resta opaco il tipo di legame che unisce la proposizione secondaria alla reggente (cioè se ha una valenza ipotetica, strumentale, temporale, causale, ecc.).

I casi di proposizioni participiali sono i più frequenti tra le proposizioni implicite. Ne riporto solo alcuni:

(7) (…) a mezzo di C.I. avente n. …... rilasciata dal Comune di …...

(8) Firma degli Uff.li/Agenti verbalizzanti.

(9) La Provincia provvederà, altresì, a ricostruire, nel rispetto delle norme del Codice della Strada, il muro di recinzione utilizzando i materiali provenienti dal muro preesistente.

(10) Gli altri paesi erano stati affidati ad interim ad altri dirigenti per far si che ci fosse una persona dedicata esclusivamente al mercato italiano.

In questi esempi vi sono sia proposizioni che contengono il participio presente (avente, verbalizzanti che rappresenta un participio sostantivato, provenienti), sia proposizioni che contengono il participio passato (rilasciata, dedicata).

Le proposizioni participiali condividono con quelle gerundive una proprietà di fondo: quella di consentire la formulazione di frasi più compatte, ma dense e complesse. Invece è molto più semplice e fluida la lettura rispetto alle proposizioni gerundive in quanto il participio passato si accorda ed è molto più facile effettuare il recupero del soggetto (rilasciata che si riferisce a “carta d'identità”, dedicata che si riferisce a “persona”). Dal punto di vista semantico, inoltre, non vi sono particolari problemi perché la proposizione subordinata con il participio presente è equivalente a una proposizione relativa.

frequenti nel corpus esaminato. Queste senza soggetto e senza indicazione della persona, hanno caratteristiche simili a quelle delle proposizioni al gerundio ma dal punto di vista semantico non presentano le stesse ambiguità. Nella maggior parte dei casi le proposizioni all'infinito non sono sostituibili con corrispondenti proposizioni esplicite (Pellegrino – Cortelazzo 2003 : 85). Infatti il seguente esempio:

(11) Tale sig. ... dichiarava di non essere a conoscenza dei fatti suesposti.

non può essere con una proposizione dichiarativa retta da che.

Fra gli ostacoli che intralciano una lettura fluida e lineare vi sono gli incisi e le parentetiche, ovvero quelle frasi che, messe fra virgole, parentesi o trattini, forniscono delle informazioni aggiuntive rispetto all'argomento centrale della frase. Nell'esempio

Documenti correlati