5. Studi di leggibilità in Italia
5.2. Applicazioni della formula di Flesch – Vacca
5.2.9. Leggibilità e prove di comprensione della lettura: verso un nuovo indice
“Dal crescente disagio avvertito nei confronti dell'utilizzazione della formula di Flesch da parte di tutti coloro che l'avevano sperimentata nacque l'esigenza di un confronto sul tema della leggibilità e della comprensibilità dei testi” (Thornton 1992). Nel 1986 viene
103
organizzato a Roma il convegno Leggibilità e comprensione, a cui partecipano tutti i ricercatori, i redattori e i gruppi di studio interessati al tema della leggibilità e della riscrittura87.
In occasione dell'incontro, Roberto Vacca propone il nuovo adattamento della formula all’italiano e vengono illustrati i risultati dei già citati studi sull’uso sistematico dell’indice di Flesch. Uno dei principali aspetti emergenti dal dibattito è la necessità di individuare criteri unitari, standard per l’applicazione della formula di Flesch alla lingua italiana. “Questo convegno potrebbe essere la sede per gettare le basi di una specie di Commissione di controllo che fissi i parametri per il calcolo dell’indice e ne controlli l’applicazione in modo da ottenere una specie di Formula di Flesch a «Denominazione d’origine controllata» da usare in modo uniforme uguale per tutti. Ciò ci consentirebbe di disporre di dati omogenei completamente confrontabili” (Mercatali 1986).
Durante l’incontro di studio vengono presentati anche i primi risultati di un ampio progetto di ricerca iniziato nel 1985 e portato avanti da un gruppo di ricercatori, studenti e insegnanti del dell’Istituto di Filosofia dell’Università La Sapienza di Roma, in collaborazione con l’IBM. Il gruppo di lavoro, denominato GULP (Gruppo Universitario Linguistico Pedagogico), è coordinato da Pietro Lucisano e si avvale della consulenza di un Comitato scientifico composto dai professori Maria Corda Costa, Tullio de Mauro, Mario Gattullo ed Aldo Visalberghi88. L’obiettivo della ricerca è “verificare se i livelli medi di comprensione dei testi scritti misurati con le prove di comprensione a scelta multipla (TCL) e con le prove di cloze, forniscono una graduatoria di rango di facilità di lettura che correli con i dati risultanti dalle misurazioni sul testo. Riteniamo, infatti, insufficienti i metodi seguiti finora per l’adattamento degli indici di leggibilità alla lingua italiana, poiché quest’ultimi fanno riferimento solo ai rapporti tra indici nelle diverse lingue, senza alcuna considerazione della variabilità che strutture linguistiche diverse offrono ai processi di lettura e comprensione” (Lucisano e Piemontese 1986, p. 28).
Lo studio prevede quindi da una parte le misurazioni sul lettore tramite prove di comprensione della lettura (TCL e cloze test) e dall’altra misurazioni sul testo tramite l’uso di formule come quella di Flesch o la ricerca di altri possibili predittori della leggibilità e la rilevanza del vocabolario di base.
I brani scelti come campione sono tratti da 4 ambiti disciplinari: testi storico-politici, testi narrativi e letterari, testi di divulgazione scientifica, testi di istruzioni. Per il try out sono utilizzati soltanto 9 brani di storia89. Le prove vengono somministrate a soggetti di quattro popolazioni: quinta elementare (A), terza media (B), quinta superiore (C) e adulti (D). La popolazione degli adulti è stratificata per età, sesso e livello di istruzione. Agli studenti delle elementari vengono proposti solo i primi 5 testi mentre agli altri gruppi è somministrato l’intero pacchetto.
I testi sono estratti dai libri di testo degli studenti e, per quanto riguarda gli adulti, da un quotidiano e dallo statuto dei lavoratori; sono scelti secondo determinate indicazioni:
87 Cfr. De Mauro et al. 1986
88 Il gruppo GULP è composto da G. Asquini, G. Benvenuto, A. Columba, F. D’Antonis Onofri, M. de
Grafenstein, M. Drigo, R. Morani, M. E. Piemontese, S. Pierdonati, F. Pietrobelli, A. Salerni, D. Scalet, M. T. Siniscalco, G. M. Tavanti, M. T. Tiraboschi.
89 Il try out è effettuato dagli studenti di Pedagogia II e Filosofia del linguaggio nell’ambito di
104
− hanno senso compiuto, cioè non contengono un numero elevato di informazioni presupposte né rimandi espliciti a parti di testo precedenti o seguenti;
− hanno uguale lunghezza per popolazione con oscillazione tra le 250 e le 400 parole; − hanno indici di Flesch differenziati in modo che all’interno dei testi di ciascuna
popolazione esista una differenza di circa 4-10 punti nella scala di Flesch e che analoga differenza esista tra le popolazioni.
La tabella seguente riporta, per ciascun testo, l’argomento, il valore dell’indice di Flesch (indicato con F) dei singoli campioni, il valore medio della leggibilità e la deviazione standard.
Testo F1 F2 F3 media dev. st. Argomento
0 51 72,6 67 10,8 Scuola Antica Roma
1 55,8 39,4 47,5 8,2 Rivoluzione industriale 2 46 52,4 49,2 3,2 Patrizi e plebei 3 33,8 46 38,2 39,3 5,0 Restaurazione 4 49,2 52,1 38,3 46,5 5,9 Conquista West 5 25 24,8 14,3 21,3 5 Resistenza 6 27,3 35 38,6 33,6 4,7 Indipendenza Africa 7 39 34,7 37,3 37 1,8 Craxi - De Mita 8 30,1 23,8 9,5 17,8 6,1 Statuto lavoratori
F1 – valore della leggibilità del 1° campione secondo Flesch F2 – valore della leggibilità del 2° campione secondo Flesch F3 – valore della leggibilità del 3° campione secondo Flesch
Tabella 21. Valori di leggibilità, deviazione standard e argomento dei testi campione.
Per misurare la comprensione della lettura vengono utilizzate le prove a scelta multipla e il test cloze. I problemi delle domande a scelta multipla riguardano sia la formulazione delle domande (evitare che presentino difficoltà maggiori di quelle del testo) sia l’individuazione dei punti cruciali su cui costruire le domande. Il metodo seguito per l’individuazione dei punti nodali dei testi è quello di una lettura individuale e collettiva da parte del gruppo del Laboratorio (15 persone) e della successiva verifica con gli studenti dell’esercitazione intercattedra (25 persone).
Le prove di cloze sono costruite sugli stessi testi; viene usato il metodo classico, quello della cancellazione ogni 5 parole, per un totale di 25 cancellazioni per brano. La prima lacuna è collocata dopo circa 10 righe di testo. “La principale difficoltà posta dall’uso del cloze, che dagli anni ’50 è la tecnica di riferimento più in uso negli Stati Uniti per la taratura degli indici di leggibilità, è l’assenza di sperimentazioni in lingua italiana” (Lucisano e Piemontese 1986, p. 31).
Nel corso dell’indagine vengono utilizzati anche due questionari: il primo raccoglie informazioni circa la provenienza socioculturale di ogni studente, le sue letture e il suo
105
atteggiamento verso la lettura; il secondo chiede agli insegnanti di valutare la difficoltà delle prove sottoposte agli studenti, secondo un criterio personale.
Per quanto riguarda l’applicazione dell’Indice di Flesch, emergono gli stessi problemi individuati da altri ricercatori, in particolare nel computo delle sillabe, delle date, dei numeri, delle sigle, delle abbreviazioni e dei simboli. “Per le date, anche se non lo riteniamo giustificato dal punto di vista teorico, ci siamo attenuti alle indicazioni di Flesch, di sillabare cioè le date come se fossero scritte in lettere. Per quanto riguarda, invece, le sigle le abbiamo considerate composte dal numero di sillabe che vengono pronunciate nella lettura della sigla stessa; per le abbreviazioni, invece, abbiamo preferito considerare l’intero vocabolo (es.: art. letto come articolo). Un problema di rilevazione non trascurato è costituito dall’equazione personale del rilevatore nel senso che ogni rilevatore forniva un numero di sillabe diverso a volte anche in modo sensibile” (id.).
Ciascun testo è poi confrontato con il Vocabolario di Base (nell’edizione del 1985), in modo da verificare se esiste una relazione tra l’appartenenza o meno a questo e l’indice di Flesch. Anche l’uso del VdB pone dei problemi: “Innanzitutto, nella sua forma attuale, il Vocabolario di Base, essendo una lista di parole, non dà informazioni sull’accezione nella quale un termine è considerato. In alcuni casi è assente anche l’indicazione della categoria grammaticale nella quale è considerato il termine del Vocabolario di Base. Un problema analogo si pone per i verbi, i participi e gli aggettivi sostantivati, per le locuzioni nominali e avverbiali che assumono un significato complessivamente diverso da quello delle singole parole che lo compongono. Dubbi di classificazione hanno posto anche i verbi riflessivi sia per il possibile cambiamento di uso e/o significato sia per la possibilità di essere scomposti in due parole. Problemi pongono anche l’uso del si passivante e del si impersonale, i verbi legati a pro complementi, i verbi composti, la sinonimia tra venire e essere nelle forme passive, i verbi causativi e servili, forme verbali derivate da verbi presenti nel Vocabolario di Base ma usate con accezioni diverse o come aggettivi. Frequenti dubbi per la classificazione si sono avuti a proposito degli alterati” (id., p. 32).
Per quanto riguarda il confronto tra le prove di comprensione a scelta multipla e le prove di cloze, è stata verificata una sostanziale omogeneità dei risultati: le due prove quindi risultano avere una buona correlazione tra loro. L’ordinamento dei testi in base alla difficoltà risultante dalle due prove e quella ottenuta in base all’indice di Flesch invece corrispondono solo in parte; sui testi più complessi, la formula di Flesch sembra perdere valore predittivo.
Gli autori considerano infine le correlazioni di rango tra le prove di comprensione, l’indice di Flesch e la percentuale nel testo di alcune classi di parole. Correlazioni significative con la comprensione sono ricavate da un indice che considera le frequenze del vocabolario non di base, i nomi propri, le sigle e le date (NSD). Emerge inoltre con le parole vuote la tendenza a correlare negativamente con la comprensione; fanno eccezione gli articoli che, più dello stesso Flesch, costituiscono un predittore significativo della leggibilità.
Tali risultati valgono almeno in relazione ai testi analizzati e devono comunque essere verificati su un campione più ampio di testi e lettori. “Riteniamo in conclusione che l’uso di indici per la rilevazione della leggibilità non possa prescindere da un lavoro di ricerca sulla effettiva comprensione dei testi, ricerca che deve essere condotta sia su grandi campioni con tecniche di rilevazioni «quantitative», sia, in parallelo, su piccoli gruppi, attraverso
106
interviste ed analisi «qualitative» di quelli che sono gli ostacoli alla comprensione” (id., p. 36).