5. Studi di leggibilità in Italia
5.3. La formula GULPEASE
5.3.4. Misurazione delle variabili linguistiche
Sono diverse le variabili linguistiche che possono essere scelte per la valutazione della facilità di lettura. La misurazione di alcune di queste presenta alcune difficoltà, legate al computo della lunghezza delle parole: si deve infatti stabilire a priori se misurare la lunghezza delle parole in sillabe (come Flesch) o in lettere (come fanno altri autori, ad esempio Coleman e Liau). In questa ricerca vengono seguiti entrambi gli approcci ed emerge che la misura delle parole in lettere presenta correlazioni più alte con la comprensione dei testi. La scelta di considerare il numero di lettere consente inoltre di superare tutte quelle difficoltà legate al calcolo automatico della sillabazione delle parole. Altre problematiche sono legate alla definizione della lunghezza quando si considerano sigle, date, numeri e abbreviazioni. Nello studio precedente il gruppo di ricerca aveva deciso di seguire le indicazioni di Flesch e sillabare le date e i numeri come se fossero scritte in lettere. Le abbreviazioni erano invece considerate nella forma estesa. Nel corso dell’analisi emerge però l’esigenza di definire nuove regole univoche, che possano meglio adattarsi alla lingua italiana93. Le nuove norme prevedono che ciascun numero, simbolo o abbreviazione sia considerato come una parola. Per misurare la lunghezza devono essere considerati il numero di sillabe/lettere che sono presenti nel numero o abbreviazione. Ciascun simbolo chimico è considerato come una sillaba e per misurarne la lunghezza in lettere è sufficiente misurare il numero di lettere da cui è composto il simbolo.
Tipologia N. parole N. sillabe N. lettere
1986 1 parola 4 sillabe 4 lettere
18 1 parola 2 sillabe 2 lettere
321 1 parola 3 sillabe 3 lettere
CGIL/C.G.I.L. 1 parola 4 sillabe 4 lettere
USL/U.S.L. 1 parola 3 sillabe 3 lettere
UNESCO/U.N.E.S.C.O. 1 parola 6 sillabe 6 lettere
H20 1 parola 3 sillabe 3 lettere
NaCl 1 parola 2 sillabe 4 lettere
Tabella 23. Norme per misurare la lunghezza di abbreviazioni, sigle, simboli e numeri.
Per quanto riguarda le frasi, viene deciso di considerare convenzionalmente il solo punto fermo come delimitatore di frase. Altre variabili linguistiche considerate come possibili indicatori di difficoltà sono:
• parole appartenenti al Vocabolario di Base fondamentale; • parole appartenenti al Vocabolario di Base ad alto uso;
93 Della definizione di una serie di regole convenzionali per l’applicazione della formula di Flesch si è
occupato il gruppo H. Le norme sono poi riprese dal GULP per la taratura di una nuova formula per l’italiano.
110
• parole appartenenti al Vocabolario di Base ad alta disponibilità; • parole non appartenenti al Vocabolario di Base;
• nomi propri; • parole vuote;
• sigle, abbreviazioni e simboli; • date.
Le parole vuote contengono diverse categorie di parole: • articoli determinativi e indeterminativi;
• congiunzioni coordinanti e subordinanti; • pronomi personali;
• aggettivi e avverbi quantificatori; • pronomi e aggettivi indefiniti; • pronomi e aggettivi interrogativi; • pronomi relativi;
• pronomi e aggettivi dimostrativi; • pronomi e aggettivi possessivi; • preposizioni semplici e articolate; • procomplementi;
• avverbi di tempo e luogo di significato indeterminato.
Come già detto in precedenza, l’utilizzazione del Vocabolario di Base (nella forma del 1985) presenta alcune difficoltà in quanto, essendo una lista di parole, non fornisce informazioni sull’accezione nella quale un termine è considerato e, in alcuni casi, non presenta neppure l’indicazione della categoria grammaticale delle parole di base. Problemi analoghi si pongono per i verbi, i participi e gli aggettivi sostantivati, per le locuzioni nominali e avverbiali quando assumono un significato diverso da quello delle singole parole che lo compongono. “Molti di questi problemi sono stati legati anche al tentativo di realizzare un programma di computer in grado di computare la maggior parte di queste variabili. Allo stato attuale abbiamo messo a punto un programma in grado di risolvere solo i problemi più elementari e di calcolare formule semplici come Flesch o Coleman e Liau” (Lucisano e Piemontese 1988, p. 117).
Oltre all’indice di Flesch vengono calcolati anche l’indice ARI (Automated Readability Index) e la formula di Coleman e Liau. Le tre formule di leggibilità hanno in comune alcune specificità: sono tutte di facile applicazione, anche in vista di un’automazione e considerano tutte le stesse due variabili, cioè la lunghezza delle parole e la lunghezza delle frasi. La differenza è che la formula di Flesch misura la parola in numero di sillabe mentre gli altri due indici valutano la lunghezza in base al numero di lettere. Sia la formula ARI che quella di Flesch tendono a sovrastimare la difficoltà di lettura, mentre la formula di Coleman e Liau tende a sottostimarla.
111
La tabella seguente mostra per ciascun testo della ricerca i valori di leggibilità e i punteggi risultanti dalle prove di comprensione:
Testo Flesch Ari Coleman Punt.
A
Punt. B
Punt.
C Argomento
H0 54.71 8.8 12.0 77 88 90 scuola antica Roma H1 53.78 14.2 12.7 53 68 89 patrizi e plebei H2 42.35 15.1 14.1 50 63 88 rivoluzione industriale H3 38.22 17.1 15.3 55 73 88 conquista west H4 39.00 16.9 13.7 45 63 84 restaurazione H5 22.00 24.5 15.9 43 71 Craxi e De Mita H6 27.85 21.27 15.6 46 71 indipendenza africana H7 38.75 15.5 14.7 55 78 resistenza H8 21.41 20.1 18.3 56 75 statuto lavoratori
S0 73,90 6.4 8.7 85 79 92 adattamento del cammello S1 46.63 14.6 13.7 59 76 92 le foreste equatoriali
S2 51.31 15.6 12.8 43 65 86 il cuore
S3 30.08 17.7 11.9 48 69 92 l’energia nucleare S4 40.96 16.5 14.6 50 70 95 organismi e ambiente fis.
S5 47.09 16.1 12.5 39 69 il magnetismo
S6 41.02 14.8 15.2 33 63 lo sviluppo cellulare S7 37.78 16.5 15.2 60 92 l’intelligenza artificiale
S8 40.08 15.1 15.3 58 89 i danni del fumo
L0 68.54 11.1 9.4 82 87 99 Raccontino morale
L1 82.45 4.6 6.9 53 61 83 R. Kipling Libro della giungla L2 86.23 3.6 5.6 38 75 91 G.C. Vamba Giamburrasca L3 44.92 15.3 13.0 39 59 84 L. Sciascia Una storia vera L4 83.66 14.9 13.5 41 60 79 I. Silone Uscita di sicurezza L5 2.14 35.7 14.3 46 67 S. Petronio L’attività letteraria L6 36.51 18.6 14.1 37 62 M. Tobino L’armistizio L7 51.36 13.7 11.5 49 81 I. Calvino Le città invisibili
L8 36.50 16.4 15.4 33 55 E. Morante La storia
112
Le correlazioni tra i punteggi riportati nelle prove da ciascuna popolazione risultano costanti. Questo significa che è possibile limitare la rilevazione ad una sola popolazione, in questo caso la B (terza media). “Il rapporto costante tra le prove ci consente di fare ricorso ad una equazione di regressione in modo da poter trarre dai dati di una popolazione informazioni sulle probabili prestazioni di un'altra” (Lucisano e Piemontese 1988, p. 119). Grazie a questa semplificazione, è possibile lavorare su un campione più ampio di scuole e di soggetti: 51 classi di terza media per un totale di 768 studenti.