4. La leggibilità in lingue diverse dall’inglese
4.1. Ricerche sulla leggibilità dei testi in lingue straniere negli Stati Uniti 1 Francese
Uno dei primi studi sulla difficoltà dei testi in una lingua diversa dall’inglese è quello di Tharp (1939). Lo studioso si occupa di valutare la difficoltà di testi in lingua francese destinati a studenti di lingua inglese e, nonostante non sviluppi una vera e propria formula, propone un Indice di Difficoltà che combina due fattori, la densità e la frequenza delle parole. La misura della difficoltà è data dividendo l’indice di frequenza (calcolato utilizzando il Basic French Vocabulary) per la densità, che a sua volta si ottiene dividendo il numero di running words (tokens, parole totali del testo) per il numero di burden words (numero di non-cognate words)56. Maggiore è il valore della densità, più facile è il testo.
54 Per una sintesi delle ricerche sulle formule di leggibilità in lingue diverse dall’inglese cfr. Klare
1974, 1984 e Rabin 1988.
55 I nuovi metodi di valutazione automatica della leggibilità sono trattati nel Capitolo 6.
74
4.1.2. Spagnolo
Dal momento che lo spagnolo viene spesso insegnato come lingua straniera nelle scuole statunitensi e a causa della vicinanza di paesi di lingua spagnola e della conseguente immigrazione, negli Stati Uniti vengono sviluppati diversi strumenti per la valutazione dei testi in tale lingua.
Nel 1951 Spaulding pubblica due formule per stimare la difficoltà di lettura di materiali didattici in spagnolo come lingua seconda. I materiali usati nello studio provengono da testi impiegati negli esami di dottorato; le variabili considerate sono la lunghezza media della frase, come misura della complessità sintattica per entrambe le formule, la frequenza media delle parole e la densità dei brani come indice di complessità del vocabolario. La densità si basa sul numero di parole nel testo che non sono presenti nell'elenco di Buchanan (1927) delle 1500 parole più usate nello spagnolo.
(1) 𝐷𝑖𝑓𝑓𝑖𝑐𝑜𝑙𝑡à = 4,115 (𝐹𝐼) + 0,154 (𝐴𝑆𝐿) – 2,383
(2) 𝐷𝑖𝑓𝑓𝑖𝑐𝑜𝑙𝑡à = 0,1609 (𝐴𝑆𝐿) + 33,18 (𝐷) + 2,20
dove
FI = indice di frequenza
ASL = lunghezza media della frase misurata in parole D = densità
Il range di difficoltà varia da 10 a 200, dove 10 indica un brano facile e 200 un brano difficile. La prima formula è leggermente più accurata rispetto alla seconda (i coefficienti di correlazione sono rispettivamente 0,90 e 0,87), ma la seconda risulta più facile da calcolare (la misurazione della densità è più semplice rispetto al calcolo della frequenza). In un articolo successivo, Spaulding (1956) presenta una versione leggermente modificata del secondo indice (cambiano i decimali)57.
La formula è utilizzata da Pan American Union per stabilire la difficoltà di materiali didattici preparati per adulti latino-americani con capacità di lettura limitate.
La procedura di Spaulding è adattata da Patterson (1972) per l’uso da parte di operatori religiosi che si occupano di lettori con ridotte capacità di lettura. A sua volta Thonis (1976) utilizza la ricerca di Patterson per effettuare una conversione dei valori di difficoltà di Spaulding in livelli effettivi di istruzione (grade level), ma dato che la procedura seguita non risulta chiara, a questo studio non viene data molta credibilità.
Altri quattro studi (Garcia 1977, Gilliam et al. 1980, Vari-Cartier 1981 e Crawford 1984) si basano invece sul grafico di leggibilità di Fry (1968, 1977), che impiega come variabili la lunghezza delle parole misurata in sillabe e la lunghezza delle frasi misurata in parole. Garcia (1977) propone di modificare i valori sull’asse delle ascisse e delle ordinate del grafico in modo da riflettere la lunghezza media di frasi e parole in spagnolo. L’autore
57 Per produrre un grado di difficoltà compreso tra 20 e 200 i valori della formula sono moltiplicati
per 10: Difficulty = 1,609 (ASL) + 331,8 (D) + 22,0. Nell’articolo del 1956 sono pubblicate per la prima volta anche le istruzioni per l’applicazione della formula 2, un grafico e l’elenco delle parole per il calcolo della densità (Density Word List).
75
suggerisce l’uso del cloze test anche se la sua ricerca ha rivelato che la procedura è adatta solo nei casi di allievi che studiano lo spagnolo avanzato.
Gilliam, Peña e Mountain (1980) utilizzano una versione adattata del grafico di Fry per determinare la leggibilità di 13 libri di testo e 9 libri per ragazzi con gradi da 1 a 3; gli autori indicano che, per stabilire una corrispondenza in termini di livelli di istruzione tra le due lingue, è necessario sottrarre 67 dal conteggio medio delle sillabe.
Vari-Cartier (1981) individua due tipologie di problemi nell’applicazione del grafico allo spagnolo: in primo luogo, il grafico non è progettato per stimare la leggibilità di materiali di prosa che abbiano un numero medio di sillabe superiore a 182; questo può rappresentare un problema in quanto la struttura delle parole in spagnolo è caratterizzata da un alto numero di sillabe e, come sottolineano anche Gilliam et al. 1980, non è raro contare in un testo di 100 parole un numero medio di sillabe che va dalle 175 alle 200. Le regole per la sillabazione in inglese e spagnolo sono simili ma se si conta il numero di sillabe nello stesso testo in ognuna delle due lingue risulterà un conteggio diverso, probabilmente più alto per lo spagnolo. In secondo luogo, il grafico di Fry determina punteggi che corrispondono a livelli di istruzione convenzionali, che non riflettono i diversi gradi di apprendimento di una lingua straniera.
Vari-Carter progetta dunque un nuovo grafico, detto Fry Readability Adaptation for Spanish Evaluation (FRASE), aumentando il valore massimo del conteggio medio di sillabe sull’asse orizzontale e regolando i parametri di leggibilità in modo da rendere conto dei diversi livelli di studio delle lingue straniere (principiante, intermedio, intermedio avanzato, avanzato); in questo modo il nuovo grafico potrebbe essere applicato anche allo studio di altre lingue, oltre allo spagnolo.
Figura 3. Il grafico FRASE
La ricerca di A. N. Crawford (1984) è sostenuta dal Department of Education degli Stati Uniti, in base al Bilingual Education Act. Lo studio è condotto su un corpus che comprende dieci serie diverse di testi in spagnolo elementare (che vanno dal 1° al 6° grado) impiegate
Avanzato Livello 4 Principiante Livello 1 Intermedio Livello 2 Intermedio Avanzato Livello 3 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 184 188 192 196 200 204 208 212 216 220 224 228 232 N u m ero m edi o d i frasi per 1 0 0 p aro le
76
negli Stati Uniti, in America Latina e in Spagna. Lo studioso propone un nuovo grafico di leggibilità58 basato sulla seguente equazione di regressione:
𝐺𝑟𝑎𝑑𝑒 𝑙𝑒𝑣𝑒𝑙 = [𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑖 𝑓𝑟𝑎𝑠𝑖 𝑝𝑒𝑟 100 𝑝𝑎𝑟𝑜𝑙𝑒 × (−0,205)]
+ (𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑖 𝑠𝑖𝑙𝑙𝑎𝑏𝑒 𝑝𝑒𝑟 100 𝑝𝑎𝑟𝑜𝑙𝑒 × 0,049) − 3,407
4.1.3. Ebraico
Nahshon (1957) valuta 11 variabili linguistiche e le combina in 8 formule di leggibilità per testi di prosa in ebraico. Riportiamo la formula più lunga e quella più breve:
𝐺𝑆 = 0,1638 𝑥1 + 0,0334 𝑥2 − 0,1382𝑥3 − 0,0682𝑥4 + 6,749
𝐺𝑆 = 0,236𝑥1+ 0,1338𝑥2− 3,305
Dove:
GS = livello di istruzione (grade level) in cui uno studente israeliano può comprendere un brano senza aiuto esterno;
𝑥1 = percentuale di parole diverse difficili;
𝑥2 = lunghezza media delle frasi in parole;
𝑥3 = percentuale di parole concrete;
𝑥4 = percentuale di verbi
La prima formula produce una correlazione di 0,935, mentre la seconda di 0,868.
4.1.4. Tedesco
T W. Walters (1966) sviluppa 33 formule di leggibilità destinate a valutare testi di teologia in tedesco. Le formule che presentano valori più alti di correlazione multipla sono quella a due variabili (0,92), a tre variabili (0,96) e a quattro variabili (0,97).
𝑌 = 801,12 − 40,77 (𝐹87) − 172.32 (𝐹113)
𝑌 = 904,30 − 32,09 (𝐹87) − 330,17 (𝐹104) − 119.66 (𝐹113)
𝑌 = 384,89 − 5,75 (𝐹79𝐴) − 240,16 (𝐹100) + 12.94 (𝐹111𝐴) − 39.99 (𝐹126)
dove:
Y = indice di difficoltà
F87 = numero medio di segmenti verbali per frase
F113 = densità di modifica (density of modification) in unità nominali F104 = percentuale di unità astratte /A/
F79A = numero di sostantivi F100 = percentuale di nomi astratti F111A = numero di unità nominali
F126 = numero medio di clause units per frase
77
I punteggi vanno da 100 (molto difficile) a 550 (molto facile); si tratta di una formula particolare, che impiega un criterio particolare e che dunque non è adatta ad un impiego generale.
Schwartz (1975) adatta il grafico di Fry alla lingua tedesca per valutare i materiali didattici in tedesco elementare. Come set campione utilizza una serie di letture di base in tedesco occidentale, risalenti alla Seconda Guerra Mondiale; l’autrice nota che le parole tedesche sono più lunghe rispetto a quelle inglesi e determina che la differenza sia di circa 25-37 sillabe. Il numero di frasi invece è molto vicino ai corrispondenti livelli di grado.
4.1.5. Cinese
Shou-jung Yang (1970) intraprende un ampio progetto sulla leggibilità dei testi in cinese. Come criterio utilizza 85 brani in cinese moderno, somministrati gli studenti dei primi due anni delle scuole superiori di Taiwan. Tra le 39 variabili linguistiche studiate, individua le tre con il più alto valore predittivo: il fattore parola (inteso come quantità di parole che fanno parte di una lista di 5600 parole ‘semplici’), il fattore carattere e quello frase. La correlazione multipla è di 0,80.
Ne derivano una formula “lunga” a 7 variabili e una versione “breve” con le 3 variabili citate: (1) 𝑌 = 13.90963 + 1.54461 (𝐹𝑈𝐿𝐿𝑆𝐸𝑁) + 3.01497 (𝑊𝑂𝑅𝐷𝐿𝐼𝑆𝑇) − 2.52206 (𝑆𝑇𝑅𝑂𝐾𝐸𝑆) − .29089 (𝐶𝑂𝑈𝑁𝑇-5) + .26193 (𝐶𝑂𝑈𝑁𝑇-12) + .99363 (𝐶𝑂𝑈𝑁𝑇-22) − 1.64671 (𝐶𝑂𝑈𝑁𝑇-23) (2) 𝑌 = 14.95961 + 39.07746 (𝑊𝑂𝑅𝐷𝐿𝐼𝑆𝑇) − 2.48491 (𝑆𝑇𝑅𝑂𝐾𝐸𝑆) + 1.11506 (𝐹𝑈𝐿𝐿𝑆𝐸𝑁) dove: Y = livello di difficoltà;
FULLSEN = proporzione di frasi complete;
WORDLIST = proporzione di parole che si trovano nella lista di 5.600 parole semplici; STROKES = numero medio di battute per carattere;
COUNT-5 = percentuale di caratteri in gruppi di 5 battute; COUNT-12 = percentuale di caratteri in gruppi di 12 battute; COUNT-22 = percentuale di caratteri in gruppi di 22 battute; COUNT-23 = percentuale di caratteri in gruppi di 23 battute
4.1.6. Russo
Rock (1970) sviluppa un grafico di leggibilità per aiutare gli insegnanti di russo. L’apprendimento di questa lingua è infatti molto difficile per gli studenti di lingua inglese e i docenti hanno bisogno di materiali adatti alle capacità dei lettori.
Il grafico non include come variabile la lunghezza della frase poiché le frasi russe tendono a presentare poche difficoltà sintattiche; il fattore linguistico considerato rilevante per la difficoltà è invece il vocabolario. Il grafico si basa su una lista di vocaboli di uso comune che
78
compaiono almeno in metà dei libri di testo russi in uso nelle scuole superiori statunitensi e sulla percentuale di parole che sono risultate sconosciute per un campione rappresentativo di studenti che ha letto e valutato un determinato materiale di lettura.
4.1.7. Vietnamita
Nguyen e Henkin (1982) sviluppano una formula di leggibilità per la lingua vietnamita. La formula, sostengono gli autori, è di particolare interesse per scrittori, redattori, educatori e fornitori di servizi sociali che creano materiali destinati ai rifugiati vietnamiti in altri paesi. Gli studiosi selezionano un campione di 20 brani di circa 300 parole ciascuno da romanzi, riviste e libri di testo vietnamiti dal 4° grado al livello universitario. Il livello di leggibilità (RL) è dato dalla lunghezza media della frase (SL) e dalla lunghezza media della parola (WL):
𝑅𝐿 = 2𝑊𝐿 + 0,2𝑆𝐿 − 6
Nel computo delle parole si tiene conto anche dei vari segni, come i segni tonali o i trattini.