• Non ci sono risultati.

2. Studi classici sulla leggibilità

2.6. Rudolf Flesch: The art of Plain Talk

È soprattutto R. Flesch a divulgare attraverso i suoi libri30 e i suoi articoli il concetto di leggibilità e a pubblicizzare l’esigenza del plain talk.

Flesch nasce in Austria e si laurea in giurisprudenza presso l'Università di Vienna nel 1933; pratica legge fino al 1938, quando giunge negli Stati Uniti come rifugiato politico. Dal momento che la sua laurea in legge non viene riconosciuta, si dedica ad altri studi: nel 1939 riceve una borsa di studio per rifugiati presso la Columbia University e nel 1940 si laurea con lode in biblioteconomia. Nello stesso anno, diventa assistente di Lyman Bryson al Readabilty Lab del Teachers College della Columbia University, assieme a Lorge.

Nel 1942 consegue un master in Educazione degli adulti e l’anno successivo un dottorato di ricerca in Ricerca educativa. Nella sua tesi, Marks of a Readable Style (1943), Flesch pubblica la sua prima formula di leggibilità; la formula viene poi ripresentata nel 1946 in The art of Plain Talk, scritto intenzionalmente da Flesch in “modo leggibile”. Nell’introduzione si legge: “about two years ago, I published my Ph.D. dissertation “Marks of a Readable Style”, which contained a statistical formula for measuring readability. The dissertation was quite a success, as dissertations go, and the formula is now being used in many organizations and government agencies. This has been gratifying, but also somewhat embarrassing to me: for “Marks of a Readable Style”, being a Ph.D. dissertation, was not a very readable book. I tried to rewrite it in simple language, but when I was through, a natural thing had happened ad I had written a new book. This is the book”.

Flesh è convinto che le formule fino ad allora elaborate non abbiano individuato quei caratteri che incidono maggiormente sulla leggibilità; in particolare, esse forniscono indicazioni esatte per quanto riguarda la valutazione della difficoltà di lettura dei bambini ma non riescono a registrare quelle degli adulti.

29 I. Lorge, The Lorge and Flesch Readability Formulae: A Correction, School and Society, Vol. 67, pp.

141-142, 21 febbraio 1948. - E. Dale, J. S. Chall, A Formula for Predicting Readability in Educational Research Bulletin, Vol. 27, No. 1 (Jan. 21, 1948), pp. 11-20+28.

30 Tra i principali: The Art of Plain Talk (1946), The Art of Readable Writing (1949), The Art of Clear

Thinking (1951), Why Johnny Can't Read - And What You Can Do About It (1955), The ABC of Style: A Guide to Plain English (1964), How to Write in Plain English: A Book for Lawyers and Consumers

39

La formula elaborata da Flesch si basa sul conteggio di tre elementi: lunghezza media della frase, numero di affissi e numero di riferimenti personali. La complessità delle frasi è un ottimo indice di difficoltà sia per i bambini che per gli adulti. Un altro buon indice di difficoltà è la quantità di affissi (prefissi, infissi, suffissi): gli affissi contraddistinguono in genere parole astratte, la cui comprensione richiede passaggi logici più complessi. L’altro fattore da considerare è l’interesse che uno scritto suscita nel lettore; per misurare questo elemento si contano i riferimenti personali: nomi propri, pronomi personali, nomi di persona, ecc.

Dopo la sua pubblicazione, la formula trova largo impiego in molti campi: quotidiani e riviste, pubblicità, pubblicazioni del governo, materiale per l’educazione degli adulti, libri di testo, libri per bambini, corsi di scrittura creativa, ecc. Il suo uso ne mostra la validità, ma al tempo stesso ne evidenzia anche i difetti. Uno di questi è la difficoltà di applicazione, ad esempio nel conteggio del numero di affissi; altre persone trovano complesso usare il sistema dei punteggi, che generalmente va da 0 (molto facile) a 7 (molto difficile); inoltre, il conteggio dei riferimenti personali viene considerato arbitrario.

Uno dei limiti maggiori è il troppo tempo che richiede la sua applicazione. Il tempo medio necessario per testare un campione di 100 parole è 6 minuti; questo rende l’applicazione della formula più veloce rispetto a formule più semplici, che richiedono un riferimento a liste di parole (ad esempio Gray e Leary o Lorge), ma ancora troppo lunga per l’uso pratico (Flesch 1948).

Per superare queste carenze e renderla più pratica, nel 1948 lo studioso pubblica una seconda formula. Flesch seleziona, come criterio, brani tratti da Standard Test Lessons in Reading di McCall e Crabbs (1926). I coefficienti di correlazione con i punteggi di difficoltà dei testi si basano in parte sui risultati statistici stabiliti dallo studio di Lorge; i livelli di difficoltà sono ottenuti da prove di comprensione effettuate sui bambini di scuole elementari. Si tratta di dati non proprio ottimali per misurare la facilità e l’interesse con cui leggono gli adulti ma sono gli unici disponibili al momento dello sviluppo e della revisione della formula.

Gli elementi considerati sono quattro:

• lunghezza media della frase misurata in parole;

• lunghezza media della parola misurata in sillabe (sostituisce il conteggio degli affissi; i risultati ottenuti sono simili ma risulta più semplice da misurare);

• percentuale di parole personali (elemento già impiegato nella precedente formula, viene ripreso con una nuova definizione: tutti i nomi con genere naturale, tutti i pronomi eccetto quelli neutri, la parola people ‘persone’ usata col verbo al plurale e la parola folks ‘gente’);

• percentuale di frasi personali (discorsi diretti, domande, richieste e altre frasi indirizzate direttamente al lettore, esclamazioni, frasi incomplete il cui significato è dedotto dal contesto; questo elemento è progettato per correggere il difetto strutturale della formula precedente, che non sempre riusciva a mostrare l'alta leggibilità dei periodi contenenti il discorso diretto).

La correlazione multipla dei quattro elementi con il criterio non mostra però un aumento significativo rispetto al valore predittivo della formula precedente. Flesch decide allora di calcolare due correlazioni multiple: una impiegando i primi due elementi, l’atra usando gli

40

ultimi due. Su queste intercorrelazioni costruisce quindi una formula in due parti: una misura l’indice di difficoltà e l’altra l’interesse che il testo suscita nel lettore.

Nella prima parte, Reading Ease, le variabili considerate sono il numero di sillabe per parola (cioè la lunghezza media delle parole) e il numero di frasi ogni 100 parole (cioè la lunghezza media delle frasi). Il numero di sillabe per parola viene assunto come indice di difficoltà semantica, mentre il numero di parole per frase viene assunto come indice di complessità sintattica.

La relazione tra la lunghezza delle frasi e la difficoltà è intuitivamente comprensibile: più una frase è lunga, più è sintatticamente complicata. La relazione tra la lunghezza delle parole e la difficoltà si basa sui risultati della statistica linguistica che stabilisce un rapporto tra la frequenza delle parole e la loro lunghezza: le parole più frequenti sono in genere le più brevi; esse sono generalmente parole concrete, con pochi affissi; i concetti astratti sono invece espressi da termini lunghi e composti. “Le parole frequenti sono quelle familiari, e le parole frequenti e familiari sono brevi, e le parole frequenti, familiari e brevi hanno pochi affissi, e lo scrittore che usi parole frequenti familiari brevi senza affissi presenta un basso rapporto tipo-replica” (Miller 1972, pp. 190-191).

La formula Reading Ease è la seguente:

Reading Ease Score = 206,835 − 0,846W − 1,015S

dove

W = numero medio di sillabe per parola (Word), ottenuto dividendo il numero di sillabe per il numero di parole;

S = numero medio di parole per frase (Sentence), ottenuto dividendo il numero di parole per il numero di frasi;

206,835 è un coefficiente numerico scelto per fare in modo che i valori oscillino da 0 a 100. Questo indice ha una correlazione di 0,70 con i brani dello Standard Test Lessons in Reading di McCall e Crabbs del 1926 e di 0,64 con la versione dello stesso test del 1950.

La formula, di facile applicazione anche per i non addetti ai lavori, predice la facilità di lettura su una scala da 1 a 100; un punteggio di 100 significa che un testo è molto semplice e che un bambino che ha completato la quarta elementare (5° grado) risponderà correttamente a ¾ di domande del test; un testo con un punteggio inferiore a 30 è considerato molto difficile e può essere capito da chi ha almeno una laurea.

41

Risultato Descrizione dello

stile Parole per frase Sillabe su 100 parole Tipo di rivista Livello di istruzione

0 - 30 Molto difficile ≥ 29 ≥ 192 Scientifica College

30 - 50 Difficile 25 167 Accademica 13° - 16° grado

50 - 60 Abbastanza difficile 21 155 Di qualità 10° - 12° grado

60 - 70 Normale 17 147 Digests 8° - 9° grado

70 - 80 Abbastanza facile 14 139 Narrativa

leggera 7° grado

80 - 90 Facile 11 131 Narrativa

scadente 6° grado 90 - 100 Molto facile ≤8 ≤ 123 Fumetti 5° grado

Tabella 1. Interpretazione degli indici di facilità di lettura (Flesh 1948).

In realtà la formula, così come le altre finora analizzate, ha un buon valore predittivo solo fino al 7° grado; oltre questo, sottovaluta il livello di istruzione. Questo dipende probabilmente dal fatto che la maggior parte di queste formule sono basate su materiali destinati ai bambini (Vogel e Washburne, Lorge, Flesch) o destinati ad adulti con limitate capacità di lettura (Dale e Tyler, Gray e Leary).

L’indice ha comunque molto successo e trova una lunga serie di applicazioni: viene impiegata per valutare articoli di giornale, romanzi, testi pubblicitari, documenti governativi, contratti di assicurazione, testi scolastici; viene anche insegnata in vari corsi presso diverse università. Sono stati fatti anche molti tentativi di calcolo automatico della formula tramite programmi informatici.

La seconda parte della formula misura l’interesse umano (Human interest) e si ottiene contando il numero di vocaboli personali (pronomi personali, nomi propri, nomi di persona) e di frasi personali (citazioni, esclamazioni, discorsi diretti, frasi incomplete, frasi che contengono una domanda, un ordine, una richiesta diretta al lettore). La formula è la seguente:

Human Interest = 3,64p + 0,31f

dove

p = percentuale di parole personali su 100 parole; f = percentuale di frasi personali su 100 frasi.

La formula non contiene costanti statistiche. Il coefficiente di correlazione multipla è 0,43. Se il valore si avvicina a 0 significa che ci sono pochi riferimenti personali; al contrario, se si avvicina a 100 indica che il testo è ricco di riferimenti personali ed è considerato molto semplice. Un buon romanzo ad esempio ottiene un punteggio di interesse umano compreso tra 60 e 100, una rivista di cultura (il New Yorker) tra 40 e 60, le riviste commerciali tra 10 e 20 e le opere scientifiche tra 0 e 10.

42 Risultato Descrizione dello stile Percentuali di

parole personali Percentuali di frasi personali Carattere della rivista 0 – 10 Noioso ≤ 2 0 Scientifica

10 - 20 Abbastanza interessante 4 5 Commerciale

20 - 40 Interessante 7 15 Digests

40 - 60 Molto interessante 11 32 New Yorker

60 - 100 Drammatico ≥ 17 ≥ 58 Narrativa

Tabella 2. Interpretazione degli indici di interesse umano (Flesh 1948).

Da questo momento Flesch produce “una vera e propria girandola di formule” (Biagioli et al. 1984). Nel 1950 pubblica la formula per misurare il livello di astrazione, che impiega come variabili il conteggio delle definits words e la lunghezza delle parole in sillabe. Le definits words sono una lista di parole che danno concretezza al testo, cioè nomi propri, nomi comuni con un significato specifico, aggettivi possessivi, pronomi personali, relativi, riflessivi, negazioni. Seguono la formula che misura il realismo e la vivacità (1954), quella che misura il formalismo/colloquialità (1958)31. Tutte queste formule incontrano subito critiche e obiezioni da parte degli studiosi del settore.