3.3 Variabili
3.3.3 Variabili lessicali: frequenza media del vicinato, am-
ampiezza del vicinato, distanza media dal vicinato
Per vicinato di una parola target, in senso stretto, si intende l’insieme delle parole che differiscono da quella parola per un carattere omesso, inserito o sostituito (corrispondente quindi ad una Levenshtein Distance =1).Le variabili che ho scelto di prendere in esame sono la frequenza media del vicinato, la grandezza del vicinato e la distanza media delle 20 parole che più si avvicinano alla parola target (Old20, Yarkoni et al. 2008), come riportate in ItAoA (Montefinese et al. 2019).
La frequenza media del vicinato si correla negativamente al tempo di lettura (r=-0.13, p-value <0.001), ovvero parole che presentano vicini ad alta frequenza tendono ad essere lette più velocemente. L’effetto aumenta al crescere della classe (si veda la Figura 3.15), come confermato dalle pendenze sempre più pendenti (con valori sempre più negativi) per i bambini a sviluppo tipico (con una significativa differenza tra la 6. e la 3. classe data da p-value <0.05).
Questo progressivo beneficiare delle frequenze cumulate di più parole ap- parteneneti allo stesso vicinato sembrerebbe caratterizzare anche i bambini a sviluppo atipico, seppur con una incrementalità meno lineare. I bambini a sviluppo atipico più piccoli, che abbiamo visto più volte riportare un tempo di lettura significativamente maggiore rispetto a tutti gli altri gruppi, risultano beneficiare maggiormente dell’effetto della frequenza media del vicinato, con un’intercetta e una pendenza significativamente diverse rispetto ai bambini di pari grado a sviluppo tipico (rispettivamente p-value <0.001 e <0.05).
CAPITOLO 3. ANALISI DEI PROFILI DI LETTURA 45 tipici atipici 0 2 4 6 0 2 4 6 0.5 1.0 1.5 2.0
frequenza media del vicinato
tempo per token
3 4 5 6
Figura 3.15: Interazioni lineari tra la frequenza media del vicinato e la classe come predittori del tempo di lettura per parola, per bambini a sviluppo tipico e atipico.
Anche la grandezza del vicinato, ovvero il numero dei vicini ortografi- ci della parola target, può facilitare il compito di lettura (r=-0.19, p-value <0.001). Si osservino i grafici di regressioni lineari riportati in Figura 3.16: sia nei bambini a sviluppo tipico che in quelli a sviluppo atipico si ha una diminuzione significativa delle intercette al crescere della classe (p < 0.001). Inoltre, nei bambini a sviluppo tipico, al crescere della classe si nota una lieve ma significativa diminuzione della pendenza delle rette di regressione (p-value <0.001 per le classi 4. e 6., <0.01 per la classe 5.): a differenza di quanto osservato per la frequenza media del vicinato, l’effetto facilitatorio di un vicinato ampio tende leggermente a diminuire al crescere della classe. Nei bambini a sviluppo atipico abbiamo sempre una diminuzione dell’effetto, ma meno significativa (p-value <0.05). Ancora una volta, sono i bambini a svi- luppo atipico più piccoli che sembrano giovare maggiormente della presenza di tanti vicini ortografici, con una intercetta (p <0.001) e una pendenza (p <0.01) significativamente diverse dai pari grado a sviluppo tipico.
CAPITOLO 3. ANALISI DEI PROFILI DI LETTURA 46 tipici atipici 0 5 10 15 20 25 0 5 10 15 20 25 0.5 1.0 1.5 2.0
numero dei vicini
tempo per token
3 4 5 6
Figura 3.16: Regressioni lineari della grandezza del vicinato per ogni classe come predittori del tempo medio di lettura, per bambini a sviluppo tipico e atipico.
Come risulta intuitivo, all’aumentare della distanza media dal vicinato (Old20 ), il tempo di lettura di una parola target aumenta (r=0.23, p-value <0.001). È interessante osservare che, nei bambini a sviluppo tipico, al cre- scere della classe, la distanza media dal vicinato progressivamente diventi sempre meno condizionante: le pendenze per le classi 4., 5. e 6. sono, infatti, significativamente minori rispetto a quella della classe 3. (p-value <0.01 per la classe 4., <0.001 per le classi 5. e 6.).
I bambini a sviluppo atipico più piccoli sembrano essere i più sensibili all’aumento della distanza media dal vicinato, con una pendenza significati- vamente maggiore rispetto ai bambini di classe 3. a sviluppo tipico (p-value <0.01).
CAPITOLO 3. ANALISI DEI PROFILI DI LETTURA 47 tipici atipici 1.0 1.5 2.0 2.5 3.0 1.0 1.5 2.0 2.5 3.0 1 2 Old20
tempo per token
3 4 5 6
Figura 3.17: Regressioni lineari della distanza media dai primi 20 vicini della parola target per ogni classe come predittori del tempo medio di lettura, per bambini a sviluppo tipico e atipico.
Da questi andamenti, l’effetto facilitatorio della familiarità lessicale (o wordlikeness) appare evidente. Per wordlikeness si intende il grado di tipicità (che si traduce in familiarità, dal punto di vista dei parlanti) di una sequenza di suoni nel lessico di una lingua. Essa può essere intesa come una probabilità fonotattica od ortotattica, ovvero la probabilità che in una certa lingua due o più suoni co-occorrano (Bailey & Hahn 2001) o che sequenze di caratteri occorrano frequentemente.
Il grado di wordlikeness influisce sull’acquisizione e sull’elaborazione les- sicale facilitando diversi compiti, come la ripetizione di non-parole, la de- nominazione lessicale (word naming) e l’identificazione di fonemi. Jusczyk, Luce & Charles-Luce (1994), conducendo un esperimento su un gruppo di bambini di 9 mesi, hanno scoperto che gli infanti preferiscono ascoltare non- parole caratterizzate da un’alta wordlikeness rispetto a non-parole con bassa wordlikeness.
CAPITOLO 3. ANALISI DEI PROFILI DI LETTURA 48 In aggiunta, in una lingua trasparente come l’italiano, caratterizzata da un mapping grafema-fonema tendenzialmente univoco, la presenza di chunk sub-lessicali9 condivisi da un vicinato ortografico ampio e frequente aumenta
il grado di familiarità lessicale di queste parole, facilitandone la lettura. I modelli di regressioni lineari che seguono riassumono bene questo effetto facilitatorio della familiarità lessicale, espressa in termini sia di frequenza media (si veda la Tabella 3.3) che di ampiezza del vicinato (3.4).
Parametric coefficients Estimate Std. Error t value Pr(>|t|)
Intercetta (tipici) 7.963e-01 2.669e+02 29.833 <2e-16 ***
Frequenza media vicinato -8.069e-02 5.641e-03 -14.303 <2e-16 ***
Atipici (intercetta) 3.834e-01 9.250e-02 4.145 3.75e-05 ***
Frequenza media vicinato*atipici -2.982e-02 2.175e-02 -1.371 0.17
Effetti random: bambini <2e-16 ***
R2(conditional) = 28.74%
Tabella 3.3: Coefficienti e significatività relative al modello lineare a ef- fetti misti lmer (tempo per token ~ frequenza media vicinato*gruppo + (1|bambini)).
Parametric coefficients Estimate Std. Error t value Pr(>|t|)
Intercetta (tipici) 6.694e-01 2.131e-02 31.41 <2e-16 ***
Ampiezza vicinato -1.355e-02 8.242e-04 -16.44 <2e-16 ***
Atipici (intercetta) 3.957e-01 7.130e-02 5.55 6.07e-08 ***
Ampiezza media vicinato*atipici -9.981e-03 3.110e-03 -3.21 0.00133 **
Effetti random: bambini <2e-16 ***
R2(conditional) = 29.07%
Tabella 3.4: Coefficienti e significatività relative al modello lineare a effetti misti lmer (tempo per token ~ ampiezza vicinato*gruppo + (1|bambini)).
In particolare, si noti come il contributo di entrambe le variabili sia più significativo per i bambini a sviluppo tipico rispetto a quelli a sviluppo atipico.
9Per chunk sub-lessicale si intende una sequenza grafemica, alla quale corrisponde una
determinata sequenza fonologica, attestata in un certo numero di token. Esso può coinci- dere con un’unità morfemica (ad esempio, «parl», «and», «are», «iamo», «buon», «gatt», «ato», «ico») o con un nesso sequenziale di caratteri («gli», «gn», «inter», «pre»).
CAPITOLO 3. ANALISI DEI PROFILI DI LETTURA 49 Questa evidenza, unitamente all’effetto messo in luce dagli andamenti per le frequenze di parola, suggerisce che lo sviluppo di una strategia lessi- cale integrata con una strategia sub-lessicale sia più efficiente nei bambini a sviluppo tipico, rispetto ai bambini a sviluppo atipico.
Come evidenziato nel capitolo 2, i modelli della lettura concordano nel- l’individuare nell’integrazione delle due strategie - lessicale e sub-lessicale - la matrice della competenza nel lettore non ancora esperto, il quale progres- sivamente inizia a fare maggiore affidamento sulla strategia lessicale per le parole ad alta frequenza (questo è confermato dalle pendenze nei modelli di regressione lineare che, per i bambini a sviluppo tipico, diventano progressiva- mente minori, al crescere della classe di scolarità). A ciò si aggiunge l’effetto di un lessico che progressivamente si arricchisce, trasformando la strategia sub-lessicale: si passa, in questo modo, da una lettura sillabica a una lettura sub-lessicale progressivamente sempre più dipendente da sotto-strutture ben più ampie della semplice sillaba, come ad esempio, le unità morfemiche o le stringhe di caratteri (chunk) condivise da più parole.