2. Il linguaggio nel decadimento cognitivo
2.3. Implicazioni per questo studio
Come è stato visto nei paragrafi precedenti, il declino delle facoltà linguistiche è individuabile già diversi anni prima della fase clinica di molti tipi di demenze. In letteratura, infatti, non mancano studi longitudinali retrospettivi che hanno dimostrato come alcuni parametri linguistici, estratti da testi scritti o dal parlato spontaneo, possano funzionare da indici di una disfunzione cognitiva. Il Nun Study, ad esempio, ha evidenziato come bassi valori di idea density in brevi testi autobiografici correlino positivamente con la presenza, a circa 60 anni di distanza, di ammassi neurofibrillari nei lobi frontale e temporale. Ridotte competenze linguistiche nell’adolescenza potrebbero quindi essere indice di uno sviluppo neurologico e cognitivo non ottimale e rendere il soggetto più incline a contrarre l’Alzheimer in tarda età (Snowdon et al., 2000).
Se i test linguistici standardizzati hanno dimostrato un'ampia affidabilità nella diagnosi, grazie anche a una certa resistenza agli effetti floor e ceiling2,i testi basati, ad esempio, sul parlato spontaneo risentono più facilmente della variabilità intraindividuale e rendono più complessa la valutazione delle abilità linguistiche. Tuttavia, il parlato spontaneo, oltre a essere permeabile a fenomeni di disfluenza e semplificazione (Croisile
1 L’idea density misura quanta informazione sia presente in un enunciato in relazione al numero di parole
che esso contiene. Valori alti rappresentano una produzione informativa, mentre valori bassi sono indice di una produzione vaga e/o ripetitiva (Snowdon et al., 1996).
2 Ambedue gli effetti si riferiscono alla condizione per cui una variabile indipendente non ha più alcun
effetto su una variabile dipendente. Nello specifico, gli effetti floor e ceiling si hanno quando i valori ottenuti dai soggetti in un test si appiattiscono, rispettivamente, nella parte bassa e alta del range dei valori, rendendo nullo il potere classificatorio del test (Ercolani, 2008).
22
et al., 1996; Forbes-MacKay et al., 2002), permette una più ecologica analisi delle possibili modificazioni avvenute a livello del linguaggio, in quanto rappresenta una più naturale risposta da parte dei soggetti agli stimoli sperimentali (Bucks et al., 2000).
L'affinamento delle tecniche del Natural Language Processing ha reso possibile analizzare quantità di dati sempre maggiori e ha permesso di studiare aspetti del linguaggio altrimenti difficilmente indagabili. In anni relativamente recenti, si è quindi assistito a una crescita rilevante di studi riguardanti la diagnosi della demenza basata sull’analisi automatica del parlato spontaneo. Nonostante ciò, problemi legati perlopiù alla completa automazione dell’intero processo di analisi e a livelli di accuratezza al di sotto dei più utilizzati test neuropsicologici, rendono ancora lontano l’utilizzo di tali tecniche in ambito clinico. Inoltre, ulteriori sforzi vanno fatti in direzione di un ampliamento della ricerca a lingue differenti dall’inglese, in modo da poter disporre di risultati confrontabili e generalizzabili.
In prospettiva, la capacità di tali strumenti di rilevare pattern latenti nel linguaggio potrebbe essere impiegata anche nell'individuazione delle fasi prodromiche della demenza, come ad esempio il Mild Cognitive Impairment (MCI). Infine, il fatto di rappresentare una metodologia non invasiva e a basso costo rende queste tecniche adatte ai fini dello screening su larga scala della popolazione potenzialmente a rischio.
2.3.1 Analisi automatica del parlato spontaneo
Partendo dagli studi riguardanti i deficit che interessano la sfera del linguaggio nelle malattie come l’Alzheimer, la ricerca si è impegnata soprattutto nell'individuazione e nell’estrazione di feature in grado di cogliere i differenti stadi del deterioramento cognitivo, con l’obiettivo di creare insiemi di misure affidabili da implementare in sistemi automatici per la diagnosi (Jarrold et al., 2010; Roark et al., 2011; Satt et al., 2012; Satt et al., 2013; König et al., 2015).
Date le caratteristiche del deficit linguistico nella malattia d’Alzheimer, la maggior parte dei tratti linguistici (o feature) studiati e valutati riguardano, direttamente o indirettamente, le difficoltà di accesso lessicale e di rappresentazione semantica o il livello concettuale di pianificazione dell’enunciato. Misure come quelle di idea density
23
(Jarrold et al., 2010; Beltrami et al., 2016; Toledo et al., 2018) sono risultate efficaci in diversi studi, anche se non mancano eccezioni (Roark et al., 2011). Altri marker utilizzati con successo sono il rapporto tra classi aperte e classi chiuse di parola (Thomas et al., 2005; Roark et al., 2011; Beltrami et al., 2016) e il numero di ripetizioni e correzioni di parti del discorso (De Lira et al., 2011; Orimaye et al., 2014). Al contrario misure di ricchezza lessicale come Type-Token Ratio (TTR), Brunét’s Index (W) e Honoré’s
Statistic (R) hanno dato risultati contrastanti (Bucks et al., 2000; Thomas et al., 2005;
Beltrami et al., 2016).
Indirettamente collegate al deficit nell’accesso lessicale e alla pianificazione dell’enunciato sono le feature relative all’aspetto temporale della produzione. La durata media delle pause e dei segmenti senza pause sono tra i marker più efficienti nei sistemi automatici per la diagnosi dell’Alzheimer (Singh et al., 2001; Satt et al., 2013; König et al., 2015; Beltrami et al., 2016), così come la durata delle pause ai confini sintattici maggiori (Pistono et al., 2017), la frequenza delle pause e il Phonation Rate (Roark et al., 2011; Khodabakhsh et al., 2014; Tóth et al., 2015; Beltrami et al., 2016; Fraser et al., 2016).
Come accennato nei precedenti paragrafi, gli strumenti per la diagnosi dell’Alzheimer basati sull’analisi del parlato spontaneo hanno permesso di individuare delle problematicità latenti anche a livello sintattico. Lunghezza media dell’enunciato, lunghezza media delle relazioni di dipendenza a livello sintattico (Roark et al., 2007; Beltrami et al., 2016) e “profondità” della struttura sintattica (Beltrami et al., 2016) sono risultate utili nell’individuazione di soggetti già a uno stadio premorboso della demenza quali quelli affetti da MCI.
Infine, un importante gruppo di feature nei sistemi di diagnosi basati sull’analisi del parlato è composto dai marker relativi all’aspetto fonico-fonetico della produzione orale. Gonzalez-Moreira e colleghi (2015) hanno ottenuto un’accuratezza dell’85% nella classificazione di soggetti affetti da demenza lieve utilizzando un set di feature di natura prosodica, quali la velocità di articolazione (articulation rate), la durata media delle sillabe, la deviazione standard e la media della F0 calcolata su tutte le sillabe.
Questa categoria è caratterizzata sia da feature dotate che da feature non dotate di significato linguistico. A metà strada di questo continuum si situano, ad esempio, misure come la media e la deviazione standard della absolute delta energy, che potrebbero
24
indicare lo sforzo cosciente del parlante nel marcare una parola semanticamente rilevante tramite un accento (Khodabakhsh et al., 2015). Oppure misure della qualità della voce come jitter, shimmer e Harmonics-to-Noise Ratio (HNR), le quali forniscono informazioni sulla modalità di vibrazione delle corde vocali durante la fonazione (López- de-Ipiña et al., 2015). Infine, misure come spectral centroid e Higuchi fractal dimension, nonostante descrivano la produzione orale più in quanto segnale acustico che come produzione linguisticamente rilevante, sono risultate molto affidabili nei sistemi di diagnosi dell’Alzheimer basati sull’analisi del parlato spontaneo (López-de-Ipiña et al., 2013; Beltrami et al., 2016).
Tutte le feature discusse in questo paragrafo hanno permesso di ottenere buoni risultati nella classificazione automatica dei soggetti affetti da demenza. Tuttavia, come già accennato, l’ampia variabilità dei risultati ottenuti, con un’accuratezza nelle previsioni che oscilla tra il 70% e l’85%, e la mancanza di una vera e propria standardizzazione di queste misure rendono ancora lunga, cionondimeno percorribile, la strada verso l’utilizzo clinico di tali sistemi.
Nel capitolo successivo verrà fornita una panoramica sui fenomeni di esitazione presenti nel parlato, con lo scopo di delimitare concettualmente quell’aspetto della produzione orale da cui sono state estratte le feature utilizzate in questo studio per discriminare soggetti sani da soggetti affetti da demenza.
25