• Non ci sono risultati.

Speech motor control: teorie a confronto

Nel documento Apprendimento, cognizione e tecnologia (pagine 194-199)

Fontana Rosa

Dip. di Scienze Cognitive, Psicologiche, Pedagogiche e degli Studi Culturali

Università di Messina rfontana@unime.it

1. La H&H theory e il modello DIVA

Il linguaggio articolato è la principale modalità di comunicazione umana, un mezzo attraverso il quale i messaggi linguistici discretamente specificati vengono convertiti in un segnale acustico, percepibile e compreso da un a- scoltatore.

È il prodotto di azioni combinate di diversi sistemi molto complicati, con un unico set di proprietà biomeccaniche e fisiologiche (Perkell 2002).

Obiettivo di chi parla è quello di produrre sequenze di suoni con i model- li acustici che sono comprensibili per l’ascoltatore. Questa visione porta a ipotizzare che le variabili controllate per i movimenti vocali siano modelli di sensazione uditiva e somatosensoriale modificabili nel tempo.

Lindbom (1987; 1990; 1994) ha formulato la “H&H theory”, secondo la quale la variabilità della produzione linguistica è spiegabile attraverso l’analisi di un continuum che procede dall’hyper-speech (ossia il parlato più accurato e scandito) all’hypo-speech ( il parlato informale e trascurato).

Secondo tale teoria, la produzione fonetica è connessa alla capacità di decodifica percettivo-uditiva per cui l'intelligibilità del parlato è data dalla somma dell'informazione fonetica (signal dependent) e dall'informazione re-

cata dal contesto linguistico ed extra-linguistico (signal independent). La per- cezione è un processo quindi attivo in cui le informazioni acustiche sono usa- te dall'ascoltatore per formare delle ipotesi sulla struttura della frase.

L’interpretazione finale dell'ascoltatore dipende, quindi, da un numero di variabili che si aggiungono all'informazione strettamente acustica ed interagi- scono con essa.

Un modello più recente, chiamato DIVA, propone di spiegare la produ- zione articolata tramite una serie di relazioni tra gli obiettivi neurocomputa- zionali sensoriali, l’attività cerebrale, la potenza del motore vocale, le conse- guenti uditive e le sensazioni somatosensoriali (Guenther 1994, 1995; Guen- ther, Ghosh e Tourville 2006; Guenther, Hampson e Johnson 1998).

DIVA fornisce una base unica per fare test quantitativi di ipotesi circa i meccanismi neurali di controllo motorio del discorso e le loro conseguenze comportamentali (cinematiche ed acustiche).

La maggior parte degli studi più recenti sono stati ispirati direttamente da DIVA. La volontà di determinare se la percezione del discorso coinvolge rappresentazioni e processi uditivi o multisensoriali, indipendentemente da ogni conoscenza procedurale per la produzione di unità di discorso (Diehl, Lotto e Holt 2004), o se invece si basa su una ricodifica degli input sensoriali in termini di gesti articolatori, così come formulato nella “Teoria Motoria della Percezione dello Speech “(Liberman, Cooper, Harris, e MacNeilage 1962; Liberman e Mattingly 1985; Liberman e Whalen 2000) ha infiammato il dibattito sulla natura della comunicazione vocale e ancora oggi costituisce un punto nodale per la validità delle teorie motorie del linguaggio articolato.

A favore di queste ultime, di certo può essere considerata la scoperta dei neuroni specchio (Rizzolatti e Craighero 2004; Rizzolatti, Fogassi e Gallese 2001), che ha fortemente rinnovato l'interesse per le teorie del controllo mo- torio.

2. La teoria della percezione per azione del controllo

Mentre questi dati neurofisiologici rafforzano chiaramente la plausibilità del ruolo di proprietà del motore nella percezione, la cosiddetta “Teoria della percezione per azione del Controllo” ( meglio conosciuta come PACT, ossia Perception-for-Action-Control Theory) (Schwartz et al. 2007) mira a mettere in evidenza quanti e quali gaps esistono nei suddetti approcci.

Innanzitutto le teorie motorie falliscono nel dimostrare predizioni effi- cienti circa le regolarità dei sistemi fonologici; secondariamente le stesse hanno una certa difficoltà a spiegare un determinato numero di fenomeni nei quali la produzione dell’articolazione linguistica porta ad una variabilità di principio negli stimoli della produzione articolata del discorso (Fowler 1986).

PACT propone una sintesi tra il punto di vista motorio e auditorio. In questo contesto, gli oggetti della percezione dell’articolazione linguistica non sono né solamente auditori né tanto meno esclusivamente motori. Essi sono sia percezioni multisensoriali regolarizzate dalla conoscenza della produzione dell’articolazione linguistica, sia gestualità (gesti articolatori) della stessa, raffigurate dai processi percettivi.

Tale teoria motor-sensoriale ha anche dei fondamenti neuroanatomici, basati su quella che comunemente viene chiamata “radice dorsale” della per- cezione dell’articolazione linguistica nella corteccia umana che unisce le aree temporali con quelle parietali (Hickok e Poeppel 2007; Skipper et al. 2007). 3. La Teoria del Frame/content

Interessante da sottolineare è Teoria del “Frame/content” di MacNeila- ge e Davis (2002). Essa prevede che tra due sillabe consecutive vi sia una de- terminante variazione nella dimensione alto/basso più che in quella ante- ro/posteriore. Secondo tale teoria, il rapporto tra frequenze attese ed osservate nelle associazioni CV preferenziali (anteriori/posteriori, centrali/labiali, po- steriori/velari), dovrebbe essere sempre superiore a 1 .

Analizzando lo sviluppo motorio del linguaggio attraverso lo studio del babbling, o lallazione, gli autori ritengono che il bambino sia capace di ac- quisire schemi motori e controllo articolatorio attraverso una singola base motoria universale, filogeneticamente e ontogeneticamente derivata dall’attività neuromuscolare legata alla nutrizione (Davis e MacNeilage 1995).

L’alternanza regolare e ritmica tra l’apertura e la chiusura della mandibo- la, è infatti generatore di un effetto acustico percepito dall’orecchio di un a- dulto come sillaba, o comunemente detta “prima parola” Questa sillaba ini- zialmente non è che una cornice vuota (pure frame) ( MacNeilage e Davis 1990), un’imitazione della sillaba adulta il cui contenuto è caratterizzato da un numero di combinazioni tra CV, consonanti-vocali, spesso originate dalla stessa posizione di lingua e lingua legata al movimento ritmico di tipo oscil- latorio della mandibola.

Solamente quando il bambino, rivolgendo una maggiore attenzione verso la lingua parlata dell’ adulto, aumenterà un maggior controllo sui singoli arti- colatori ( la lingua soprattutto), si vedrà un’acquisizione di maggiore indi- pendenza degli elementi del contenuto ( content), cioè i singoli foni, potendo per tanto generare effetti acustici simili a quelli che nel frattempo ascolta, quindi reali.

La somiglianza di queste vocalizzazioni al parlato adulto non è notata so- lamente dai suoi genitori, ma anche dallo stesso bambino, il quale, introiet-

tando i patterns propriocettivi e gli effetti acustici, è in grado di paragonare i patterns del parlato esterno a quelli propri, e adeguare questi ultimi ai primi. Sempre secondo MacNeilage e Davis, nell’organizzazione intrasillabica del babbling le consonanti linguali anteriori (coronali) co-occorrerebbero quasi esclusivamente con le vocali anteriori, le consonanti linguali posteriori (dor- sali) con le vocali posteriori e le consonanti labiali anteriori con le vocali cen- trali (perché quando le labbra rilasciano la costrizione la lingua si troverebbe in posizione di riposo).

L’ipotesi frame/content consentirebbe di offrire una spiegazione plausibi- le sia dell’evoluzione dell’articolazione vocale che dello sviluppo ontogeneti- co della stessa, avvalorando la fondatezza delle teorie dello speech motor control.

Bibliografia

Browman, C.P., Goldstein, L. (1990) Tiers in articulatory phonology with some im- plications for casual speech. Papers in Laboratory phonology I: Between the grammar and physics of speech, J., Kingston, & M. E., Beckman (eds.) pp. 341– 376.

Davis, B.L., MacNeilage P.F. (1995) The articulatory basis of babbling. Journal of Speech and Hearing Research, 38(6), 1199-1211.

Diehl, R.L., Lotto, A.J., Holt, L.L. (2004) Speech perception. Annual Review of Psy- chology, 55:149-179.

Fowler, C.A. (1986) An event approach to the study of speech perception from a di- rect-realist perspective. Journal of Phonetics, 14(1), 3–28.

Guenther, F.H. (1994) A neural network model of speech acquisition and motor equivalent speech production. Biological cybernetics, 72(1), 43–53.

Guenther, F.H. (1995) Speech sound acquisition, coarticulation and rate effects in a neural network model of speech production. Psychological Review, 102(3), 594– 621.

Guenther, F.H., Hampson, M., Johnson, D. (1998) A theoretical investigation of ref- erence frames for the planning of speech movements. Psychological Review, 105(4), 611–633.

Guenther, F.H., Gjaja, M.N. (1996) The perceptual magnet effect as an emergent property of neural map formation. Journal of the Acoustical Society of America, 100(2), 1111–1121.

Hickok, G., Poeppel, D. (2007) The cortical organization of speech processing. Nature Reviews Neuroscience, 8(5), 393–402.

Lindblom, B. (1987) Adaptive variability and absolute constancy in speech signals: two themes in the quest for phonetic invariance. In Proceedings of the XIth Internetional congress of phonetic sciences (vol.3, pp. 9-18).

Lindblom B. (1990) Explaining phonetic variation: a sketch of the H&H theory, in Speech production and speech modelling (pp. 403-439). Springer Netherlands. Lindblom, B. (1994) Role of articulation in speech perception: Clues from production

studies.The journal of the Acoustical Society of America, 95(5), 2848-2848. Liberman, A.M., Cooper, F.S., Harris, K.S., MacNeilage, P.F. (1962) A motor theory

of speech perception. In Proceedings of the speech communication seminar. Stockholm 1962.

Liberman, A.M., Mattingly, I.G. (1985) The motor theory of speech perception re- vised. Cognition, 21(1), 1–36.

Liberman, A.M., Whalen, D.H. (2000) On the relation of speech to language. Trends in Cognitive Science, 4(5), 187–196.

MacNeilage, P.F., Davis B. L. (2002) On the origin of intersyllabic complexity. TY- POLOGICAL STUDIES IN LANGUAGE, 53, 155-170.

MacNeilage P.F., Davis B.L. (1990) Acquisition of speech production: frames, then content.

Perkell, J.S. (2012) Movement goals and feedback and feedforward control mecha- nisms in speech production. Journal of Neurolinguistics, 25(5), 382-407.

Redican W.K., Rosenblum, L.A. (1975) Facial expressions in nonhuman primates. Stanford: Stanford Research Institute.

Rizzolatti, G., Craighero, L. (2004) The mirror-neuron system. Annual Review of Neuroscience, 27, 169–192.

Rizzolatti, G., Fogassi, L., Gallese, V. (2001) Neurophysiological mechanisms under- lying the understanding and imitation of action. Nature Reviews Neuroscience, 2(9), 661–670.

Schwartz, J.L., Boe¨, L.J., Abry, C. (2007) Linking dispersion-focalization theory and the maximum utilization of the available distinctive features principle in a percep- tion-for-action-control theory. Experimental approaches to phonology, 104–124. Skipper, J.I., van Wassenhove, V., Nusbaum, H.C., Small, S.L. (2007) Hearing lips

and seeing voices: how cortical areas supporting speech production mediate audio- visual speech perception. Cerebral Cortex, 17(10), 2387–2399.

L'evoluzione della relazione tra « giovani invalidi » e

Nel documento Apprendimento, cognizione e tecnologia (pagine 194-199)

Outline

Documenti correlati