• Non ci sono risultati.

primati non umani Introduzione

3.2 Percezione uditiva di segnali vocal

Nel precedente capitolo abbiamo visto come i meccanismi di percezione categoriale e apprendimento statistico, che consentono al bambino di segmentare il flusso linguistico percependo gli elementi fonetici presenti nel continuum sonoro in modo discreto e rilevare nell'input regolarità distribuzionali descrivibili in termini statistici, costituiscano un sostrato fondamentale (anche se non dominio-specifico) per l'acquisizione della capacità linguistica nei piccoli di sapiens. Grazie ai risultati pervenuti da molte linee di ricerca riteniamo di poter affermare che si tratta di proprietà generali di meccanismi percettivi filogeneticamente antichi, utilizzati da molte altre specie animali in diversi domini cognitivi, pertanto in questa sede ci concentreremo esclusivamente sui fenomeni che riguardano in modo più specifico le proprietà acustiche dei segnali comunicativi.

65 “Cooperatively breeding species have significantly more contact calls and alarm calls than species that do not breed cooperatively. The functional repertoires of cooperative breeders therefore increase largely through the addition of contact calls and potentially alarm calls.[...] Additionally, a recent comparative study of new world jays found that cooperative breeding was associated with reduced repertoire size [52]. One potential explanation for the discrepancy in results is that cooperative breeding may have clade-specific effects, and the evolution of functional repertoire size may change depending on the group of cooperative

Uno dei metodi più efficaci per indagare comparativamente i meccanismi implicati nella percezione del linguaggio e testare le teorie che ipotizzano dei meccanismi percettivi specifici prevede l'utilizzo di suoni linguistici opportunamente modificati in modo da eliminare alcune informazioni contenute nel segnale. Impiegando questa strategia, Ramus e colleghi (2000) si sono concentrati sulla dimensione prosodica, costituita da ritmo e intonazione, la cui percezione è stata indagata anche nei tamarini dal ciuffo bianco (Saguinus oedipus oedipus, una scimmia callitrichide del Nuovo Mondo), oltre che in infanti umani appena nati, utilizzando il paradigma dell'abituazione- disabituazione66 agli stimoli, che non richiede alcun tipo di addestramento, rendendo

così immediatamente comparabili le performance delle due popolazioni. In una serie di esperimenti, individui di entrambe le specie sono stati sottoposti all'ascolto di frasi proferite in due diverse lingue, giapponese e olandese (appartenenti a differenti classi ritmiche) in 3 diverse condizioni sperimentali: 1) linguaggio naturale ma prodotto da parlanti di genere diverso, 2) linguaggio alterato in modo da preservare solo le informazioni prosodiche in esso contenute, 3) linguaggio naturale ma riprodotto al contrario (backforward). Dai risultati dello studio emerge un quadro interessante: nella prima condizione i neonati hanno esibito performance discriminative sotto le aspettative mentre i tamarini sono stati generalmente in grado di percepire le differenze prosodiche fra i due stimoli, nella seconda condizione entrambe le specie hanno discriminato efficacemente l'input (sebbene i tamarini abbiano performato in modo leggermente peggiore rispetto alla prima condizione, più “naturalistica”), la terza condizione ha invece messo in difficoltà tutti i soggetti testati. Cosa è possibile ricavare da questi dati? Secondo gli autori dello studio, i risultati negativi ottenuti nella prima batteria di test sono imputabili alla grande variabilità degli stimoli utilizzati nel set “naturalistico” che potrebbe aver distolto l'attenzione degli infanti dalle componenti prosodiche finendo per indebolire le loro performance discriminative. I risultati riportati negli altri due set sperimentali suggeriscono invece la presenza di importanti similarità nei meccanismi impiegati da queste due specie di primati (lontane dal punto di vista filetico) per processare gli input linguistici sulla base di indizi di natura ritmico-prosodica, (sebbene sia possibile che ciascuna specie faccia maggiore affidamento su alcuni particolari

66 Nel caso dei bambini è stata impiegata la procedura della suzione non nutritiva, per le scimmie invece sono state rilevate le risposte di orientamento della testa nei confronti della fonte sonora.

aspetti percettivi piuttosto che altri). Nel tentativo di chiarire ulteriormente la questione i ricercatori hanno testato i tamarini utilizzando anche stimoli linguistici appartenenti alla stessa classe ritmica (nella fattispecie olandese e inglese americano); a queste condizioni i soggetti non sono stati in grado di effettuare alcuna distinzione (Tincoff et al 2004), replicando in sostanza i risultati ottenuti con i neonati umani, e perfino con i ratti (Toro et al 2003).

Altri dati interessati provengono da una serie di studi sperimentali condotti su una femmina adulta di scimpanzé, Panzee, allevata in ambiente umano dall'età di 8 giorni, addestrata all'uso di lessigrammi (simboli visivi astratti) che è in grado di accoppiare correttamente alle circa 130 parole inglesi a cui si riferiscono ed usare in contesti socio- comunicativi nelle interazioni quotidiane con i caregivers umani. Sfruttando queste competenze, Heimbauer e colleghi (2011) hanno sottoposto al soggetto delle versioni alterate di alcune parole, normalmente riconosciute da Panzee, in modo da confrontare le sue performance percettive con quelle esibite da individui adulti della nostra specie. Gli stimoli utilizzati consistevano in 48 parole, che Panzee doveva accoppiare ai lessigrammi corrispondenti su uno schermo, presentate in 3 condizioni: 1) naturale, 2) sine-wave , 3) noice-vocoded. E' opportuno ricordare cosa intendiamo con questa terminologia: una parola in sine-wave è una parola ridotta a soli 3 toni puri (o sinusoidi) “a rappresentare le frequenze delle 3 formanti più importanti per convogliare informazioni fonetiche e distinguere suoni vocalici e consonantici” 67(Fitch 2011),

viceversa, una parola in noise-vocoded è invece una parola in cui le informazioni sulle frequenze sono sensibilmente ridotte ma che ritiene intatti gli aspetti temporali connessi alle variazioni di ampiezza del segnale nel tempo (ritmo e aspetti soprasegmentali, assenti nella versione sine-wave). Entrambe le tipologie di stimoli sintetizzati possono all'occorrenza essere riconosciute da soggetti umani adulti, sebbene con una certa difficoltà rispetto alle corrispettive forme “naturali”. Nell'esperimento condotto da Heinbauer, le performance di Panzee sono risultate paragonabili a quelle del campione umano; lo scimpanzé è infatti riuscito a riconoscere ed associare le parole ai corretti lessigrammi anche nelle versioni in cui lo stimolo acustico era alterato nei modi che sopra abbiamo spiegato, dimostrando di saper sfruttare a livello percettivo sia indizi fonetici che ritmico-prosodici in modo flessibile, a seconda delle situazioni.

Allo stato attuale delle conoscenze, sembra quindi ragionevole concludere che la sensibilità percettivo-uditiva nei confronti degli indizi sia prosodici che fonetico- spettrali (frequenze-specifici) contenuti nello speech stream (abilità ritenute rilevanti anche in funzione dell'acquisizione delle prime strutture sintattiche di base del linguaggio) costituisca un tratto condiviso, quantomeno all'interno dell'ordine dei primati, e in seguito rifunzionalizzato a scopo prettamente linguistico nel sapiens. Il successo di Panzee nei compiti di processamento linguistico potrebbe altresì riflettere l'importanza che l'esperienza e l'interazione col contesto socio-ecologico hanno nella progressiva strutturazione delle capacità cognitive (lo scimpanzé in questione è infatti enculturated, ovvero nato e cresciuto fra pratiche umane, immerso in un ambiente linguisticamente ricco). In questa prospettiva, molte delle funzioni cognitive tradizionalmente considerate in modo “modulare”, piuttosto che riflettere delle “specializzazioni adattative” sorte ex novo in seguito a mutazioni casuali e processi di selezione naturale strictu sensu, potrebbero derivare da un “toolkit neuro-cognitivo di sviluppo” largamente condiviso e finemente regolato specie-specificamente a livello epigenetico in base alla nicchia socio-ecologica che hanno occupato ed occupano attualmente gli organismi.