• Non ci sono risultati.

Ricognizione delle fasi di analisi e passaggio allo studio del movimento

Sezione A Naturalizzazione dell'oggetto

2. Fisiologia della visione

2.5 Ricognizione delle fasi di analisi e passaggio allo studio del movimento

Secondo quanto abbiamo studiato, il passaggio dalla ricezione dell'impressione alla formazione dell'immagine visiva avviene tramite una progressiva e organizzata (mirata) convergenza dei circuiti neuronali. Da questo punto di vista, il sistema nervoso ricostruisce la scena visiva (a partire dalle informazioni afferenti dai fotorecettori) e si può dunque parlare di un procedere sintetico. Se consideriamo invece il risultato conseguito dal sistema nervoso “dall'alto in basso”, tuttavia, possiamo e anzi, a mio avviso, dobbiamo parlare di un procedere analitico. Nel ricostruire la scena visiva, ciascuna stazione neurale controlla il verificarsi di alcune condizioni, per esempio, nel caso delle cellule semplici, che siano attivi i fotorecettori corrispondenti all'orientamento preferenziale, e causa l'attivarsi di un determinato pattern piuttosto che un altro. Si può dunque parlare di pattern composti da sequenze condizionate di attivazioni, i quali selezionano o estraggono dalla scena complessiva alcune caratteristiche salienti, riconoscendone la presenza. Se percorriamo in senso inverso la circuiteria neuronale, dunque, è come se il sistema nervoso procedesse applicando delle chiavi di lettura (i pattern di attivazioni condizionate) per leggere ciò che segnalano i fotorecettori e combinasse poi i risultati derivanti dai vari esami. Questo procedere è analitico: si ricerca infatti in qualcosa di dato ciò che si assume lo componga.

Se ci approcciamo alle operazioni del sistema nervoso dal secondo punto di vista, è interessante osservare che il sistema nervoso sembra seguire sempre una stessa procedura: la percezione delle figure sembra essere un processo di associazione dal dettaglio all'intero, in cui devono essere dati soltanto l'intero in forma semplice, la codificazione esplicita degli elementi e la codificazione esplicita delle associazioni. Rileggendo il percorso fin qui fatto in conformità con questa tesi, potremmo dire che nella retina si forma un'impressione materialmente scomposta nei vari fotorecettori, uno stimolo globale, in cui necessariamente tutte le informazioni da processare devono già essere contenute; le cellule ganglionari, successivamente, computano la distribuzione dello stimolo intero tramite l'analisi della caratteristica dei contrasti di luminosità acromatica e cromatica, i quali vengono messi in evidenza, realizzando così i contorni, computati in aree corrispondenti alle parti di campo visivo coperte dai campi recettivi delle cellule ganglionari deputate.

Il risultato di questa prima sistemazione corrisponde a ciò che Marr definisce “primal sketch”, così caratterizzato dall'autore:<<makes explicit important informations about the two dimensional image, primarily the intensity changes there and their geometrical distribution and organization>>157.

Il NGL sfrutta il “primal sketch” per la coordinazione con altre funzioni cognitive, ma ritrasmette le informazioni che lo compongono sostanzialmente invariate. La corteccia visiva, invece, esplicita caratteristiche via via più specifiche, quali l'orientamento, l'occhio di provenienza, le strutture ad angolo e simili. Tramite questo lavoro di analisi, evidenzia i criteri in base a cui operare la congiunzione degli elementi in una rappresentazione bidimensionale. Il risultato di questa seconda serie

di codifiche corrisponde a ciò che Marr definisce come <<2-D sketch>>, che caratterizza come segue:<<makes explicit the orientation and rough depth of the visible surfaces, and contour discontinuities in these quantities in a viewer-centered coordinate frame>>158. In realtà, noi abbiamo visto che l'analisi/costruzione di un

sistema di riferimento centrato sull'osservatore è separata dalla costruzione della rappresentazione corticale bidimensionale, poiché fa parte della percezione della profondità, la quale è computata separatamente. Il “2-D sketch” differisce dal “primal sketch” soprattutto perché il primo contiene in forma esplicita (cioè in quanto tali) le caratteristiche geometriche che nel secondo erano computate soltanto come cambiamenti di intensità e posizione all'interno dello stimolo di partenza. Il “2-D sketch”, tuttavia, è computato in una forma disgregata che deve essere ricomposta; tale ricomposizione è un processo che avviene nelle aree extrastriate ed è il momento in cui vengono esplicitati dettagli sempre più raffinati dal punto di vista associativo anziché analitico159.

Tramite una via di analisi dedicata, le informazioni che abbiamo indicato nel sottoparagrafo 2.4, conformemente al ragionamento da me condotto lì, vengono impiegate per la costruzione della percezione tridimensionale. Come accadeva per le leggi di organizzazione del campo visivo, anche i fattori monoculari indiziari come sono esposti nel sottoparagrafo 2.4 non sono altro che la forma psicofisica delle condizioni necessarie e sufficienti contenute nei principi che il sistema visivo usa per

158 Ibidem.

159 Cfr. Kandel, op. cit, pp.556-559. V4 parebbe essere sensibile a variazioni di forme complesse e di colori in condizioni diverse di illuminazione ambientale; le cellule della corteccia IT, dato il loro ampio campo recettivo, potrebbero essere coinvolte nella capacità di riconoscimento di uno stesso oggetto indifferentemente dalla posizione nel campo visivo; alcune cellule di V4 rispondono soltanto a strutture molto complesse come le mani o le facce o i lineamenti del volto, segno che organizzano molte informazioni disparate e che hanno sotto di loro un notevole lavoro di analisi e organizzazione comparativa.

riprodurre il mondo esterno, con la differenza segnalata alla fine del sottoparagrafo 2.4.

L'ultimo sottoparagrafo di questa parte tratta della percezione del movimento. Il movimento è una caratteristica importante della visione, poiché difficilmente una scena visiva resta invariata, ma la trattazione della percezione del movimento trova qui ragion d'essere soprattutto perché, come si è detto, lo studio della percezione del movimento consente di estendere le considerazioni di questo sottoparagrafo alla percezione diacronica.

2.6 Il movimento

Sappiamo dal paragrafo 2.1 che l'impressione da cui il sistema visivo estrae la percezione del movimento consiste in un mutamento di distribuzione di contrasti di luminanza160 entro un'area approssimativamente circolare del campo visivo, in

particolare quello coperto dal sistema delle cellule M, le cui caratteristiche dei tempi di integrazione e risposta sono più consone ad analizzare cambiamenti di distribuzione rapidi come quelli cui il moto di un oggetto dà luogo.

Cominciamo da un problema generale per la percezione del moto. Il sistema visivo deve affrontare il “problema dell'apertura”161: se l'oggetto in moto rientra interamente

nel campo ricettivo di una cellula, il moto resta semplicemente un problema di codifica di una corrispondenza162; ma se soltanto dei margini cadono nel campo

recettivo, quella cellula sarà esposta ad alcuni casi ambigui, perché <<riesce a

160 La luminanza è definita come il flusso luminoso emesso per unità di superficie apparente e per unità di angolo solido (angolo tridimensionalmente considerato, secondo una specifica definizione).

161 Si chiama così perché è la stessa ambiguità che si incontra se si osserva una sagoma muoversi attraverso un'apertura senza che se ne possa vedere la forma complessiva e la texture della superficie.

162 Il problema della corrispondenza è a tutt'oggi ampiamente dibattuto, ma ancora non si sono raggiunti risultati stabili. Trattarne ci porterebbe troppo lontano, dunque lo si assuma come risolto.

rilevare soltanto la componente del movimento che è perpendicolare all'orientamento delle linee dell'immagine stessa>>163.

Le cellule dello strato IVB della corteccia V1, che ricevono afferenze provenienti dalla via M, codificano l'orientamento dei segmenti individuati nel campo visivo e ne costruiscono una mappa retinotopica. Tale mappa, riguardo alla codificazione del movimento, subisce due variazioni fondamentali: gruppi adiacenti di recettori codificanti uno stesso contorno si attivano e si disattivano, segnalando implicitamente direzione e orientamento di uno spostamento, e lo fanno entro un certo tempo, segnalando implicitamente la velocità di questo spostamento. Ricordiamo che l'unica informazione codificata esplicitamente nell'immagine prima della corteccia visiva primaria è una distribuzione di contrasti, mentre abbiamo visto nel sottoparagrafo 2.1 quali informazioni sono rese esplicite da V1 e come. A livello di MT164, la mappa retinotopica contenente questa catena di informazioni è analizzata

da cellule sensibili alla direzione del movimento e organizzate in colonna, come in V1, con campi recettivi circa 10 volte più estesi di quelli della corteccia striata. Questa organizzazione ha lo scopo di seguire la distribuzione dello stimolo in aree via via più vaste del campo visivo, fino a raggiungere porzioni della mappa retinotopica che includano l'intera struttura, codificata a parte come un'unità. A questo proposito, nel suo libro Marr si chiede se il problema della corrispondenza sia posto per gli spostamenti di segmenti limitati o se invece è posto per figure intere. La conclusione degli esperimenti di Ullman, di cui Marr si avvale, è intermedia, infatti la computazione del movimento è operata sui singoli segmenti di una figura intera,

163 Ivi, p.548.

ma l'analisi di cosa si è mosso e dove è basata sul seguire le componenti omogenee di una figura di conseguenza riconosciuta come intero165; quindi, sebbene la

computazione sia basata sulle parti, poiché il movimento è un fattore aggregante nell'organizzazione della scena visiva166, l'interpretazione del movimento riguarda

l'intero, riconosciuto come tale anche a partire dalla caratteristica di omogeneità del movimento delle parti. Si specifica inoltre che167:

1. <<differences in the tendency of different figures to fuse is consonant with the motion established between their components>>;

2. <<there are no indications that structural figures are part of the basic elements or that the correspondence process is based on figure similarity>>.

Risulta quindi confermato che il movimento è computato a livello locale168, perciò da

questo lato è dipendente da ciò che è raggruppato; d'altra parte, è anche ciò che produce raggruppamento, conformemente a quanto abbiamo visto nel paragrafo 2.1. Ne consegue che le informazioni sulla forma e il riconoscimento degli oggetti nella via P e l'analisi del movimento nella via M si associano da qualche parte.

Un secondo aspetto interessante, ancora preso esplicitamente in considerazione da Marr, è se il problema della corrispondenza sia risolto a livello della rappresentazione bidimensionale o se sia necessaria anche l'integrazione della traduzione nella versione tridimensionale, fermo restando, ovviamente, che essa sarà comunque attuata a un certo punto della codifica. Secondo Ullman, le misure tridimensionali non sono importanti e ritiene di aver dimostrato che tutte le indicazioni necessarie

165 Cfr. Marr, ivi, pp.189-191.

166 Cfr. sottoparagrafo 2.1, la legge “del destino comune”. 167 David marr, op.cit, p.190.

168 Vedi anche ivi, pp.191-192: Michael Riley ha dimostrato che si può rilevare il movimento anche di figure formate non da perimetri ma da elementi raggruppati secondo il principio di somiglianza.

possono essere ricavate da una rappresentazione bidimensionale169. Sembrerebbe

dunque che le strutture che si occupano di codificare la visione tridimensionale restino estranee alla codificazione della caratteristica del moto in quanto tale.

Le cellule di MT, tenendo sotto controllo un numero alto di campi recettivi di cellule ganglionari, dunque seguendo lo stimolo di fatto da numerose “aperture”, procedono in due stadi. Che la codificazione neuronale accade proprio nel modo che descriveremo, è stato corroborato dagli esperimenti di Tony Movshon. Dapprima viene codificata la direzione del moto dei segmenti nei vari campi recettivi tramite cellule che Movshon ha visto rispondere alle componenti del movimento perpendicolari al loro asse di orientamento preferenziale170, denominate “neuroni

selettivi per le componenti della direzione del movimento”; esse, infatti, codificano di fatto i vettori locali che, sommati, danno il movimento dell'intera figura. Successivamente, l'analisi del movimento è affidata a una popolazione di circa il 20% delle cellule di MT, che ricevono afferenze dai neuroni selettivi per le componenti della direzione del movimento e le combinano – non è ancora chiaro in base a quali altre informazioni – per codificare il moto globale di strutture riconosciute come interi; infatti, Movshon ha chiamato queste cellule “neuroni selettivi per la direzione globale del movimento”.

Il movimento, dal punto di vista del suo rapporto con l'organo della vista, consta di due classi: ci sono movimenti che non mettiamo a fuoco e che consistono in formazioni di contrasti che si muovono nel nostro campo visivo mentre gli occhi e quindi la retina restano nella stessa posizione; poi ci sono movimenti che mettiamo a

169 Ivi, p.193.

170 In parole più semplici, queste cellule rispondono solo se un segmento di orientamento determinato si muove in una direzione perpendicolare alla retta su cui giace questo orientamento.

fuoco, ovvero che seguiamo con gli occhi, che consistono in formazioni di contrasti che restano in posizioni abbastanza costanti sulla nostra retina, ma stavolta è il campo visivo che si sposta, eppure noi interpretiamo la scena sullo sfondo come statica e l'oggetto che seguiamo come in movimento.

Questa distinzione introduce una differenza di compiti per il sistema visivo: mentre le condizioni necessarie per la percezione del moto della prima classe si esaurisce con le strutture già descritte, il secondo presenta un problema ulteriore, perché la variazione di posizione sulla retina dello sfondo – che assumiamo come immobile, per non introdurre complicazioni – conseguente allo spostamento dei nostri occhi dovrebbe darci l'illusione di movimento, dato che è lo stesso tipo di cambiamento interpretato come movimento nel moto della prima classe.

Intuitivamente, si potrebbero porre due ipotesi:

1. “strong space constancy hypotesis”: in base alle informazioni afferenti dai campi recettivi di singoli neuroni si compensa con un'unica operazione il movimento globale apparente del campo visivo causato dal moto degli occhi; 2. “weak space constancy hypotesis”: in base alle informazioni afferenti dai

campi recettivi di singoli neuroni si compensa il movimento globale apparente del campo visivo compensando i piccoli cambiamenti per ciascun campo recettivo retinico di cui il movimento globale si compone.

Bruce Bridgeman ha dimostrato che nessuna di queste due operazioni è processata nella corteccia striata, e dato che è nella corteccia striata che viene codificata la globalità della scena visiva in quanto tale (sebbene ancora in forma bidimensionale), è ragionevole concludere che queste ipotesi siano del tutto sbagliate171.

Bridgeman e altri sostengono di aver dimostrato che nessuna delle tre risorse tradizionalmente indicate come fonti dell'informazione in base a cui si consegue la costanza dello sfondo per presunta correzione feedback delle informazioni trasmesse alla corteccia è di per sé sufficiente allo scopo; tali fonti erano:

1. informazioni sullo stato dei muscoli degli occhi;

2. una copia separata del rilevamento precedente nel tempo dell'immagine retinica rispetto a quella attuale;

3. informazioni retiniche172.

Inoltre, recenti prove fisiologiche e psicofisiche hanno permesso di stabilire che nella computazione della costanza spaziale dello sfondo non avvengono né eliminazione di informazioni né computazione della traslazione né valutazione dei rapporti spaziali173.

La soluzione proposta da Bridgeman è che ogni fotogramma della visione sia isolato e computato indipendentemente; a far restare fermo lo sfondo sarebbe il fatto che esso è registrato prima che il movimento di inseguimento sia eseguito, ma non integralmente, bensì sarebbe registrato soltanto il rapporto di posizione dello sfondo rispetto all'oggetto inseguito. Se dopo il movimento saccadico l'oggetto inseguito è dove deve essere in base alla stima del movimento pianificato, allora lo sfondo è codificato come fermo174.