1 L’ATTENZIONE COME PROCESSO COGNITIVO
1.6 IL PARADIGMA DELLA RICERCA VISIVA
A partire dagli anni '80, le ricerche sull'attenzione di Treisman seguirono la tendenza generale di uno spostamento d’interesse dal sistema uditivo a quello visivo e furono rivolte all'elaborazione della sua teoria sull'integrazione delle caratteristiche (Feature Integration Theory, FIT). In essa Treisman indaga sia i meccanismi attentivi
bottom-up, tra cui quello denominato pop-out, dove un target che si differenzia dagli
altri per una sola caratteristica emerge sullo sfondo con facilità, automaticamente, sia la ricerca visiva diretta in modo top-down, necessaria quando il target si differenzia dal contesto per una delle caratteristiche in esso combinate. Nell'articolo del 1980, scritto insieme a Garry Gelade ed intitolato «A Feature-Integration Theory of Attention»96, viene proposta una teoria della percezione alternativa rispetto a quella formulata dagli psicologi della Gestalt. Questi ultimi, infatti, sostengono che la percezione di un oggetto avvenga in maniera immediata ed unitaria, e che solo in un momento successivo sia possibile focalizzare la nostra attenzione sui singoli elementi che compongono l'oggetto.
96 Treisman, A.M., Gelade, G. (1980) A Feature-Integration theory of attention, Cognitive Psychology, 12(1), pp. 97-136.
Come affermato da Treisman, tale punto di vista si accorda bene con l'esperienza soggettiva che abbiamo della percezione diretta ed immediata dell'oggetto nella sua interezza; ciò non significa, tuttavia, che tale punto di vista corrisponda a ciò che avviene realmente.
Il modello avanzato da Treisman propone, piuttosto, un'elaborazione percettiva che si svolge in due stadi: in primo luogo, abbiamo uno stadio pre-attentivo in cui avviene l'individuazione delle qualità primarie; quest’ultimo è un livello automatico e caratterizzato dall'elaborazione in parallelo delle caratteristiche più elementari dell'oggetto in questione (colore, orientamento, luminosità e direzione del movimento). Successivamente avviene l'integrazione delle qualità primarie che, grazie all'intervento dell'attenzione, permette il collegamento delle caratteristiche che si trovano nella stessa posizione al fine di garantire la percezione unitaria dell’oggetto a livello cosciente. Come sostenuto da Treisman:
We assume that the visual scene is initially coded along a number of separable dimensions, such as color, orientation, spatial frequency, brightness, direction of movement. In order to recombine these separate representations and to ensure the correct synthesis of features for each object in a complex display, stimulus locations are processed serially with focal attention. Any features which are present in the same central “fixation” of attention are combined to form a single object97.
Il compito dell'attenzione, dunque, è quello di garantire una corretta combinazione
delle caratteristiche; senza di essa, infatti, o le caratteristiche vengono elaborate in modo separato e inconscio, senza che vi sia alcuna integrazione, o avviene una congiunzione sulla base delle esperienze passate o delle informazioni derivanti dal contesto che porta alla formazione delle “illusory conjunctions”.
Tra i paradigmi maggiormente utilizzati da Treisman e Gelade vi è quello della ricerca visiva, che consiste nella presentazione, tramite un tachistoscopio, di uno o più target che il soggetto è istruito a rilevare, insieme ad un certo numero di stimoli che funzionano come distrattori. Secondo gli autori, tale paradigma permetterebbe di indagare sia la modalità con cui avviene l'elaborazione delle singole caratteristiche sia quella della loro congiunzione. La loro ipotesi è, infatti, la seguente:
If, as we assume, simple features can be detected in parallel with no attention limits, the search for targets defined by such features (e.g., red, or vertical) should be little affected by variations in the number of distractors in the display. […] In contrast, we assume that focal attention is necessary for the detection of targets that are defined by a conjunction of properties (e.g., a vertical red line in a background of horizontal red and vertical green lines). Such targets should therefore be found only after a serial scan of varying numbers of distractors98.
Nel primo esperimento condotto da Treisman e Gelade i soggetti furono, dunque, testati nella ricerca di ognuna delle due tipologie di target; il loro compito era quello di premere un pulsante nel momento in cui avessero rilevato almeno uno dei target che erano istruiti a riconoscere. Furono utilizzate quattro grandezze differenti per lo
schermo che conteneva, a partire da quello con le dimensioni più piccole, uno, cinque, quindici o trenta stimoli. In entrambe le sessioni i distrattori erano rappresentati da Tmarronee Xverde; durante la prima si indagava la ricerca delle singole caratteristiche, perciò i target da rilevare erano o il colore blu (in tal caso, il target condivideva con metà dei distrattori la forma della lettera, ossia Tblu o Xblu) o la lettera “S” (poteva essere Smarrone o Sverde, quindi la caratteristica condivisa con metà dei distrattori era il colore). Nella seconda sessione, invece, dedicata alla ricerca di caratteristiche congiunte, come target era stata scelta la lettera “T” colorata di verde (Tverde). I risultati indicarono, nella condizione di congiunzione, un forte aumento nei tempi di reazione in relazione all'ingrandimento dello schermo, soprattutto nelle ricerche con esito negativo in cui i soggetti impiegavano circa il doppio del tempo per concludere la ricerca rispetto a quelle dall’esito positivo; ciò significa che l'aumento del numero di distrattori dilatava il tempo impiegato dai soggetti per il rilevamento del target. Nelle condizioni di rilevanza delle caratteristiche, invece, si verificò un aumento dei tempi di reazione minore nei casi di ricerca negativa e quasi nulla in quelli con esito positivo.
Questi dati supportano, secondo Treisman e Gelade, la loro ipotesi sul verificarsi, nelle condizioni di congiunzione, di una ricerca visiva di tipo seriale, in quanto l’attenzione non può concentrarsi su più di una posizione alla volta. Nel caso del rilevamento delle singole caratterische, invece: «If the target is present, it is detected automatically; if it is not, subjects tend to scan the display, although they may not check item by item in the strictly serial way they do in conjunction search»99. Gli autori hanno indagato, in alcuni degli esperimenti successivi, le cause di tale diversità
nell'elaborazione delle due tipologie di target; essa sarebbe riconducibile soprattutto alla difficoltà di ricerca delle caratteristiche congiunte, derivante in modo particolare dall’eccessiva somiglianza tra il target e i distrattori, che impedirebbe il pop-out del target con conseguente necessità di una ricerca seriale.
In conclusione, la teoria delle caratteristiche integrate postula l’esistenza di due processi che permettono la percezione cosciente di uno stimolo unitario: l’attenzione focale, che utilizza la localizzazione spaziale seriale al fine di raggruppare le singole caratteristiche in un oggetto coerente, e l’elaborazione top-down, che si occupa dell’identificazione degli stimoli. Solitamente questi due processi operano insieme ma, nei casi in cui l’attenzione focale sia fuori gioco, l’elaborazione top-down avrebbe la capacità di unire da sola le caratteristiche in modo da formare un oggetto il più possibile coerente con l’ambiente circostante, con il rischio, tuttavia, di creare quelle che gli autori chiamano illusory conjunctions. Le probabilità di cadere in errore utilizzando questo tipo di elaborazione dipendono dal tipo di ambiente in cui ci troviamo: un ambiente familiare, infatti, ci permette di predire più correttamente la natura dell’oggetto che vi si trova inserito. Ricollegandosi alla questione posta inizialmente circa la modalità con cui avviene la percezione del mondo circostante, Treisman e Gelade scrivono:
Can we reconcile our theory with the apparent speed and richness of information processing that we constantly experience? Perhaps this richness at the level of objects or scenes is largely an informed hallucination. We can certainly register a rich array of features in parallel, and probably do this along a number of dimensions at once. But if we apply more stringent tests to see how accurate and
detailed we are in putting features together without prior knowledge or redundancy in the scene, the results are much less impressive100.
Il paradigma della ricerca visiva fu utilizzato da altri autori, come Jeremy Wolfe, Kyle Cave e Susan Franzel, ed i risultati dei loro esperimenti li portarono a modificare la teoria delle caratteristiche integrate e a formulare il Guided search model. Nell’articolo del 1989 «Guided search: an alternative to the Feature Integration Model
for visual search»101, infatti, gli autori approfondirono il lavoro condotto da Treisman e Gelade indagando ulteriormente i processi di tipo seriale e parallelo che conducono la ricerca visiva. I problemi più importanti da affrontare erano due: in primo luogo, i risultati riportati dagli esperimenti di Wolfe, Cave e Franzel che erano, in parte, contrastanti con quelli di Treisman e Gelade, soprattutto riguardo alla necessità dell’elaborazione seriale nella ricerca delle caratteristiche congiunte. Furono elaborati, infatti, esperimenti per i casi di congiunzioni di colore e forma, colore e orientamento, colore e grandezza e ricerca del target Ttra i distrattori L. Nei primi tre test i risultati non mostrarono alcun aumento nei tempi di reazione in relazione alla grandezza dello schermo e all’aumento del numero dei distrattori, indicando che il compito di ricerca era stato svolto in parallelo e contraddicendo, così, la FIT; nel quarto esperimento, invece, i soggetti adottarono una ricerca di tipo seriale.
Il secondo problema, secondo gli autori, consisteva nella separazione netta che era stata posta da Treisman e Gelade tra processi paralleli pre-attentivi, utilizzati nella
100 Ivi, p. 133.
101 Wolfe, J.M., Cave, K.R., Franzel, S.L. (1989) Guided search: an alternative to the Feature Integration Model for visual search, Journal of Experimental Psychology: Human perception and performance, 15(3), pp. 419-433.
ricerca delle singole caratteristiche, e processi seriali per le caratteristiche congiunte. Essi, infatti, affermano: «In the standard feature integration model, the parallel processes can identify targets on the basis of a single feature. However, if they do not find a target, none of the information that they have gathered is used by the serial processes, even if that information might be useful»102. Piuttosto che escludere, anche nei casi di congiunzione delle caratteristiche, l’elaborazione in parallelo, sarebbe più logico pensare che essa continui ad operare attraverso una selezione degli stimoli effettuata sulla base delle singole caratteristiche, in modo da guidare ed aiutare i processi seriali a localizzare più velocemente il target richiesto. Ad esempio, nei casi di congiunzione di colore e forma, i processi paralleli potrebbero localizzare tutti gli stimoli del colore desiderato, escludendone così una buona parte, e passare tali informazioni ai processi seriali; in tal modo, l’attenzione non dovrebbe essere impegnata ad esaminare ogni stimolo.
I risultati degli esperimenti di Wolfe, Cave e Franzel possono essere interpretati in questo modo: i processi paralleli aiutano il compito di ricerca visiva seriale tramite il passaggio di informazioni; le differenze riscontrate tra i soggetti possono, dunque, spiegarsi facendo riferimento alla correttezza con cui avviene il passaggio delle informazioni: quest’ultimo può essere, infatti, compromesso da interferenze nella trasmissione del segnale che causano un trasferimento incompleto di informazioni, rallentando il compito di ricerca. Il motivo per cui il quarto esperimento, riguardante la ricerca di T tra gli stimoli L, aveva prodotto dei risultati conformi alla teoria di Treisman e Gelade risiede nella mancanza di caratteristiche rilevabili da parte dei
processi paralleli e, dunque, nel fatto che i soggetti hanno potuto utilizzare esclusivamente la ricerca seriale. È importante sottolineare, inoltre, che la ricerca di informazioni da parte dei processi paralleli ed il suo trasferimento a quello seriale prosegue durante tutto il tempo in cui lo stimolo è presente. Riassumendo, il Guided
search model prevede che:
A parallel feature map can partition the set of items into distractors and candidate targets. This information, degraded by noise, can be passed to the serial process. In the serial process, the spotlight of attention moves from item to item until a target is found. With the aid of information from the parallel processes, however, that movement need not be random. Instead, the spotlight can be directed to the most likely target. If the signal from the parallel processes is large relative to the noise, the target will be found quickly. If the signal is small, the spotlight will examine a number of distractor items before finding the target103.
Sempre nel 1989 comparve un altro articolo104, scritto da John Duncan e Glyn Humphreys, contenente una rivisitazione della teoria delle caratteristiche integrate. In esso gli autori hanno delineato un modello di ricerca visiva di un target, abbandonando, come nel Guided search model, la distinzione tra la ricerca delle singole caratteristiche e quella delle caratteristiche congiunte. Negli esperimenti da essi condotti, infatti, non risultò essere questo il fattore che determinava l’aumento dei tempi di reazione ma, piuttosto, le somiglianze all’interno del gruppo dei target e dei distrattori. Fu rilevato,
103 Ivi, p. 431.
104 Duncan, J., Humphreys, G.W. (1989) Visual search and stimulus similarity, Psychological Review, 96(3), pp. 433-458.
infatti, che il prolungamento dei tempi di reazione in relazione all’aumento del numero di stimoli si verificava sotto due condizioni: sia quando il gruppo dei target e quello dei distrattori presentavano delle somiglianze, sia quando i distrattori si differenziavano troppo l’uno dall’altro.
Duncan e Humpreys ritenevano che ogni tipo di ricerca visiva iniziasse con l’elaborazione in parallelo in modo da formare quella che chiamano “perceptual
description”, ossia una rappresentazione degli stimoli suddivisa in diverse unità
strutturali. In seguito si verificherebbe una fase di selezione degli stimoli sulla base di un confronto tra la loro rappresentazione percettiva e il modello interiore che il soggetto si è formato del target; alle informazioni in tal modo selezionate sarebbe garantito l’accesso alla memoria a breve termine che, secondo gli autori, rende possibile la consapevolezza e il controllo dell’azione. La selezione è resa necessaria dalla limitata capacità della memoria a breve termine ed è guidata proprio dall’attenzione sulla base del modello interiore del target: «For example, a template could specify only one attribute of the desired information, such as its location or color, or many combined attributes, including shape. Selection operates by matching input descriptions to current templates. The result is a change of weight for each structural unit that is proportional to the degree of match, good matches increasing the weight but poor matches decreasing it»105. L’attenzione viene, dunque, concepita anche in questo caso come una sorta di filtro selettivo che favorisce le informazioni corrispondenti agli schemi mentali del soggetto.
Nel 1992106 uno studio di Mary J. Bravo e Ken Nakayama esplorava l’ipotesi per 105 Ivi, p. 446.
106 Bravo, M.J., Nakayama, K. (1992) The role of attention in different visual-search tasks, Perception
cui l’attenzione fosse guidata da meccanismi differenti a seconda della tipologia di ricerca visiva da svolgere, dando luogo, così, a risultati e a tempi di reazione diversi. Infatti, gli autori postularono l’esistenza di due modi con cui può essere diretta l’attenzione: in modo top-down, quando il soggetto conosce le caratteristiche che contraddistinguono il target e usa tale conoscenza per guidare l’attenzione; in modo
bottom-up quando, invece, il soggetto sa che il target si differenzia da tutti gli altri
distrattori ma non ne conosce la caratteristiche. Il tipo di ricerca top-down è quello di cui abbiamo discusso nei paragrafi precedenti, ossia è quello che si serve delle mappe delle caratteristiche al fine di localizzare il target richiesto e che viene ostacolato dall’aumento del numero dei distrattori. I meccanismi bottom-up, invece, sono quelli in cui il target guida e attira l’attenzione del soggetto e avrebbero come peculiarità la diminuzione dei tempi di reazione all’aumentare del numero dei distrattori.
Per spiegare tale fenomeno, Bravo e Nakayama riportano due teorie differenti: in primo luogo l’ipotesi dell’inibizione delle caratteristiche esposta da Treisman nel 1988 in «Features and Objects: The fourteenth Bartlett memorial lecture»107. In questo articolo la psicologa propone una versione aggiornata della teoria delle caratteristiche integrate, tentando di dare una spiegazione di alcuni risultati contrastanti emersi dalle ricerche di alcuni colleghi. Il ruolo svolto dall’attenzione all’interno della teoria viene, ad esempio, meglio specificato: essa agisce selezionando una posizione all’interno di una “master map of locations”, ossia una mappa che indica tutte le posizioni delle caratteristiche in modo da evidenziare quali parti della scena visiva sono occupate, senza, tuttavia, specificare quali caratteristiche si trovano in quelle posizioni.
107 Treisman, A. (1988) Features and objects: The fourteenth Bartlett memorial lecture, The Quarterly
L’attenzione concentrata su una di quelle localizzazioni permette l’attivazione automatica delle varie mappe delle caratteristiche, grazie alle quali il soggetto viene informato sulle proprietà presenti in quella posizione.
Come abbiamo detto, in questo articolo Treisman si propone di dare una spiegazione di alcuni risultati incoerenti con la FIT, tra cui quelli ottenuti da Nakayama e che porteranno all’ipotesi dell’inibizione delle caratteristiche. Gli esperimenti di Nakayama, infatti, avevano mostrato che, quando il target e i distrattori sono formati da certe coppie di caratteristiche (ad esempio il colore e il movimento), si verifica il pop-
out del target senza la necessità della ricerca seriale. Per spiegare tale fenomeno
Treisman inizia con l’osservare che a causare il pop-out sia una caratteristica molto distintiva del target, capace di attirare su di sé l’attenzione. Come sostiene l’autrice: «The “calling” of attention by a salient feature suggests the possibility that locations in the master-map might also be selectively activated or inhibited through links downward from particular feature maps»108. Non sarebbe, dunque, l’attenzione a dirigere la ricerca sulla base di informazioni precedentemente acquisite, ma è la salienza delle caratteristiche del target ad attivare la mappa delle posizioni ed attirare l’attenzione; ciò corrisponde al tipo di meccanismo bottom-up descritto da Nakayama, in cui il soggetto non conosce le proprietà del target.
L’attivazione “dal basso” della mappa delle posizioni avverrebbe come conseguenza della diffusione di un effetto inibitorio prodotto dai distrattori che condividono proprietà simili, effetto che non interesserebbe il target in quanto possessore di una caratteristica altamente distintiva. In questo modo, la mappa delle
posizioni sarà collegata alle caratteristiche con il livello di attivazione maggiore, ossia quelle del target: «The resulting stronger activation of the location of the unique feature in the master-map might be indistinguishable from the activation that would be produced by focused attention to that location»109. Inoltre, come risposta ai risultati di Nakayama, Treisman sostiene che: «This account can be extended to cover Nakayama’s results if we assume that it is possible voluntarily to inhibit master map locations that contain non-target features through downward links from the feature-maps, when the features of the target and the distractors are highly discriminable»110. Oltre a ciò, l’effetto inibitorio spiegherebbe la diminuzione dei tempi di reazione con l’aumentare del numero dei distrattori: infatti, poiché esso è un effetto locale, risulterà più efficiente se gli stimoli sono più vicini tra loro111.
Tornando all’articolo di Bravo e Nakayama, per indagare il funzionamento dei meccanismi attenzionali in compiti di ricerca visiva differenti, essi elaborarono un esperimento declinabile in diverse condizioni. In ognuna di esse venivano presentati su uno schermo una serie di stimoli visivi raffiguranti dei diamanti; gli stimoli si distinguevano per il colore, che poteva essere verde o rosso (tutti gli stimoli possedevano lo stesso colore tranne il target) e per la forma (alcuni stimoli avevano la punta sinistra tagliata ed altri la destra). Inoltre, come abbiamo già visto, il numero dei distrattori veniva aumentato in ogni esperimento per verificare come questo fattore influisse sui tempi di reazione. I test furono condotti sia sui compiti richiedenti attenzione focale, ossia quelli in cui bisogna cercare il target sulla base del colore o
109 Ibidem. 110 Ibidem.
111 Negli esperimenti condotti da Bravo e Nakayama veniva aumentato il numero dei distrattori ma non