• Non ci sono risultati.

I MODELLI SUBCOGNITIVI DELLA PERCEZIONE ANALOGICA

3.5. Il mondo reale a tavolino

In una situazione come quella rappresentata da alcuni oggetti sopra un tavolo, pur considerandone un numero limitato in maniera conforme alle sue dimensioni finite, sono possibili infinite combinazioni nella disposizione degli oggetti medesimi. Se consideriamo il tavolo come lo spazio fisico finito tra due individui uno di fronte all’altro, i lati ai quali stanno gli occupanti possono essere considerati le rispettive aree di influenza e gli oggetti disposti su una parte come componenti un insieme collegato all’occupante di quella parte. Ora chiediamoci: è possibile che a ogni azione di un occupante sui suoi oggetti corrisponda un’identica azione dell’altro sui rispettivi oggetti?

Questa è la domanda da cui scaturisce l’ideazione di un altro modello computazionale che si avvale dell’architettura sperimentata dall’approccio subcognitivo del FARG: TABLETOP. Il dominio specifico di questo programma è, appunto, una porzione di mondo reale costituita da un tavolino e da due occupanti, uno dei quali è manovrato dal programma medesimo, che giocano il gioco del “fare la stessa cosa”. In particolare, l’azione consentita è quella di indicare un oggetto, una suppellettile, da parte del primo occupante dalla sua parte. Il secondo risponderà con l’indicazione di un oggetto che ricopra, dalla propria parte, il medesimo ruolo nel momento in cui l’obiettivo è di compiere la stessa azione. Se il secondo occupante è impersonato dal programma, l’architettura del modello su cui questo si basa dovrà incorporare una serie di moduli che lo mettano

in grado di compiere la medesima azione, indipendentemente dal fatto che il risultato sia o meno l’indicare uno stesso oggetto. Infatti, ai due lati del tavolo potrebbero esserci oggetti diversi o uno dei due potrebbe essere totalmente sprovvisto di oggetti.

Lo sviluppo del modello computazionale TABLETOP (French, 1995; French, Hofstadter, 1991; Hofstadter, French, 1992) intende portare l’architettura di base tipica dei modelli FARG nel mondo reale, o, meglio, nella particolare situazione del mondo reale appena descritta. Tuttavia, è necessaria una precisazione. Il mondo reale simulato nell’ambiente in cui opera il programma è estremamente idealizzato. Come è ovvio, soltanto un numero esiguo di oggetti è implementato nella rete semantica che rappresenta la conoscenza del programma. Inoltre, questi oggetti, tutti comuni suppellettili che potrebbero trovarsi sopra un tavolo, come piatti, bicchieri o posate, non hanno parti, dal punto di vista del programma, né sono considerati per la loro forma o la loro costituzione. Ma allora, ci si chiederà, in che cosa questo modello differisce dai suoi precedenti, che pure agiscono su oggetti semplici, “elementari” o “atomici”, nel senso che individuati solo in quanto istanze di tipi concettuali in una relazione di identità istanza-tipo?

Per rispondere a questa domanda occorre considerare l’architettura complessiva di TABLETOP, sottolineandone le differenze con il modello con il quale il richiamo è più diretto: COPYCAT. La prima macroscopica differenza risiede proprio nella scelta del dominio e nelle conseguenza che questa scelta comporta. Infatti, mentre in COPYCAT non era rilevante la distanza fisica fra le lettere, essa diventa una variabile fondamentale in TABLETOP e uno degli effettivi punti di contatto, in quanto caratteristica condivisa simulata, fra il dominio idealizzato su cui è in grado di operare il modello e il mondo reale. In quest’ottica, la distanza fisica fra gli oggetti concorre alla formazione di gruppi, tanto quanto la loro prossimità semantica implementata nella rete concettuale (French, 1995, p. 42). Quest’ultima, d’altro canto, è dotata di una serie di accorgimenti atti a cogliere le complesse relazioni di inclusione categoriale che caratterizzano il modo in cui un essere umano considera gli oggetti del mondo reale: «in TABLETOP, una singola categoria è spesso associata con un certo numero di differenti categorie sovraordinate» (ibidem). Per tale ragione, le categorie sono definite come “indistinte” (blurry), e, dunque, non determinate a priori, ma emergenti in quanto risultato dell’elaborazione. E ciò in misura ancora maggiore nel modello della Mitchell, nel quale l’implementazione dei concetti per i tipi di lettere non era soggetta a concatenazioni gerarchiche categoriali.

La rete concettuale di TABLETOP è in grado di modellare una situazione del mondo reale, relativamente al suo dominio di applicazione, in maniera psicologicamente più plausibile, mettendo in atto il tentativo di implementare una serie di teorie sui concetti quali quelle proposte, ad esempio, da Rosch (1976; anche in Rosch, Lloyd, 1978), in merito alla categorizzazione e ai livelli categoriali impliciti nella organizzazione concettuale operata da un essere umano nei confronti del suo ambiente. I livelli categoriali utilizzati in TABLETOP sono tre: uno di base, che comprende le categorie degli oggetti (ad es., “piatto”, “coltello”); uno intermedio, in cui sono presenti sia le

categorie cui ricondurre le categorie base (ad es., “posate”) sia le relazioni fra queste ultime (ad es., “più grande di”, “vicino a”); un ultimo livello di concetti più astratti, sovraordinati rispetto a quelli di secondo livello ed esprimenti relazioni fra relazioni (ad es., come era già in COPYCAT, “opposto” in quanto meta-relazione che descrive il rapporto fra “destra” e “sinistra”). Per modellare questa complessa capacità di attribuzione categoriale la rete semantica di TABLETOP ha tre tipi di collegamenti fra i nodi (French, 1995, pp. 62-63):

1) collegamenti ISA (“è un”) in numero maggiore che in COPYCAT, tipici delle reti semantiche tradizionali á la Quillian (1968), che esprimono le relazioni fra categorie e istanze particolari;

2) collegamenti etichettati (labeled), che, come si è visto in METACAT, sono retti da un nodo congiunto al collegamento fra due nodi, che esprime ordinariamente una meta-relazione (ad es., “opposto”);

3) collegamenti has-member (“ha come membro appartenente”), che costituiscono l’inversa della relazione di inclusione rappresentata dai collegamenti ISA.

La rete concettuale di TABLETOP ha diversi aspetti interessanti, connessi con le sue caratteristiche. Innanzitutto essa modella un’organizzazione delle conoscenza basata sulla prossimità categoriale. È possibile esprimere, infatti, l’appartenenza di due concetti alla stessa categoria attraverso due legami ISA dai nodi concetti al nodo che rappresenta la categoria nella quale rientrano. In questo modo, viene modellata la rappresentazione della “prossimità concettuale generalizzata”, che ha luogo sia fra concetti di livello astratto, come era per le reti semantiche dei modelli visti in precedenza, sia per concetti che esprimono categorie di oggetti del mondo reale (ad es., “forchetta” o “bicchiere”), rendendo possibile, inoltre, l’implementazione di relazioni categoriali che sono generalmente considerate conseguenza dell’apprendimento. Tuttavia, da questo punto di vista, TABLETOP non è un modello di learning diversamente dal modo in cui lo sono gli altri modelli che abbiamo esaminato40. I concetti degli oggetti del mondo reale, infatti, sono inseriti nella rete dal programmatore e la loro formazione ex novo non dipende, né deriva, dall’elaborazione. Anche nel caso di TABLETOP la capacità di learning è limitata alle trasformazioni intra-elaborazione della sua rete concettuale, le quali vengono azzerate alla fine di ogni lancio del programma, una caratteristica ben poco plausibile dal punto di vista cognitivo umano.

40 Se si eccettua il fatto che un generatore di numeri naturali permette ai modelli che agiscono nel mondo delle

successioni, particolarmente in SEQSEE, di “comprendere”, cioè di avere a che fare con, numeri sempre più grandi e non contenuti nella memoria concettuale. Il programma conosce la successione dei numeri naturale, attraverso l’implementazione, come euristica sul dominio, della funzione che li produce e basata sul principio di induzione. Il sistema, dunque, non conosce tutti i numeri, ma la regola per produrre ognuno.

In secondo luogo, la rete è dinamica nel senso che la lunghezza dei suoi collegamenti muta con il variare dell’attivazione del noto che etichetta il legame. Ad esempio, se viene attivato il nodo “opposto”, la lunghezza del collegamento fra “destra” e “sinistra”, come di tutti i collegamenti cui esso è connesso, diminuisce, favorendo lo slittamento concettuale, cioè il passaggio di attivazione da uno all’altro dei due nodi sotto-ordinati.

Veniamo così alla terza caratteristica della rete, che riguarda la funzione che determina la diffusione dell’attivazione attraverso i nodi. Infatti, la possibilità di un slittamento concettuale, sul quale si basa l’analogia e che consiste, di fatto, nello spostamento del punto di vista dal quale il sistema considera la situazione, è conseguenza della dinamica di diffusione dell’attivazione nella rete, la quale viene calcolata attraverso una formula ben precisa41. Tralasciando i dettagli matematici, va notato che la prospettiva teorica in cui è costruita la formula che calcola la diffusione dell’attivazione è intesa cogliere gli aspetti della rete che modellano la conoscenza delle relazioni categoriali secondo legami di associazione concettuale. Perciò, a fronte del fatto che esistono molti percorsi per calcolare la distanza fra due nodi, ne consegue che ognuno di questi percorsi concorre ad aumentare la quantità di attivazione che si diffonde da un nodo verso quelli che gli sono direttamente o indirettamente collegati. Inoltre, poiché, come già era per COPYCAT e METACAT, nodi con un grado maggiore di astrattezza, cioè nel caso di TABLETOP nodi che rappresentano categorie sovra-ordinate, sono dotati di un processo più lento di decadimento dell’attivazione, si ha una diffusione tanto maggiore e più sostenuta nel tempo verso i concetti sottoposti quanto più forte è il collegamento fra nodi superiori e nodi inferiori. Infatti, i legami ISA sono indice di relazione categoriale e la presenza di molti legami ISA che mettono in collegamento due nodi con i medesimi nodi sottoposti è segno di prossimità categoriale, la quale, attraverso i legami ISA stessi, è in questo modo causa di un maggiore e più immediato passaggio di attivazione. Nella rete semantica di TABLETOP i concetti appaiono essere rappresentati in maniera più approfondita rispetto a quelle dei modelli che li hanno preceduti. In questo, fattore determinate è la scelta del (micro-)dominio di applicazione del modello. In particolare, i vari tipi di collegamento fra i nodi, unitamente alla struttura della rete in generale, sono in grado di rappresentare i due principali aspetti della conoscenza semantica concettuale. Essi costituiscono i due estremi di un unico spettro che, generalmente, va dal concreto all’astratto e sono il risultato di due processi distinti, la categorizzazione e la concettualizzazione, intendendo col primo l’attività di coagulazione dei dati dell’esperienza intorno a punti di attrazione considerati come unità primitive e inscindibili dal punto di vista dell’attività percettiva, e con il secondo il risultato del processo di formazione dei concetti più astratti o più complessi, solo apparentemente, vista l’architettura del modello, attribuibile in toto a dinamiche interne al pensiero e scisso, o più distante, dall’esperienza. Nella prospettiva di TABLETOP si deve ovviamente parlare di spettro, sia perché si tratta di conoscenza rappresentata e

41 L’analogia che viene istituita con questa funzione di calcolo chiama in causa la formula attraverso cui viene calcolato

il passaggio di corrente elettrica in un circuito in cui sono presenti delle resistenze. Per i dettagli tecnici si rimanda a French (1995, p. 61).

non di simulazione del processo, almeno per quanto riguarda la categorizzazione, sia perché, in ogni caso, queste due capacità sono considerate frutto dell’applicazione dei medesimi meccanismi già molte volte nominati di percezione di alto livello, che mediano fra conoscenza posseduta e dati percepiti.

Infine, dato l’utilizzo di tecniche, e perfino di una terminologia, molto affini a quella delle reti connessioniste, occorre chiarire in quali aspetti le due impostazioni differiscono. Innanzitutto, il più vistoso consiste nel fatto che i nodi della rete semantica, diversamente rispetto a quelli della maggior parte delle reti connessioniste tipica, sono tutti interpretabili semanticamente, sono cioè

simboli dotati di significato, seppure, in questo come negli altri modelli presentati, essi intendono

implementare una ben determinata teoria, quella dei “simboli attivi”, su cui ritorneremo nel prossimo e conclusivo capitolo. Basti dire, per ora, che, secondo questa prospettiva, ogni nodo della rete rappresenta sì un simbolo, tuttavia non soltanto attraverso una semplice relazione di riferimento corrispondenziale, come nelle semantiche formalizzate tradizionali (á la Tarsky). Ciò che la rete, considerata nel complesso delle sue caratteristiche funzionali, rappresenta è la possibilità e la misura delle azioni che un simbolo è in grado di provocare nell’elaborazione globale del sistema, ovvero, dal punto di vista del modello, la sua funzione suggestiva, di motore teorico-ideale- semantico del processo di pensiero, attraverso la modificazione dell’attività e del tipo di agenti subcognitivi coinvolti in un determinato momento del processo stesso.

Secondariamente, e da un punto di vista più tecnico, mentre, come sottolinea French, in una rete connessionista sono i pesi degli archi a determinare la misura della quantità di attivazione, istituendosi così una relazione diretta fra distanza e peso nella rete (a un peso maggiore corrisponde un’attivazione maggiore nel nodo verso cui l’attivazione si propaga), nella rete di TABLETOP, al contrario, «la distanza può essere considerata la reciproca del peso», e di conseguenza «la quantità di attivazione diffusa è (di fatto) inversamente proporzionale alla distanza fra i concetti [...]. Così, più due concetti sono prossimi nella Rete di Slittamento (cioè, più corte sono le lunghezze fra i loro collegamenti), più grande è la quantità di attivazione diffusa dall’uno all’altro» (ivi, p. 59). E, come abbiamo visto, l’attivazione di un nodo etichetta (di un legame) causa l’accorciamento del legame stesso, diminuendo la distanza fra i due nodi che collega.

Finora abbiamo visto come la scelta di un dominio che ricalcasse una situazione del mondo reale, ancorché solo parzialmente, e in particolare per quanto riguarda le simulazioni di relazioni di distanza spaziale fra oggetti in uno spazio (de-)limitato e di relazioni fra alcune proprietà degli oggetti stessi attraverso la modellazione semantica dei rapporti di gerarchia categoriale, abbia determinato le peculiarità della rete semantica di TABLETOP. L’influenza del dominio, d’altra parte, è visibile anche in altri aspetti di dettaglio dell’architettura, la quale nei suoi tratti fondamentali è costruita sullo schema generale dei modelli dell’approccio subcognitivo visti fino a questo momento. Infatti, altre parti di essa sono lo Spazio di Lavoro e il modulo delle

microprocedure. Queste ultime vengono impiegate probabilisticamente sulla base delle pressioni derivanti dall’attivazione dei nodi nella rete semantica, che, a loro volta, costituiscono una componente della funzione di valutazione delle strutture costruite nello Spazio di Lavoro. Anche in TABLETOP è presente, infine, il meccanismo di auto-osservazione svolto dalla variabile temperatura, che monitora, e allo stesso tempo concorre a determinare, la quantità di andamento stocastico presente nell’elaborazione del programma.

Le microprocedure sono anche in questo caso chiamate a esplorare la situazione corrente e a formare raggruppamenti e collegamenti fra gruppi, che possono essere considerati una sorta di meta-gruppi. Le due più importanti relazioni coinvolte in questo processo, conformemente al dominio scelto, sono quelle di prossimità spaziale e di vicinanza (inclusione e appartenenza) categoriale. Di conseguenza, sulla base di questo duplice tipo di relazioni le microprocedure principali sono i “cercatori di gruppi”, i “cercatori dei vicini” di un dato oggetto considerato, i “cercatori delle parti terminali” dei gruppi, oltre a quelli classici volti alla ricerca delle corrispondenze fra due oggetti identici.

Il compito del programma è quello di risolvere un ben determinato problema analogico. Deciso un oggetto iniziale, che viene indicato da una freccia, da parte dell’utente umano, TABLETOP deve trovare un oggetto analogo a quello indicato dalla sua parte del tavolo o, comunque, dalla parte opposta a quella dell’oggetto input. Tuttavia, questo non è un vincolo e possono essere indicati come risposta anche oggetti sullo stesso lato del tavolo in cui sta quello iniziale. Ciò è indice ancora una volta di come i vincoli imposti alla ricerca della soluzione da parte del programma sono solo probabilistici e non deterministici in senso assoluto, anche se la tendenza del programma è quella di andare verso una quantità sempre maggiore di determinismo corrispondente all’acquisizione di un punto di vista proprio, definito e univoco. Forti pressioni concettuali possono, in questo tipo di architettura, portare a qualsiasi soluzione che rientri nell’ambito dello spazio percettivo e a diverse elaborazioni col medesimo input possono corrispondere risposte diverse. In questo modo, si è inteso cogliere, come si è già sottolineato in precedenza, la caratteristica della capacità semantica umana, cioè dell’impiego del suo bagaglio epistemico, di essere non deterministica, bensì polivalente, dal punto di vista del confronto di differenti prestazioni e non all’interno della singola prestazione. Si consideri come esempio immediatamente illuminante di questa capacità (o limite di capacità) quel fenomeno molto conosciuto di percezione di-esclusiva che è il cubo di Necker42, dove medesimi elementi concettuali possono entrare a far parte di una diversa concettualizzazione dello stesso input percettivo. In fondo, il cubo di Necker è pur sempre un cubo, in qualunque modo lo si guardi. L’assunzione di fondo che guida la strutturazione dello spazio percettivo da parte di TABLETOP è che l’impossibilità per i processi attentivi di un’organizzazione percettiva conscia concettualmente bifocale è caratteristica dell’applicazione dei concetti a ogni livello. Il programma, perciò, procede

42

Per un’interessante rassegna e una discussione di numerose illusioni percettive si rimanda al sito: http://www.michaelbach.de/ot/index.html

impiegando come euristica una funzione che calcola la salienza (salience) degli oggetti e dei gruppi di oggetti privilegiando di volta in volta una sola interpretazione fra le altre dello spazio percettivo, costituito dall’insieme degli oggetti e dei loro rapporti spaziali possibili nello Spazio di Lavoro. Tale funzione euristica si basa su molteplici fattori, quali ovviamente l’attivazione del concetto corrispondente all’oggetto, ma anche la posizione esterna dell’oggetto in un gruppo e la sua corrispondenza con altri oggetti. Inoltre se ad essere preso in considerazione è un gruppo, la sua salienza è data dalla presenza di più oggetti uguali, dalla grandezza del gruppo e, in maniera decisiva, dall’appartenenza degli oggetti (tutti o alcuni) a una categoria sovraordinata comune. In termini complessivi, tale funzione di valutazione permette la strutturazione dello spazio percettivo secondo un criterio non casuale. In tal senso la funzione euristica diminuisce drasticamente il numero dei raggruppamenti possibili da tenere in considerazione, abbassando considerevolmente il dispendio computazionale che sarebbe richiesto da una ricerca compiuta attraverso un algoritmo di forza bruta. Le corrispondenze, create e valutate secondo il grado di salienza con criteri analoghi a quelli degli oggetti e dei gruppi43 nella strutturazione dello spazio percettivo, permettono lo slittamento concettuale, che favorisce a catena la riorganizzazione continua dello spazio percettivo fino ad avere poche e alternative strutture in competizione. Mentre nei modelli precedenti presi in esame solo una visione della situazione era permessa e le altre perdenti erano di volta in volta distrutte, TABLETOP è dotato di una funzione, la Visione del Mondo (Worldview)44 che permette il mantenimento delle visioni alternative, perché, se è vero che solo un focus attentivo cosciente viene considerato possibile nei processi di pensiero, è anche evidente che «noi possiamo oscillare avanti e indietro tra due interpretazioni della situazione senza problemi. Questo avviene presumibilmente perché manteniamo una rappresentazione in qualche modo attiva (sebbene sotto la soglia dell’attenzione cosciente) della seconda raffigurazione nei nostri cervelli» (ivi, p. 70). Si può dire che l’idea che regola questo processo è che noi non distruggiamo ciò che abbiamo comunque percepito, anche se non vi prestiamo attenzione. La Visione del Mondo, perciò, rappresentata nell’interfaccia del programma da collegamenti continui di contro a quelli tratteggiati che stanno per le visioni alternative, «costituisce un insieme di corrispondenze non-contraddittorie di oggetti e gruppi di oggetti gli uni sugli altri» (ibidem), mentre la presenza di rappresentazioni alternative conferisce al programma la possibilità di operare anche attraverso l’impiego del controfattuale nella costruzione progressiva della visione definitiva.

Facciamo qualche esempio. Se ho un bicchiere da una parte e un bicchiere dall’altra, la corrispondenza è univoca e la soluzione del problema di analogia è banale: la risposta consisterà nel bicchiere non indicato all’inizio dall’utente. Se, invece, si hanno da una parte, in questo ordine, due forchette, una tazza e due coltelli e dall’altra, in questo ordine, due forchette, un piatto, due coltelli e