• Non ci sono risultati.

Modelli prototipici dei concetti e logica fuzzy.

della conoscenza.

4.3 Modelli prototipici dei concetti e logica fuzzy.

I modelli concettuali basati su prototipi, a differenza dei modelli insiemistici, non richiedono esplicitamente che i concetti siano descritti tramite un insieme di caratteristiche (condizioni necessarie e sufficienti). In accordo ai maggiori sostenitori dell’ipotesi dei prototipi,114 la rappresentazione cognitiva associata a molte parole di

uso comune (parole come “uccello”, “mobile”, “frutto”, “vestito”, ecc.) ha, infatti, la natura di un prototipo, vale a dire, di un “buon esempio” della categoria in questione. Il significato di queste parole non deriva, quindi, né da un insieme di “indicatori semantici”, né tanto meno dall’appartenenza del concetto sotteso dalla parola ad una estensione: il

114 ROSCH, E., “Cognitive Representation of Semantic Categories”, in Journal of Experimental Psychology: General, 104, 1962, pp. 192-233.

152

significato è , infatti, costituito da un’”immagine” di un tipico membro dell’estensione. Questa immagine si sviluppa a partire da due funzioni caratteristiche (c-functions): una c-function (c) che misura il grado in cui l’oggetto cade nell’estensione di un dato concetto e un’altra c-

function che calcola la distanza (d) di tale concetto dal prototipo p e,

cioè, il grado di tipicità.115 In accordo a tali premesse, un concetto può,

quindi, essere considerato come una quadrupla 〈A, d, p, c〉, dove A costituisce il dominio concettuale, vale a dire, il campo degli oggetti letteralmente individuabili (reali o immaginari); d è la distanza metrica su A, cioè, una funzione binaria che assegna ad ogni coppia di elementi di A un valore numerico che indica la misura in cui tali elementi differiscono tra di loro, p è il concetto di prototipo; ed, infine, c è una funzione che assegna ad ogni elemento di A un numero nell’intervallo reale [0, 1], numero che indica il “grado” in cui tale elemento appartiene ad un concetto. Questo grado deve essere una funzione decrescente monotona della distanza da p, funzione che può essere espressa formalmente nel seguente modo:

(1) (∀x, yA)(d (x, p) ≤ d (y, p) →c(y) ≤ c (x))

Come è facile osservare, tuttavia, non sempre è possibile definire un concetto sulla base delle sole due funzioni d ed c e della relazione

115 Cfr.: KAMP.H.PARTEE,B., “Prototype Theory and Compositionality”, in Cognition vol.

153

esistente tra le due espressa da (1). Nel linguaggio naturale esistono diversi termini che, sebbene appartengono ad un preciso campo concettuale (c), presentano un’accentuata distanza metrica (d) dagli altri termini appartenenti allo stesso campo. E’ il caso, come abbiamo accennato precedentemente, di quei concetti “vaghi” quali, ad esempio, “gioco” in cui rientrano diverse occorrenze (scacchi, pallavolo, girotondo, poker, ecc.) evidentemente distanti una dall’altra, o di quelle occorrenze atipiche quali, ad esempio, PINGUINO che, nonostante le evidenti differenze dal tipico esemplare dell’insieme degli UCCELLI, è comunque un appartenente di questo stesso insieme.

Per ovviare a questi contrastanti risultati sperimentali, L. Zadeh ha introdotto negli anni ‘70 circa una affascinante teoria: la t. degli

insiemi fuzzy. Nel saggio pubblicato nel 1965 “Fuzzy Sets”, Zadeh116

applica la logica polivalente di Lukasiewicz117 ad insiemi o gruppi di

oggetti “vaghi”, caratterizzati, cioè, dal fatto che l’appartenenza dei loro

116 Cfr.: ZADEH,L.A., “Fuzzy Sets”, in Information and Control, 8, 1965, pp. 338-353. 117 All’incirca negli anni ’20 e ’30 i logici cominciarono ad elaborare, in

contrapposizione alla tradizionale logica dicotomica, cioè, a due valori, una logica a più valori. L’esigenza di una logica di questo tipo derivava dalla necessità di trattare il principio di indeterminazione formulato da Heisenberg nella meccanica quantistica. Questo principio afferma che se si misura con precisione una cosa, non se ne possono misurare altre con la stessa precisione. Il principio implica, quindi, che si abbia a che fare con una logica ad almeno tre valori: enunciati veri, falsi ed indeterminati. A partire da queste considerazione il logico polacco Jan Lukasiewicz nel trattato

Ricerche sul calcolo proposizionale (1930), tagliò la via di mezzo, l’indeterminato, in

molti pezzi e mise così capo alla logica a più valori o polivalente. Lukasiewicz fece poi il passo successivo e suppose che l’indeterminazione definisse un continuum, uno spettro tra la verità e la falsità, tra 0 e 1. Nacque così il concetto di “logica fuzzy”.

154

elementi ha una misura variabile. Poiché non sempre è possibile distinguere in maniera discreta tra sì e no, tra vero e falso, tra bianco e nero, in accordo a Zadeh, è necessario postulare, accanto alla tradizionale logica bivalente, una logica polivalente in grado di tener conto di tutti quegli stati intermedi esistenti tra sì e no, tra bianco e nero, e tra vero e falso. L’unità di misura di questa logica sono i fits (forma contratta di fuzzy units) e, cioè, dei numeri reali compresi tra 0 e 1. Volendo definire un concetto quale, ad esempio, ALTO è necessario, in questo senso, ricorrere ad una curva di appartenenza. A differenza dei modelli estensionali in cui l’appartenenza di un item ad un campo concettuale è dato in funzione dei due stati discreti (0, 1) e, cioè, (ALTO, NON ALTO), nei modelli fuzzy l’appartenenza ad un insieme viene definito nei termini di funzioni continue (curve). Detto in parole più semplici, ogni uomo è ALTO in una certa misura e NON ALTO in una certa altra misura. Rappresentando su un piano cartesiano i due diversi modi di definire il concetto ALTO, avremo le due seguenti figure:

155

1

0 50 cm 100cm 150cm 200cm

Figura 12: Rappresentazione del concetto ALTO, secondo la logica fuzzy

1

0 50 cm 100cm 150cm 200cm

Figura 13: Rappresentazione del concetto ALTO, secondo la logica bivalente

Sull’asse delle ascisse sono riportate le misure oggettive dell’altezza espresse in cm. Sull’asse delle ordinate troviamo invece i due stati 0→NON ALTO e 1→ALTO. Secondo la logica bivalente, che caratterizza i modelli concettuali insiemistici, il concetto ALTO può essere rappresentato da una funzione a gradino: da 0 cm a 150 cm si è NON ALTI, da 150 cm in poi si è ALTI. La logica fuzzy considera, al contrario, il concetto ALTO come una curva. Non esiste una misura esatta che stabilisce la demarcazione tra ALTO e NON ALTO. Tra i due stati esistono, in effetti, tutta una serie di condizioni intermedie in cui si è contemporaneamente ALTI e NON ALTI, o meglio, ALTI “in una certa misura”.

156

In questo senso, attraverso la logica fuzzy è possibile spiegare molte delle peculiarità che caratterizzano la cognizione umana quali, ad esempio, la flessibilità, l’adattamento alla comprensione di informazioni incomplete od incerte, l’ambiguità insita nel pensiero umano o, più in generale, la soggettività delle espressioni o valutazioni umane (atteggiamenti proposizionali?). Al fine di chiarire meglio le basi della

logica fuzzy, Zadeh ha, inoltre, introdotto e formalizzato due concetti

fondamentali, vale a dire, il concetto di “variabile linguistica” e quello di “variabile fuzzy”. La prima gioca un ruolo molto importante nella teoria del ragionamento approssimato, e, dunque, nella spiegazione di quelle caratteristiche peculiari della cognizione umana a cui abbiamo fatto riferimento sopra. Come è agevole constatare, una variabile linguistica può assumere valori rappresentabili mediante parole o concetti espressi in un linguaggio naturale. Ad esempio, ALTO è una variabile linguistica che può assumere valori diversi a secondo del contesto antropo- culturale in cui occorre. Intimamente legato alla variabile linguistica è il concetto di “variabile fuzzy”. Essa è caratterizzata da particolari proprietà: il nome della variabile, l’universo dei concetti collegati ad un insieme, o “restrizione concettuale”, imposta dallo stesso nome della variabile. Come si intuisce facilmente, poiché la variabile linguistica assume i valori espressi dalla variabile fuzzy, la prima variabile è di

157

ordine superiore rispetto alla seconda. Una variabile linguistica è infatti strutturalmente molto più complessa di una variabile fuzzy, essendo dotata anche di regole sintattiche e semantiche precise per la sua caratterizzazione, oltre che di funzioni di appartenenza che quantificano (o codificano) gli intervalli di ammissibilità delle variabili fuzzy. Le regole semantiche possono essere caratterizzate algoritmicamente, possono, cioè, essere viste come algoritmi per generare una codifica dei termini riferiti alla variabile linguistica. Questi algoritmi vengono sviluppati a partire da un’estensione della logica binaria aristotelica, estensione in cui i valori di verità derivano da un tipo di ragionamento approssimato (senso comune), di un ragionamento, vale a dire, sviluppato a partire da concetti ed espressioni imprecise. In un tipico modello fuzzy i motori inferenziali si basano, dunque, su tre operazioni macro, eseguite in successione: la fuzzificazione dei dati in ingresso al sistema, la valutazione delle regole con cui ottenere i dati in uscita o risposta del sistema e la defuzzificazione di tali dati per trasdurre l’output del sistema. L’operazione di fuzzificazione si fonda su particolari procedure per la codifica delle informazioni, partendo dalla considerazione che a ciascuna di esse è associabile, come abbiamo in parte già detto, un “grado di verità”, o grado di appartenenza dell’informazione ad un determinato intervallo o range fissato. Questi intervalli non sono quasi

158

mai disgiunti tra di loro, bensì dotati di un variabile livello di sovrapposizione, rappresentabile mediante intersezione di particolari funzioni o classi di appartenenza. Un tipico aspetto grafico di queste classi è a forma triangolare o trapezoidale, la cui peculiarità comune è costituita dall’andamento a “pendenza” o restringimento agli estremi, traducendo quindi perfettamente l’idea di ragionamento fuzzy o “sfumato”. Il secondo passo consiste, a questo punto, nello stabilire le regole di valutazione delle informazioni input fuzzificate. Tali regole hanno la tradizionale forma del tipo se-allora, con cui attribuire l’appartenenza di un dato ad una particolare classe o insieme fuzzy. La terza operazione riguarda il processo inverso alla fuzzificazione, riguarda, cioè, la decodifica dei dati output in una forma numerica. La parte più delicata di questa procedura è legata direttamente ai diversi gradi di appartenenza di un dato codificato a più classi fuzzy contemporaneamente. E’ dunque necessario dotare il sistema di defuzzificazione di un metodo efficace per estrapolare il singolo dato

output partendo dal suo diverso grado di appartenenza alle varie classi

o triangoli creati. Il metodo più comunemente usato si basa sulla definizione dei centri delle varie classi e sulla combinazione lineare tra questi “centri di attrazione” delle classi e i relativi gradi di appartenenza del dato in esame. Questa combinazione fornirà allora un dato numerico

159

corrispondente al valore output del sistema, ottenuto pesando opportunamente il diverso grado di attrazione esercitata da ogni classe sul corrispondente dato input. Questo ultimo passo è senza dubbio la parte più complessa dell’intero processo e, da un punto di vista concettuale, riproduce pienamente l’operazione decisionale del cervello umano durante l’analisi di informazioni imprecise e/o incomplete.

I motori inferenziali della logica fuzzy sono stati recentemente implementati su dei sistemi artificiali, chiamati reti neurali. In particolare, esse apprendono le regole fuzzy dall’esperienza, vale a dire, dai dati fenomenici. Quello che si sta cercando di riprodurre artificialmente con queste reti è, quindi, sostanzialmente la capacità umana di tradurre il modo di agire esperto in regole fuzzy. In contrapposizione ai sistemi esperti elaborati a partire dagli anni Settanta, in cui i motori inferenziali si basano sulle regole della logica bivalente e la base di conoscenza è definita a priori ed in maniera pressoché definitiva, questi nuovi sistemi dovrebbero, infatti, essere in grado di sviluppare delle strutture concettuali, o basi di conoscenza, dal carattere dinamico. Delle basi di conoscenza, vale a dire, soggette, grazie all’apprendimento e all’esperienza, a continue ristrutturazioni interne che rappresentano il primo passo verso la soluzione di alcuni tra i principali problemi sollevatisi nell’ambito dell’IA quali, ad esempio, il

160

problema del collo di bottiglia di Feigenbaum e l’assenza di conoscenza di sfondo, dovuta all’assunzione del mondo chiuso118.

La constatazione dell’esistenza di un rapporto reale tra l’articolazione della struttura concettuale ed i processi di decision

making ha inoltre permesso di stabilire un preciso nesso tra tali tipi di

strutture e l’azione propria di una memoria associativa. In effetti, come è ben noto, una memoria associativa può essere considerata come uno strumento capace di condurre al completamento di un insieme incompleto di dati, ricorrendo ad una dinamica specifica, una dinamica che può risultare vincolata a specifiche misure di similarità e che può anche includere parametri relativi all’attenzione ed alla coscienza.

In questo quadro, il problema di fondo che viene a profilarsi all’orizzonte è dunque quello di giungere ad individuare la forma “giusta” delle leggi dinamiche che determinano l’articolazione delle strutture cognitive. Non si tratta più soltanto di definire postulati di significato, come nella tradizione composizionale del significato, si tratta di considerare, bensì, in profondità gli aspetti propri del contesto semantico, nonché del contesto dinamico al cui interno giungono ad articolarsi le procedure della classificazione e della categorizzazione che

118 Una trattazione sintetica ma esauriene di tali problematiche si trovano in:

FEIGENBAUM, E.A., “The Art of Artificial Intelligence.1 Themes and Case Studies of

Knowledge Engineering” Computer Science Department Report STAN-CS-77-621, Standford University, Standford, 1977.

161

caratterizzano più propriamente le attività cognitive. Occorre definire, in altre parole, tipi di algoritmi capaci di generare oggetti dotati di un tipo particolare di organizzazione: l’organizzazione intensionale. Oggetti capaci di auto-organizzarsi e di articolarsi in modo autonomo. Queste considerazioni a carattere del tutto generale appaiono ben esemplificate, da un punto di vista filosofico, da un passo tratto da un recente volume di H. Putnam:

“Si potrebbe intraprendere il progetto più eccitante e ambizioso di costruire un congegno che possa apprendere la conoscenza di sfondo interagendo con gli esseri umani, come un bambino che impara un linguaggio e tutte le informazioni culturali, esplicite e tacite, che vengono assimilate crescendo in una comunità umana”.119

Prima di passare ad analizzare come la conoscenza delle operazioni di classificazione acquisita in questi ultimi anni, a livello di simulazione, tramite neural networks, possa connettersi agli aspetti dinamici della cognizione, appare, quindi, necessario, a questo punto, soffermarsi su quelle linee di ricerca che centrano la propria attenzione sul modo in cui i dati sensoriali-continui, dinamici, rumorosi vengono codificati internamente sotto forma di forme categoriali. In quanto segue, cercheremo, quindi, di delineare il particolare ruolo svolto dai

162

processi di interazione fra un agente e il suo ambiente nella concept

formation.