• Non ci sono risultati.

L'analisi di una rete neurale e gli strumenti per la sua valutazione

Capitolo 4: Descrizione quantitativa del neurone artificiale

4.4 L'analisi di una rete neurale e gli strumenti per la sua valutazione

Il periodo di addestramento di una rete neurale dipende essenzialmente dal paradigma di apprendimento utilizzato.

1. L’apprendimento supervisionato: in questa tipologia di apprendimento si fa ricorso all'errore medio fra la risposta desiderata e la risposta fornita dalla rete neurale per ciascun

pattern di addestramento. Si termina la fase di addestramento, con la registrazione dei valori sinaptici, quando l'errore raggiunge un valore minimo prefissato; si passa quindi alla Figura 12: Riproduzione di una rete neurale con relativa unità di bias in nero. Ogni unità possiede una connessione di bias mentre le unità in input ne sono prive poichè vengono attivate dall'elemento corrispondente del vettore di ingresso Fonte: Floreano, Mattiussi, 2002

fase di test. Per impostare il livello minimo di errore ci si deve basare su svariati fattori come il grado di precisione che si vuole ottenere, la funzione di attivazione utilizzata, il numero di unità di output e la distribuzione dei pattern nello spazio. Si deve inoltre considerare che vi è un trade-off tra la precisione nella fase di apprendimento dei pattern e la capacità di riuscir a generalizzare ai nuovi pattern di test.

2. L’apprendimento per auto-organizzazione: in questo caso non vi è una misura dell'errore ma per alcuni di questi algoritmi può essere definita una funzione di energia (o funzione

oggettiva) dei parametri della rete. Questa funzione ci restituisce una misura continua in

merito alla convergenza della rete verso una soluzione. In alternativa possono essere utilizzati anche altre metodologie come l'analisi di alcuni indici. Un primo esempio di indice può essere la misura della variazione delle sinapsi: si ritiene infatti di aver raggiunto una soluzione quando i valori delle sinapsi hanno una certa stabilità. Un secondo indice che può essere preso in considerazione riguarda la variazione dello stato di attivazione dei nodi della rete per ogni singolo pattern.

Se invece si volesse valutare la qualità della risposta di una rete neurale dopo la fase di addestramento ci si deve essenzialmente domandare quale sia la sua finalità di impiego.37 Utilizzare un modello neurale comporta il vantaggio di poter studiare le dinamiche di sviluppo dello stesso; questo permette di capire al meglio il funzionamento del modello finale risultante ma anche di analizzare quantitativamente i risultati di molti esperimenti. Floreano e Mattiussi nel Manuale sulle Reti Neurali (2002) riportano che questi esperimenti possono essere quantificati anche se svolti in ambito psicologico verso soggetti animali o umani; si può quindi comprendere in che modo questi soggetti imparano.

A differenza del sistema neurale presente nei soggetti umani, la valutazione di una Rete Neurale Artificiale non può avvenire mediante una semplice "interrogazione" quindi si ritiene opportuno pianificare a priori la struttura e la metodologia simulativa; questo è fatto in modo da rappresentare al meglio la situazione sperimentale che si ha intenzione di analizzare. Una ulteriore divergenza si basa sul fatto che nella sperimentazione su soggetti umani od animali, le prestazioni possono essere misurate per esempio calcolando il tempo di risposta del soggetto esaminato; con le reti neurali, non si può procedere in questo modo poiché tali strutture, come risposta, restituiscono solamente l'attivazione o meno dei nodi di uscita. Malgrado le differenze che sussistono tra soggetti umani e le reti neurali risulta essere più produttivo individuare dei confronti sulle proprietà delle prestazioni. Floreano e Mattiussi (2002) a questo proposito riportano l’esempio delle reti neurali che utilizzano il meccanismo di apprendimento supervisionato: in questo confronto tra reti si deve tenere conto di quali siano

37 In merito all'approfondimento di questo argomento si faccia riferimento Dario Floreano e Claudio Mattiussi nel Manuale sulle Reti Neurali,2002, pag. 57.

i pattern in ingresso che provocano i gli errori più marcati, se vi è sistematicamente una risposta errata per dati tipi di pattern oppure, in caso di errore, quale sia la risposta della rete. In generale infatti la misura di errore della rete neurale è sintomo del grado di difficoltà nella elaborazione del pattern in ingresso; questa motivazione ci consente di poter paragonare l'errore della rete neurale38 con le percentuali delle risposte corrette e dei relativi tempi dei soggetti analizzati. In questo contesto quindi non devono essere prese in considerazione le scale di misura ma esclusivamente l'andamento delle prestazioni sotto i vari vincoli imposti dall’esperimento.

Un'altra tipologia di valutazione concerne l'analisi interna della rete ottenuta dopo la fase di apprendimento. Prestando attenzione alle caratteristiche di attivazione dei nodi interni e alla configurazione dei valori sinaptici si può giungere al tipo di soluzioni utilizzate dalla rete per risolvere un dato problema. Se si volesse, ad esempio, analizzare una rete feedforward39 avente un solo strato di sinapsi, la visualizzazione dei campi consiste nella proiezione su un piano dei valori sinaptici associati a ciascun neurone; a valori assoluti più alti corrisponde un'associazione più forte la quale, a sua volta può significare una specializzazione del neurone per quanto riguarda una data risposta; questo fa in modo che si possa comprendere quali siano gli stimoli in input che in maniera più efficace riescano ad attivarlo. Questa metodologia però si presenta molto complessa nel caso in cui gli input da introdurre nella rete abbiano una dimensionalità molto elevata (Floreano, Mattiussi, 2002).

Un metodo alternativo per l'analisi dei valori sinaptici punta a estrapolare le caratteristiche dei campi recettivi sulla base della misurazione dell'attività dei nodi stessi. Questa capacità di attivazione di un nodo si calcola mediante la presentazione di molteplici stimoli nel suo campo recettivo in modo da poter stimare delle curve di risposta che vanno a definire la selettività del nodo stesso; ciò permette quindi di poter delineare le caratteristiche dello stimolo e risulta molto utile per l'analisi dei nodi interni alle reti multistrato.

L'analisi di come avviene l'attivazione di un singolo nodo non ci dice nulla in merito sul come l'intera rete organizzi internamente i vari stimoli in ingresso. Per poter giungere a quest’informazione si deve procedere mediante un'analisi per gruppi (o cluster analysis) in merito all'attivazione di tutti i nodi interni, misurata per ciascun pattern in ingresso. Al termine di questa analisi si ottiene una suddivisione degli input (o delle somiglianze percepite dalla rete) in funzione dei nodi attivati interni.

38 L'errore della rete neurale può essere per esempio la somma delle discrepanze quadratiche medie fra il vettore di output della rete e il vettore della risposta corretta, la distanza di Hamming o altre in base al modello utilizzato.

39 La rete feedforward fu uno tra i primi modelli di rete neurali messi a punto; si caratterizza per la sua semplicità in quanto le informazioni si muovono esclusivamente in una sola direzione ovvero dalle unità di input verso quelle degli strati di output. Per questo motivo questo sistema non crea cicli e si differenzia quindi dalle reti neurali ricorrenti. La rete feedforward è anche chiamata rete neurale con flusso in avanti.

La valutazione quindi punta a sottolineare le qualità della modello neurale in funzione delle finalità di ricerca la quale non sempre si limita a voler riprodurre dei dati sperimentali esistenti ma anche a fornire delle nuove predizioni.