Fuzzificazione degli input e inferenza - La logica fuzzy applicata all’analisi della ruralità i

4. LA DEFINIZIONE DELLA RURALITA’ ATTRAVERSO L’ANALISI FUZZY

4.2. La logica fuzzy applicata all’analisi della ruralità in Europa

4.2.3. Fuzzificazione degli input e inferenza

La fase di fuzzificazione degli input consiste nella traduzione delle variabili di natura numerica (le quali possono essere espresse in differenti unità di misura) in variabili di carattere lessico-grafico. A seguito di tale processo, dunque, non si hanno più numeri reali, ma semplicemente termini linguistici. Ogni gruppo (o insieme fuzzy) è, poi, caratterizzato da funzioni di appartenenza, usate per assegnare i valori numerici ai differenti insiemi. Tali funzioni possono assumere valori compresi tra 0 e 1, dove 0 indica assenza di appartenenza, mentre 1 indica completa appartenenza. Di conseguenza, valori intermedi della funzione indicano livelli di appartenenza intermedi.

Il processo di fuzzificazione avviene attraverso la definizione di alcuni blocchi di regole di controllo linguistico, che rappresenta il momento più importante del processo decisionale. Ancora una volta, l’output di questi blocchi di regole è rappresentato da variabili linguistiche: è solo la fase di defuzzificazione che trasforma queste variabili linguistiche nuovamente in variabili di tipo numerico. Le variabili linguistiche devono essere definite per tutte le variabili di input, intermedie e di output. In merito, le funzioni di appartenenza assumono grande rilevanza. Tali funzioni, in particolare, sono identificate attraverso una serie di valori-soglia, al raggiungimento dei quali i termini linguistici si modificano. In Figura 4.2 è stata presa ad esempio la variabile di input DENSITA’ (densità di popolazione). Questa variabile è definita da tre termini linguistici: basso (low), medio

seconda del livello di attivazione e dal blocco di regole. Le soglie relative ai tre termini sono state selezionate osservando la distribuzione di ciascuna variabile all’interno del campione. In particolare, il termine “basso” è attivato (con valore di appartenenza pari a 1) fino al primo quartile (69,75 ab./kmq). Tra il primo quartile e il valore mediano (138,34 ab./kmq) si attivano contemporaneamente i termini “basso” e “medio”, mentre tra il valore mediano e il terzo quartile (356,71 ab./kmq) si attivano i termini “medio” e “alto”. Al di sopra del terzo quartile, il solo valore “alto” risulta attivato.

Per comprendere meglio il funzionamento del processo di fuzzificazione, si ipotizzi che la variabile DENSITA’ assuma, in una data regione, un valore di input pari a 200 ab./kmq (Figura 4.3). Sulla base delle regole individuate, questo valore viene trasformato in un numero fuzzy,che indica come un valore pari a 200 appartenga per 0,72 (72%) all’insieme dei valori medi e per 0,28 (28%) all’insieme dei valori alti. Un valore di densità pari a 200 ab./kmq, dunque, può essere considerato un valore medio-alto, dove comunque l’accezione di medio risulta preponderante. A seguito di un cambiamento nella variabile di input, si può però avere un cambiamento anche nelle regole attivate. Ad esempio, con un valore di densità pari a 300 ab./kmq le due regole attivate saranno le medesime, ma in questo caso, il termine medio sarà attivato con un valore pari a 0,26; il termine alto con un valore pari a 0,74. In questo secondo caso è dunque l’accezione di “alto” a risultare di fatto preponderante.

È dunque evidente che un ruolo cruciale nel processo di fuzzificazione è rappresentato dalla scelta delle soglie che definiscano i livelli di attivazione dei termini linguistici (“basso”, “medio”, “alto”). Di norma, tale definizione è lasciata alla valutazione di esperti che, sulla base della propria esperienza pregressa, sono in grado di stabilire soglie imprecise, benché sostanzialmente corrette. Tuttavia, dal momento che il problema della definizione di ruralità attraverso un set composito di indicatori è un problema sostanzialmente nuovo nella letteratura, la scelta delle funzioni di appartenenza è ricondotta essenzialmente alle caratteristiche del set di dati osservati. Come già anticipato, infatti, i valori che caratterizzano ciascuna funzione di appartenenza sono (per ciascuna variabile di input) il primo quartile, la mediana e il terzo quartile36 (Tabella 4.4).

36. È stata utilizzata una distribuzione grafica delle funzioni di appartenenza definita come “standardizzata”. È consentita l’attivazione contemporanea al massimo di due regole per volta. Contestualmente, i rispettivi valori di attivazione risultano complementari: ne consegue che al raggiungimento del picco della regola successiva, la regola precedente raggiunge un valore pari a 0.

Figura 4.2 – Processo di fuzzificazione per la variabile di input DENSITA’

Fonte:elaborazione personale, software FuzzyTECH

Figura 4.3 – Esempio di fuzzificazione per la variabile di input DENSITA’

Tabella 4.4 – Punti caratterizzanti le funzioni di appartenenza per le variabili di input

Regola Forma Punti caratterizzanti (valori x,y)

Densità Basso Lineare (0;1) (69,75;1) (138,34;0) (600;0) Medio Lineare (0;0) (69,75;0) (138,34;1) (356,71;0) (600;0) Alto Lineare (0;0) (138,34;0) (356,71;1) (600;1) Multi_acce ss Basso Lineare (0;1) (66,53;1) (96,50;0) (210;0) Medio Lineare (0;0) (66,53;0) (96,50;1) (122,90;0) (210;0) Alto Lineare (0;0) (96,50;0) (122,90;1) (210;1) Multi_ access_ naz Basso Lineare (0;1) (81,08;1) (97,90;0) (210;0) Medio Lineare (0;0) (81,08;0) (97,90;1) (118,37;0) (210;0) Alto Lineare (0;0) (97,90;0) (118,37;1) (210;1) VA_agri Basso Lineare (0;1) (0,6859;1) (1,8063;0) (5;0) Medio Lineare (0;0) (0,6859;0) (1,8063;1) (3,9199;0) (5;0) Alto Lineare (0;0) (1,8063;0) (3,9199;1) (5;1) Occ_agri Basso Lineare (0;1) (1,633;1) (4,129;0) (10;0) Medio Lineare (0;0) (1,633;0) (4,129;1) (7,885;0) (10;0) Alto Lineare (0;0) (4,129;0) (7,885;1) (10;1) Aree_agri Basso Lineare (0;1) (0,375;1) (0,527;0) (1;0) Medio Lineare (0;0) (0,375;0) (0,527;1) (0,672;0) (1;0) Alto Lineare (0;0) (0,527;1) (0,672;0) (1;1) Foreste Basso Lineare (0;1) (0,145;1) (0,307;0) (1;0) Medio Lineare (0;0) (0,145;0) (0,307;1) (0,481;0) (1;0) Alto Lineare (0;0) (0,307;0) (0,481;0) (1;1) Aree_ artificiali Basso Lineare (0;1) (0;035;1) (0.065;0) (1;0) Medio Lineare (0;0) (0,035;0) (0.065;1) (0,10;0) (1;0) Alto Lineare (0;0) (0.065;0) (0,10;1) (1;1)

Fonte: elaborazione personale, software FuzzyTECH

Ultimato il processo di fuzzificazione delle variabili di input, si procede alla fase dell’inferenza vera e propria. La creazione dei blocchi di regole costituisce il cuore del processo decisionale. Nei blocchi di regole if-then è immagazzinata la conoscenza necessaria al funzionamento del sistema: è proprio attraverso questi blocchi di regole che avviene il processo di inferenza.

L’elaborazione delle regole del tipo if-then permette di combinare (in tutte le possibili coniugazioni esistenti) le variabili di input entro specifici blocchi logici. Ogni regola è composta da due parti distinte: la premessa (anche nota come antecedente) costituisce la if-part; la conclusione (o conseguente) rappresenta la then-part. In termini logici, è possibile esprimere la seguente relazione:

se (antecedente), allora (conseguente)

Qualora l’antecedente risulti vero, la regola si attiva. Si badi, tuttavia, che la regola viene attivata soltanto nella misura in cui viene attivato l’antecedente. A titolo esemplificativo, in Tabella 4.5 è riportato il blocco di regole relativo alla formazione dell’indice “Ruolo dell’agricoltura” (RUOLO_AGRI). In questo caso, il numero di regole

è pari a 27 (ovvero 33) 37: tre sono infatti le variabili di input che concorrono a definire l’indicatore e ciascuna variabile di input è caratterizzata da tre possibili livelli38

. Per l’analisi di tutti i blocchi di regole utilizzati nel sistema si rimanda all’Appendice A.1.

Tabella 4.5 – Blocco di regole relativo all’indice del RUOLO_AGRI

IF THEN

VA_agri Occ_agri Aree_agri RUOLO_AGRI

Basso Basso Basso Molto_Basso

Basso Basso Medio Molto_Basso

Basso Basso Alto Basso

Basso Medio Basso Basso

Basso Medio Medio Basso

Basso Medio Alto Medio

Basso Alto Basso Medio

Basso Alto Medio Medio

Basso Alto Alto Medio

Medio Basso Basso Basso

Medio Basso Medio Basso

Medio Basso Alto Medio

Medio Medio Basso Medio

Medio Medio Medio Medio

Medio Medio Alto Medio

Medio Alto Basso Medio

Medio Alto Medio Alto

Medio Alto Alto Alto

Alto Basso Basso Medio

Alto Basso Medio Medio

Alto Basso Alto Medio

Alto Medio Basso Medio

Alto Medio Medio Alto

Alto Medio Alto Alto

Alto Alto Basso Alto

Alto Alto Medio Molto_Alto

Alto Alto Alto Molto_Alto

Fonte: elaborazione personale, software FuzzyTECH

Nella definizione del blocco di regole proposto in tabella, si nota come non sia sufficiente il cambiamento di status (ad esempio da basso a medio) di una sola delle tre variabili per vedere modificata la parte then. Si può altresì notare che la variabile intermedia RUOLO_AGRI (così come tutte le altre variabili intermedie) è descritta da cinque termini (molto basso, basso, medio, alto, molto alto) e non da tre, come avviene per le variabili di input. Infatti, spostandosi verso la parte destra dell’albero decisionale, le variabili fuzzy incontrate risultano composte da un numero progressivamente crescente di

37. In generale, la lunghezza dei blocchi può risultare anche molto estesa, dal momento che i tre possibili termini (basso, medio, alto) del primo indicatore devono essere combinati con i tre del secondo e così via con tutti quelli delle altre variabili che concorrono alla definizione il medesimo output intermedio.

38. Nel dettaglio, le variabili di input sono: i) GVA_AGRI: incidenza del valore aggiunto del settore agricolo sul totale; ii) EMPLOYMENT_AGRI: incidenza dell’occupazione agricola sul totale; iii) AGRI_AREAS: incidenza delle superfici ad uso agricolo sull’area totale.

termini. L’aumento del numero dei termini linguistici utilizzati ad ogni passo dell’aggregazione è finalizzato al tentativo di mantenere quanto più possibile la complessità lessicale. Inoltre, esso permette di ottenere degli output parziali e finali molto più sensibili a piccole variazioni negli input iniziali39. Pertanto, gli indicatori intermedi sono descritti da cinque termini linguistici, mentre l’indicatore di output è descritto da sette termini.

Si ricorda, infine, che proprio la variabile RUOLO_AGRI rappresenta una variabile intermedia: essa costituisce sia un output parziale per la parte di sinistra del sistema, sia una variabile di input per la parte destra dell’albero decisionale. In particolare, con l’unica eccezione dell’indicatore PAESAGGIO_NAT (il quale viene aggregato alla variabile Aree_artificiali per ottenere un indicatore di output intermedio, ovvero l’indicatore PAESAGGIO), tutti gli indicatori intermedi contribuiscono poi a determinare l'indice di output del sistema: ovvero l’indicatore sintetico di ruralità (RURALITA’).

Relativamente alla scelta degli operatori matematici utilizzati per la fase di aggregazione, si deve distinguere tra le due parti del blocco. Nella if part (antecedente) è stato utilizzato l’operatore logico AND: in altri termini, tutte le richieste devono risultare vere contemporaneamente40. Nella then part (conseguente), invece, si attiva il termine linguistico indicato dal blocco di regole: in generale, la quota attivata è quella pari al minimo. Tuttavia, nel caso in cui uno (o anche più) termini linguistici dell’output risultino attivati a vari livelli da diverse regole, viene utilizzata la regola del BOUNDED SUM41. Il risultato finale si avrà una situazione in cui uno o più termini della variabile finale sono attivati per valori compresi tra 0 e 1.

Infine, si segnala che, all’interno di ogni blocco di regole, alle singole variabili può essere assegnata una rilevanza differente. Ad esempio, nel blocco di regole RUOLO_AGRI visto in precedenza, le variabili di input VA_agri e Occ_agri hanno effetto positivo e massimo (+2); la variabile di input Aree_agri, invece, gioca un effetto positivo ma di intensità minore (+1). Si rimanda sempre all’Appendice A.1 per maggiori dettagli circa la rilevanza ricoperta da ciascuna variabile all’interno dei singoli blocchi di regole.

39. Non è possibile aumentare senza limiti la raffinatezza della descrizione linguistica degli output. In questo caso, infatti, si arriverebbe ad un numero esplosivo di regole. Si ricordi, infatti, che se i rappresenta il numero di input coinvolti in una aggregazione e j rappresenta il numero di termini linguistici che descrivono ogni input, il numero di regole risulterà pari ad i j.

40. Altri operatori possibili sono l’operatore OR logico e l’operatore GAMMA.

41. Qualora, nella parte then, si attivino più termini uguali, il loro valore di attivazione si somma, fino al raggiungimento del valore 1. In presenza di tale valore, ci si ferma in ogni caso.

Nel documento Il cambiamento della ruralità nell'Unione Europea. Tipologie, evoluzione e risposte alle politiche (pagine 83-89)