• Non ci sono risultati.

2.5 La costruzione degli indicatori composti

2.5.3 L’aggregazione

2.5.3.7 Altre tecniche di aggregazione

(1) INDICATORI SOPRA E SOTTO LA MEDIA

Tale metodo è basato sulla differenza tra il numero di indicatori che sono sopra o sotto il una prefissata soglia usualmente vicina – o coincidente – alla media della distribuzione.

I X i 1 N sgn xi M`xa ffffffffffffffffff@b1pc H J I K

La soglia p può essere scelta arbitrariamente. Tale metodo di normalizzazione degli indicatori, e, di conseguenza, la relativa tecnica di aggregazione, non risente dell’eventuale presenza di outliers.

(2) METODO TASSONOMICO DI WROCLAW

Nato in campo economico, il metodo di sintesi degli indicatori di Wroclaw ha lo scopo di costruire indicatori composti espressivi del livello di sviluppo. Può tuttavia essere applicato in tutti i casi in cui sia utile la determinazione di una misura complessiva e sintetica di indicatori e risulta di grande utilità come approccio di analisi comparativa delle unità – in genere territoriali – osservate.

Due sono le tecniche operative di applicazione di questo metodo: la prima prevede la sintesi degli indicatori elementari per mezzo di un indice di distanza di ogni unità territoriale da una “unità leader”; la seconda tecnica raggruppa le unità territoriali omogenee analizzando le mutue distanze di ogni unità dalle altre tramite grafici tassonomici.

Distanza da una unità ideale

La base di partenza è costituita dalla matrice degli indicatori elementari normalizzati in punteggi z (ovvero standardizzati): essa viene utilizzata per costruire un indice sintetico ottenuto mediante aggregazione delle distanze delle singole unità da un valore ideale che, per ciascun indicatore, è il valore massimo raggiunto. Le misure elementari migliori, convertite in scarti standardizzati z, serviranno a costruire un vettore di valori ideali che identifica appunto l’unità ideale. Il confronto di ciascuna unità con l’unità ideale si effettua mediante il calcolo della loro distanza euclidea, definita misura dello sviluppo del modello di Hellewig, Di,0 che diverrà il numeratore dell’indicatore composto.

Di,0 X j 1 m zij@z0j b c2 v u u t wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww

Considerando poi la media aritmetica Dfffff0 delle distanze euclidee delle singole unità statistiche dal valore ideale e il loro scarto quadratico medio V0, è possibile determinare il denominatore dell’indicatore composto come segue:

D0 Dfffff0 2V0 dove Dfffff0 1 NfffffffXi 1 N Di,0 e V0 1 NfffffffXi 1 N Di0@D fffff 0 b c2 v u u t wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww .

L’indicatore sintetico finale, che si ottiene dalla seguente formula,

I Di,0

indica il livello di sviluppo dell’i-esima unità, che sarà tanto più elevato quanto più l’indicatore è vicino a 0 ovvero quanto più piccola è la distanza dall’unità ideale.

Grafici tassonomici

L’utilizzo dei grafici tassonomici per il raggruppamento di unità – territoriali – omogenee offre un notevole contributo all’analisi dei fenomeni complessi mediante indicatori elementari. Essi vengono costruiti in base agli indici di mutua distanza tra le unità, e non, perciò, da un’unità ideale.

Anzitutto definiamo la distanza di una generica unità r da un’altra unità s: Drs X

j zrj@zsj

b c2

s

wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww

essendo valide le seguenti relazioni che caratterizzano la distanza:

Drr 0 Drs Dsr DrsdDrpDps .

Calcolate le distanze tra unità, si costruisce la matrice delle distanze Dn,n, la quale è simmetrica con valori nulli sulla diagonale principale: essa servirà di base per l’individuazione di gruppi omogenei (o tipologici) di unità.

Il procedimento ha inizio determinando nella matrice D gli elementi più piccoli di ciascuna riga che denoteremo, al variare di j, come segue:

di* min Dij

b c

.

Indicheremo poi con ji l’indice della colonna a cui appartiene l’elemento più piccolo della

riga i: al termine del procedimento si otterranno N coppie ordinate di indici (1, j1), (1, j2),

…, (1, jN) dall’analisi delle quali si individueranno i raggruppamenti di unità. Per ogni

raggruppamento viene poi identificato un centro che corrisponde all’unità la cui distanza media dalle altre unità del gruppo è minore.

Si tratta di un procedimento di analisi multidimensionale applicato a batterie di indicatori per la semplicità di calcolo.

(3) DIFFERENZE ANNUALI

Anzitutto si normalizza l’indicatore elementare sostituendolo con la differenza tra l’ultimo valore rilevato e il valore dell’anno precedente divisa per il valore dell’anno precedente. Successivamente, l’indicatore composto viene costruito come somma degli indicatori normalizzati.

I X i 1 N wiyit X i 1 N wi ffffffffffffffffffffffffffff con yit xi t @xit@1 xit

fffffffffffffffffffffffffffffff dove xit è il valore assunto dall’indicatore nell’anno corrente (t)

mentre xit

@1

identifica il valore che l’indicatore x ha assunto nell’anno precedente (t-1).

(4) METODORIZZI

Com’è noto, fissato un sistema di riferimento (costituito da un punto O detto origine, da

m assi orientati che partono da esso e da m unità di misura, una per ciascuna dimensione), c’è una corrispondenza biunivoca fra i punti dello spazio (che, essendo costituito da più dimensioni viene definito iperspazio) e le m-ple ordinate di numeri reali. Dal punto di vista geometrico, quindi, un’unità statistica, su cui sono state osservate m

variabili, può essere considerata come un punto di un iperspazio ad m dimensioni. In questa ottica, anche i valori assunti presso le N unità statistiche dalle m variabili latenti dell’analisi delle componenti principali possono essere considerati le coordinate di N punti di un iperspazio a m dimensioni, i cui assi ortogonali sono costituiti proprio dalle m variabili latenti dell’analisi delle componenti principali.

Ciò premesso, il Rizzi117, per tener conto di tutte le informazioni contenute nei dati (e non solo di quelle contenute nella prima componente principale), propone come indicatore sintetico degli indicatori elementari, rilevati per ciascuna unità statistica, la distanza euclidea dall’origine di detta unità rappresentata nello spazio individuato dalle variabili latenti anzidette.

Assunto il segno della prima componente principale (sgnci1) dal momento che essa, per definizione, è quella che spiega più variabilità rispetto alle altre componenti, l’indicatore sintetico viene calcolato secondo la seguente formula:

I sgnci1rXjcij2

w

wwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwwww

.