Statistica sociale
marco gherghi
Dipartimento di matematica e statistica
Università di Napoli Federico II gherghi@unina.it
(prof.ssa C. Davino)
La sintesi degli indicatori sociali
Corso di
Seminario su:
Definizione del problema
Raccolta dei dati
Scelta del metodo di analisi Conclusioni
Controllo
Interpretazione dei risultati
. Scelta delle unità
(indagine censuaria o campionaria) . Scelta delle variabili (princìpi di pertinenza, esaustività, non ridondanza) . Approccio “esplorativo” o “confermativo”
. Uso delle informazioni a priori
. Metodi univariati, bivariati,
multivariati, multidimensionali, …
. Significatività e
rilevanza dei risultati . Coerenza con
il problema posto
La traduzione empirica di una teoria si realizza attraverso l’operativizzazione dei concetti;
……….…. Base della teoria
….…. Rappresentazione parziale del concetto
… Quantificazione degli indicatori
… Misure sintetiche
……….… Macrocategorie che definiscono il concetto
Concetto
Indice
Dimensione 1 Dimensione 2 Dimensione 3
Indicatore Indicatore Indicatore Indicatore Indicatore Indicatore
Variabile Variabile Variabile Variabile Variabile Variabile
L’interpretazione de
Le D IMENSIONI : 1. Tenore di vita 2. Affari e lavoro
3. Ambiente e Servizi 4. Criminalità
5. Popolazione
6. Tempo libero
1. La ricchezza prodotta (Ammontare pro capite del valore aggiunto al costo dei fattori a prezzi correnti)
2. Gli stipendi (Importo medio annuo delle retribuzioni di operai e di impiegati) 3. Una vita assicurata (Ammontare medio per abitante dei premi per polizze vita) 4. Le pensioni (Importo medio mensile percepito dai pensionati)
5. L’abitazione (Prezzo medio al mq per un appartamento nuovo in zona semicentrale)
6. Le spese (Consumi per abitante ai prezzi correnti)
L’interpretazione de
1. Tenore di vita
Le D IMENSIONI , gli I NDICATORI e le V ARIABILI
L’interpretazione de
2. Affari e lavoro
1. Lo spirito imprenditoriale (Imprese registrate ogni 100 abitanti) 2. Il turn over (Rapporto tra nuove iscrizioni e imprese cessate)
3. I fallimenti (Numero di imprese fallite ogni 1000 registrate) 4. I crediti non riscossi (Importo medio dei protesti per abitante) 5. La vocazione all’estero (% di export sul valore aggiunto)
6. Alla ricerca di un posto sicuro (% di persone in cerca di lavoro in rapporto alle forze lavoro)
Le D IMENSIONI , gli I NDICATORI e le V ARIABILI
L’interpretazione de
3. Ambiente e servizi
1. La possibilità di trasporto (Indice di dotazione infrastrutturale di trasporto) 2. Gli arretrati della giustizia (Procedimenti civili pendenti per ogni 1000 abitanti)
3. Il clima (Escursione termica: differenza tra i valori delle temperature medie mensili del mese più caldo e del mese più freddo dell’anno)
4. I decessi per tumore (Morti per tumore sul totale dei decessi)
5. La pagella ecologica (Indice sintetico Legambiente sull’ecosistema urbano) 6. Il rischio sulle strade (Incidenti stradali ogni 1000 auto circolanti)
Le D IMENSIONI , gli I NDICATORI e le V ARIABILI
L’interpretazione de
4. Criminalità
1. Allarme rapine (Numero di rapine denunciate ogni 100mila abitanti) 2. I furti auto (Numero di furti d’auto denunciati ogni 100mila abitanti)
3. Gli appartamenti svaligiati (Numero di furti in casa denunciati ogni 100mila abitanti) 4. La microdelinquenza (Numero di borseggi e scippi denunciati ogni 100mila ab.)
5. Il trend (Variazione del trend totale dei delitti denunciati dalle forze di Polizia)
6. La difesa dell’ordine pubblico (Indice delle prestazioni e dotazioni delle forze di Polizia statali)
Le D IMENSIONI , gli I NDICATORI e le V ARIABILI
L’interpretazione de
5. Popolazione
1. Le nascite (Numero di nati vivi ogni 1000 abitanti nel 1999 vs. stesso indice nel 1995) 2. I decessi (Numero di morti ogni 1000 abitanti)
3. La vita rifiutata (Numero di suicidi e tentativi di suicidio ogni 100mila abitanti)
4. I trasferimenti (Numero di nuove iscrizioni anagrafiche per trasferimenti da altre province ogni 100 cancellazioni)
5. La mortalità infantile (Numero di morti entro il primo anno di vita ogni 1000 nati vivi) 6. I divorzi (Numero di divorzi ogni 100mila famiglie)
Le D IMENSIONI , gli I NDICATORI e le V ARIABILI
L’interpretazione de
6. Tempo libero
1. Le associazioni (Numero di associazioni artistiche, culturali e ricreative ogni 100mila abitanti)
2. Gli spettacoli sportivi (Spesa media per abitante per assistere a spettacoli sportivi) 3. Gli spettacoli teatrali e musicali (Spesa media per abitante per assistere a
spettacoli teatrali e musicali)
4. Gli spettacoli cinematografici (Spesa media per abitante per assistere a spettacoli cinematografici)
5. Le palestre (Numero di palestre ogni 100mila abitanti) 6. Le librerie (Numero di librerie ogni 100mila abitanti)
Le D IMENSIONI , gli I NDICATORI e le V ARIABILI
L’interpretazione de
36 variabili
1 indice sintetico 1 concetto 1 concetto 1 indice sintetico
6
dimensioni
L’interpretazione de
Il calcolo dell’indice sintetico
P ASSO 1:
Per ciascuna variabile vengono attribuiti 1.000 punti alla Provincia con il miglior valore, e punteggi proporzionali a tutte le altre.
Esempio: Reddito pro capite
1° classificata: BOLOGNA (29.480 €) 1.000 punti
2° classificata: MILANO (29.200 €) 29.480:1.000 = 29.200: x
x = 29.200 × 1.000
29.480 = 991
36 variabili
1 indice sintetico 1 concetto 1 concetto 1 indice sintetico
6 dimensioni
L’interpretazione de
Il calcolo dell’indice sintetico
P ASSO 1:
Per ciascuna variabile vengono attribuiti 1.000 punti alla Provincia con il miglior valore, e punteggi proporzionali a tutte le altre.
Esempio: Reddito pro capite
1° classificata: BOLOGNA (29.480 €) 1.000 punti 2° classificata: MILANO (29.200 €) 991 punti 47° classificata: MACERATA (19.880 €) 674punti
:
36 variabili
1 indice sintetico 1 concetto 1 concetto 1 indice sintetico
6 dimensioni
L’interpretazione de
Il calcolo dell’indice sintetico
P ASSO 2:
Si calcola il punteggio di ciascuna dimensione come media dei punteggi delle variabili corrispondenti.
Esempio: Tempo libero (per Macerata)
Associazioni Spettacoli
sportivi Spettacoli
teatrali Spettacoli
cinem. Palestre Librerie
512 80 226 517 710 429
Punteggio dimensione Tempo libero per Macerata:
512 + 80 + 226 + 517 + 710 + 429 = 2.474 ⇒ 2.474
6 = 412
36 variabili
1 indice sintetico 1 concetto 1 concetto 1 indice sintetico
6 dimensioni
L’interpretazione de
Il calcolo dell’indice sintetico
P ASSO 3:
Il punteggio sintetico complessivo viene calcolato come media dei punteggi delle singole dimensioni.
Esempio: Indice complessivo (per Macerata)
Tenore di
vita Affari e
lavoro Servizi e
ambiente Criminalità Popolazione Tempo libero
598 417 492 331 508 412
Punteggio sintetico complessivo per Macerata:
598 + 417 + 492 + 331 + 508 + 412 = 2.834 ⇒ 2.834
6 = 460 (Corrispondente alla 47° posizione)
36 variabili
1 indice sintetico 1 concetto 1 concetto 1 indice sintetico
6 dimensioni
1. Approccio ordinale
Si trasforma ciascun indicatore in ranghi (ordinamento) e si effettua la media semplice dei ranghi.
Si effettua poi la graduatoria sui valori dell’indice così ottenuto.
2. Approccio cardinale
Si trasformano gli indicatori, ad esempio standardizzandoli e rendendoli
così indipendenti dalle possibili differenze delle unità di misura, e si
effettua una media aritmetica semplice delle nuove variabili così
ottenute.
Tabella individui
×variabili:
• Le righe rappresentano gli individui e sono in genere osservazioni, oggetti, unità statistiche;
• Le colonne rappresentano le variabili definite da valori numerici continui;
• Le n unità sono quindi punti di uno spazio a p dimensioni, impossibile da rappresentare quando è p>2;
x1
x2
xp
• L’obiettivo è trovare k«p nuove variabili, combinazioni lineari di quelle di partenza, in grado di rappresentare al meglio l’informazione contenuta nello spazio originario;
21,1 3,2 12,6
x1 x2 … xp i1
i2
in : :
X = …... …...
…... …...
x
ij15,6 8,4 17,2
16,4 7,2 21,3
La matrice dei dati
x1 x2
O
P
i• Tra le infinite rette passanti per la nube dei punti, si sceglierà quella “più vicina” ai punti stessi, cioè quella che rende minima la somma dei quadrati delle distanze dei punti dalla retta stessa;
( ) P P ~ 2 min
i i − i =
∑
x1
x2
xp
• Il concetto può essere generalizzato al caso di p variabili. In questo caso si potranno costruire k nuove variabili, che dovranno essere tra loro ortogonali.
Distanza dall’origine nel nuovo spazio spazio originario
P ~
iCriterio per la determinazione del nuovo asse
Matrice dei dati: 16 Paesi, 10 variabili continue
Cereali Riso Patate Zucchero Verdure Vino Carne Latte Burro Uova
Belgio 72,2 4,2 98,8 40,4 103,2 20,9 102,0 80,0 7,7 14,2
Danimarca 70,5 2,2 57,0 39,5 50,0 22,0 105,8 145,2 4,1 14,3
Germania 71,3 2,3 74,1 37,1 83,1 22,8 97,2 90,7 6,9 14,8
Grecia 109,8 5,4 90,0 30,0 229,5 25,3 77,1 63,1 0,9 11,3
Spagna 71,4 5,8 107,8 26,8 191,7 43,0 102,1 98,4 0,6 15,3
Francia 73,0 4,3 78,2 34,1 95,0 64,5 110,5 98,9 8,9 15,0
Irlanda 93,4 3,2 151,5 34,8 55,0 3,9 105,0 185,9 3,4 11,4
Italia 110,2 4,8 38,6 27,9 181,9 61,6 88,0 65,0 2,4 11,1
Olanda 54,6 5,0 86,7 39,7 99,0 14,0 89,4 136,2 5,4 10,7
Portogallo 86,0 5,7 106,6 29,4 100,0 57,0 75,5 96,0 1,5 7,7
RegnoUnito 74,3 4,5 94,1 39,8 60,0 10,4 74,4 129,3 3,2 10,8
Austria 68,7 4,2 62,6 37,1 81,9 34,3 93,4 121,3 4,3 13,4
Finlandia 70,1 5,4 61,6 35,7 52,6 10,2 65,0 208,4 5,8 10,9
Islanda 79,7 1,9 50,2 54,9 50,0 6,2 71,7 205,6 4,6 11,3
Norvegia 76,9 3,5 73,2 37,3 48,3 6,6 54,9 176,5 2,1 11,3
Svezia 69,3 4,3 70,0 37,5 48,5 12,3 60,5 154,1 5,7 12,9
Differenza nella variabilità dei dati
Necessità di rendere i dati omogenei
Standardizzazione delle variabili
EFFETTIVI TOTALI : 16 PESO TOTALE : 16.00 +---+---+---+
|IDEN – ETICH. EFF. PESO | MEDIA SQM | MIN MAX | +---+---+---+
|CERE - cereali 16 16.00 | 78.21 14.45 | 54.60 110.20 |
|RISO - riso 16 16.00 | 4.17 1.20 | 1.90 5.80 |
|PATA - patate 16 16.00 | 81.31 26.48 | 38.60 151.50 |
|ZUCC - zucchero 16 16.00 | 36.38 6.40 | 26.80 54.90 |
|VERD - verdure 16 16.00 | 95.61 55.01 | 48.30 229.50 |
|VINO - vino 16 16.00 | 25.94 19.69 | 3.90 64.50 |
|CARN - carne 16 16.00 | 85.78 17.05 | 54.90 110.50 |
|LATT - latte 16 16.00 | 128.41 46.03 | 63.10 208.40 |
|BURR - burro 16 16.00 | 4.22 2.35 | 0.60 8.90 |
|UOVA - uova 16 16.00 | 12.27 2.01 | 7.70 15.30 | +---+---+---+
Statistiche descrittive
* i i
i
i
X X µ σ
= −
Matrice dei dati standardizzati
Cere Riso Pata Zucc Verd Vino Carn Latt Burr Uova Belgio -0,42 0,03 0,66 0,63 0,14 -0,26 0,95 -1,05 1,48 0,96 Danimarca -0,53 -1,64 -0,92 0,49 -0,83 -0,20 1,17 0,36 -0,05 1,01 Germania -0,48 -1,55 -0,27 0,11 -0,23 -0,16 0,67 -0,82 1,14 1,25 Grecia 2,19 1,02 0,33 -1,00 2,43 -0,03 -0,51 -1,42 -1,41 -0,48 Spagna -0,47 1,36 1,00 -1,50 1,75 0,87 0,96 -0,65 -1,54 1,50 Francia -0,36 0,11 -0,12 -0,36 -0,01 1,96 1,45 -0,64 1,99 1,35 Irlanda 1,05 -0,80 2,65 -0,25 -0,74 -1,12 1,13 1,25 -0,35 -0,43 Italia 2,21 0,52 -1,61 -1,32 1,57 1,81 0,13 -1,38 -0,77 -0,58 Olanda -1,63 0,69 0,20 0,52 0,06 -0,61 0,21 0,17 0,50 -0,78 Portogallo 0,54 1,27 0,95 -1,09 0,08 1,58 -0,60 -0,70 -1,16 -2,27 RegnoUnito -0,27 0,28 0,48 0,53 -0,65 -0,79 -0,67 0,02 -0,43 -0,73 Austria -0,66 0,03 -0,71 0,11 -0,25 0,42 0,45 -0,15 0,03 0,56 Finlandia -0,56 1,02 -0,74 -0,11 -0,78 -0,80 -1,22 1,74 0,67 -0,68 Islanda 0,10 -1,89 -1,17 2,89 -0,83 -1,00 -0,83 1,68 0,16 -0,48 Norvegia -0,09 -0,56 -0,31 0,14 -0,86 -0,98 -1,81 1,04 -0,90 -0,48 Svezia -0,62 0,11 -0,43 0,18 -0,86 -0,69 -1,48 0,56 0,63 0,31 Media 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00
sqm 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00
Cere Riso Pata Zucc Verd Vino Carn Latt Burr Uova Cere 1,00
Riso 0,13 1,00
Pata 0,06 0,23 1,00
Zucc -0,41 -0,69 -0,28 1,00
Verd 0,56 0,57 0,07 -0,64 1,00
Vino 0,29 0,42 -0,13 -0,62 0,54 1,00
Carn -0,07 -0,15 0,29 -0,19 0,22 0,39 1,00
Latt -0,34 -0,39 -0,04 0,58 -0,75 -0,69 -0,41 1,00
Burr -0,52 -0,34 -0,19 0,43 -0,46 -0,06 0,29 0,10 1,00
Uova -0,34 -0,31 -0,10 0,02 0,07 0,11 0,60 -0,22 0,45 1,00
Matrice di correlazione
x1
x2
xp
Origine La correlazione tra le variabili
originarie può essere interpretata in termini di una parziale “ridondanza di informazione”.
Le diverse variabili misurano, cioè, in parte la stessa cosa.
Obiettivo dell’ACP è determinare k nuove variabili, combinazioni lineari delle
variabili di partenza e tra loro non
correlate, in grado di rappresentare al
meglio l’informazione contenuta nello
spazio originario.
v La prima operazione è la centratura delle variabili che, da un punto di vista geometrico, comporta la traslazione del sistema nel
baricentro dei punti.
x1
x2
xp
Origine
Baricentro
v La prima operazione è la centratura delle variabili che, da un punto di vista geometrico, comporta la traslazione del sistema nel
baricentro dei punti.
x1
x2
xp
Origine
Baricentro
Baricentro
v Tutte le nuove variabili passano
necessariamente per il baricentro (la nuova origine).
Per determinare la prima nuova variabile, sarà quindi sufficiente individuare un solo altro punto, che tipicamente è quello che si trova a distanza unitaria dal baricentro nella direzione di
“ massimo allungamento” della nube dei punti.
v La prima operazione è la centratura delle variabili che, da un punto di vista geometrico, comporta la traslazione del sistema nel
baricentro dei punti.
Punto a distanza unitaria dalla nuova origine e nella
direzione di massimo allungamento della nube dei punti
v Tale punto sarà definito da p coordinate. Tali coordinate costituiscono il primo autovettore.
v Discorso analogo può essere fatto per la determinazione degli assi successivi che saranno, per costruzione, tra di loro ortogonali.
Prima
nuova variabile
Ciascun autovettore rappresenta dunque il sistema di pesi da applicare alle variabili originarie per ottenere le
coordinate dei punti sui nuovi assi.
1 2 3 4 5
Cere – cereali 0.30 0.24 0.18 -0.61 -0.27 Riso – riso 0.35 0.18 -0.13 0.62 0.09 Pata – patate 0.11 0.05 -0.86 -0.10 -0.15 Zucc – zucchero -0.44 -0.01 0.15 -0.18 -0.05 Verd – verdure 0.45 -0.03 0.11 -0.13 0.37 Vino – vino 0.37 -0.23 0.27 0.17 -0.46 Carn – carne 0.12 -0.54 -0.29 -0.26 -0.20 Latt – latte -0.40 0.26 -0.14 0.02 0.02 Burr – burro -0.25 -0.42 0.08 0.28 -0.42 Uova – uova -0.04 -0.57 -0.01 -0.09 0.58
Baricentro
Punto a distanza unitaria dalla nuova origine e nella direzione di massimo allungamento della nube dei punti
Prima
nuova variabile
Es.: Belgio (sul primo asse)
72,2 4,2 98,8 40,4 103,2 20,9 102,0 80,0 7,7 14,2
Cere Riso Pata Zucc Verd Vino Carn Latt Burr Uova
-0,42 0,03 0,66 0,63 0,14 -0,26 0,95 -1,05 1,48 0,96
Cere Riso Pata Zucc Verd Vino Carn Latt Burr Uova
× = (-0,42 × 0,30) + (0,03 × 0,35) + + (0,66 × 0,11) + … + (0,96 × -0,04)
= - 0,23
Calcolo della coordinata del BELGIO sul primo asse
-0,42 0,03 0,66 0,63 0,14 -0,26 0,95 -1,05 1,48 0,96
-0,42 0,03 0,66 0,63 0,14 -0,26 0,95 -1,05 1,48 0,96 0,30 0,35 0,11 -0,44 0,45 0,37 0,12 -0,40 -0,25 -0,04 0,30 0,35 0,11 -0,44 0,45 0,37 0,12 -0,40 -0,25 -0,04
1 2 3 4 5
Cere 0.30 0.24 0.18 -0.61 -0.27 Riso 0.35 0.18 -0.13 0.62 0.09 Pata 0.11 0.05 -0.86 -0.10 -0.15 Zucc -0.44 -0.01 0.15 -0.18 -0.05 Verd 0.45 -0.03 0.11 -0.13 0.37 Vino 0.37 -0.23 0.27 0.17 -0.46 Carn 0.12 -0.54 -0.29 -0.26 -0.20 Latt -0.40 0.26 -0.14 0.02 0.02 Burr -0.25 -0.42 0.08 0.28 -0.42 Uova -0.04 -0.57 -0.01 -0.09 0.58
1 2 3 4 5
BELGIO -0,23 -1.96 -0.62 0.10 -0.12
DANIMARCA -1,52 -1.48 0.43 -1.00 0.28
GERMANIA -0,85 -2.12 0.30 -0.64 0.12
GRECIA 3,45 1.43 0.32 -1.14 0.78
SPAGNA 2,92 -0.95 -1.23 0.39 1.72
FRANCIA 0,68 -3.08 0.32 0.77 -1.10
IRLANDA -0,58 0.62 -2.93 -1.78 -0.81
ITALIA 3,42 0.31 2.27 -0.75 -0.57
OLANDA -0,79 0.04 -0.67 1.36 0.05
PORTOGALLO 2,40 1.96 -0.42 0.83 -1.55
REGNO UNITO -0,70 1.17 -0.54 0.25 0.01
AUSTRIA -0,18 -0.89 0.48 0.42 0.21
FINLANDIA -1,48 1.43 0.26 1.63 0.05
ISLANDA -3,58 0.95 1.35 -1.36 -0.14
NORVEGIA -1,46 2.02 0.29 -0.07 0.63
SVEZIA -1,49 0.54 0.39 0.99 0.46
Media 0,00 0,00 0,00 0,00 0,00
Varianza 3,89 2,30 1,21 0,97 0,56
Coordinate sui fattori di sintesi (solo i primi 5)
(Autovalori)
Num Autov. % % cum. Istogramma
1 3.8920 38.92 38.92
•••••••••••••••••••••••••••••••••••••••2 2.2966 22.97 61.89
•••••••••••••••••••••••3 1.2126 12.13 74.01
••••••••••••4 0.9672 9.67 83.68
••••••••••5 0.5595 5.59 89.28
••••••6 0.4064 4.06 93.34
••••7 0.3050 3.05 96.39
•••8 0.2148 2.15 98.54
••9 0.1091 1.09 99.63
•10 0.0367 0.37 100.00
•Gli autovalori
Le coordinate nel vecchio e nel nuovo spazio
Ce Ri Pa Zu Ve Vi Ca La Bu Uo 1 2 3 4 5
Belg 72,2 4,2 98,8 40,4 103,2 20,9 102,0 80,0 7,7 14,2 -0,23 -1,97 -0,63 0,09 -0,13 Dani 70,5 2,2 57,0 39,5 50,0 22,0 105,8 145,2 4,1 14,3 -1,53 -1,49 0,43 -1,01 0,27 Germ 71,3 2,3 74,1 37,1 83,1 22,8 97,2 90,7 6,9 14,8 -0,86 -2,13 0,30 -0,65 0,11 Grec 109,8 5,4 90,0 30,0 229,5 25,3 77,1 63,1 0,9 11,3 3,45 1,44 0,33 -1,12 0,80 Spag 71,4 5,8 107,8 26,8 191,7 43,0 102,1 98,4 0,6 15,3 2,91 -0,95 -1,24 0,39 1,73 Fran 73,0 4,3 78,2 34,1 95,0 64,5 110,5 98,9 8,9 15,0 0,67 -3,08 0,31 0,74 -1,12 Irla 93,4 3,2 151,5 34,8 55,0 3,9 105,0 185,9 3,4 11,4 -0,57 0,63 -2,93 -1,78 -0,81 Ital 110,2 4,8 38,6 27,9 181,9 61,6 88,0 65,0 2,4 11,1 3,41 0,32 2,28 -0,75 -0,56 Olan 54,6 5,0 86,7 39,7 99,0 14,0 89,4 136,2 5,4 10,7 -0,79 0,04 -0,68 1,36 0,04 Port 86,0 5,7 106,6 29,4 100,0 57,0 75,5 96,0 1,5 7,7 2,40 1,97 -0,41 0,84 -1,54 GrBr 74,3 4,5 94,1 39,8 60,0 10,4 74,4 129,3 3,2 10,8 -0,70 1,17 -0,54 0,26 0,01 Aust 68,7 4,2 62,6 37,1 81,9 34,3 93,4 121,3 4,3 13,4 -0,19 -0,89 0,48 0,41 0,21 Finl 70,1 5,4 61,6 35,7 52,6 10,2 65,0 208,4 5,8 10,9 -1,48 1,44 0,26 1,64 0,04 Isla 79,7 1,9 50,2 54,9 50,0 6,2 71,7 205,6 4,6 11,3 -3,57 0,94 1,37 -1,36 -0,16 Norv 76,9 3,5 73,2 37,3 48,3 6,6 54,9 176,5 2,1 11,3 -1,46 2,02 0,29 -0,06 0,63 Svez 69,3 4,3 70,0 37,5 48,5 12,3 60,5 154,1 5,7 12,9 -1,48 0,54 0,39 0,99 0,46
Variabili iniziali Componenti Principali
Le coordinate nel vecchio e nel nuovo spazio
Cere Riso Pata Zucc Verd Vino Carn Latt Burr Uova 1 2 3 4 5
Belg -0,42 0,03 0,66 0,63 0,14 -0,26 0,95 -1,05 1,48 0,96 -0,23 -1,97 -0,63 0,09 -0,13 Dani -0,53 -1,64 -0,92 0,49 -0,83 -0,20 1,17 0,36 -0,05 1,01 -1,53 -1,49 0,43 -1,01 0,27 Germ -0,48 -1,55 -0,27 0,11 -0,23 -0,16 0,67 -0,82 1,14 1,25 -0,86 -2,13 0,30 -0,65 0,11 Grec 2,19 1,02 0,33 -1,00 2,43 -0,03 -0,51 -1,42 -1,41 -0,48 3,45 1,44 0,33 -1,12 0,80 Spag -0,47 1,36 1,00 -1,50 1,75 0,87 0,96 -0,65 -1,54 1,50 2,91 -0,95 -1,24 0,39 1,73 Fran -0,36 0,11 -0,12 -0,36 -0,01 1,96 1,45 -0,64 1,99 1,35 0,67 -3,08 0,31 0,74 -1,12 Irla 1,05 -0,80 2,65 -0,25 -0,74 -1,12 1,13 1,25 -0,35 -0,43 -0,57 0,63 -2,93 -1,78 -0,81 Ital 2,21 0,52 -1,61 -1,32 1,57 1,81 0,13 -1,38 -0,77 -0,58 3,41 0,32 2,28 -0,75 -0,56 Olan -1,63 0,69 0,20 0,52 0,06 -0,61 0,21 0,17 0,50 -0,78 -0,79 0,04 -0,68 1,36 0,04 Port 0,54 1,27 0,95 -1,09 0,08 1,58 -0,60 -0,70 -1,16 -2,27 2,40 1,97 -0,41 0,84 -1,54 ReUn -0,27 0,28 0,48 0,53 -0,65 -0,79 -0,67 0,02 -0,43 -0,73 -0,70 1,17 -0,54 0,26 0,01 Aust -0,66 0,03 -0,71 0,11 -0,25 0,42 0,45 -0,15 0,03 0,56 -0,19 -0,89 0,48 0,41 0,21 Finl -0,56 1,02 -0,74 -0,11 -0,78 -0,80 -1,22 1,74 0,67 -0,68 -1,48 1,44 0,26 1,64 0,04 Isla 0,10 -1,89 -1,17 2,89 -0,83 -1,00 -0,83 1,68 0,16 -0,48 -3,57 0,94 1,37 -1,36 -0,16 Norv -0,09 -0,56 -0,31 0,14 -0,86 -0,98 -1,81 1,04 -0,90 -0,48 -1,46 2,02 0,29 -0,06 0,63 Svez -0,62 0,11 -0,43 0,18 -0,86 -0,69 -1,48 0,56 0,63 0,31 -1,48 0,54 0,39 0,99 0,46 Medie 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 var 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 1,00 3,88 2,31 1,22 0,97 0,56
Variabili iniziali standardizzate Componenti principali
Ce Ri Pa Zu Ve Vi Ca La Bu Uo 1 2 3 4 5
Ce 1,00
Ri 0,13 1,00
Pa 0,06 0,23 1,00
Zu -0,41 -0,69 -0,28 1,00
Ve 0,56 0,57 0,07 -0,64 1,00
Vi 0,29 0,42 -0,13 -0,62 0,54 1,00
Ca -0,07 -0,15 0,29 -0,19 0,22 0,39 1,00
La -0,34 -0,39 -0,04 0,58 -0,75 -0,69 -0,41 1,00
Bu -0,52 -0,34 -0,19 0,43 -0,46 -0,06 0,29 0,10 1,00
Uo -0,34 -0,31 -0,10 0,02 0,07 0,11 0,60 -0,22 0,45 1,00
1 0,59 0,69 0,21 -0,87 0,89 0,73 0,24 -0,79 -0,50 -0,07 1,00
2 0,36 0,27 0,07 -0,01 -0,05 -0,35 -0,81 0,39 -0,64 -0,86 0,00 1,00
3 0,19 -0,14 -0,95 0,16 0,12 0,30 -0,32 -0,16 0,09 -0,01 0,00 0,00 1,00
4 -0,60 0,61 -0,10 -0,18 -0,13 0,17 -0,25 0,02 0,28 -0,09 0,00 0,00 0,00 1,00
5 -0,20 0,07 -0,11 -0,04 0,28 -0,34 -0,15 0,02 -0,31 0,43 0,00 0,00 0,00 0,00 1,00
L’interpretazione dei fattori:
correlazione tra variabili iniziali e componenti principali
cereali riso patate
verdure vino
latte
zucchero
burro
uova carne
Fattore 1 (38.9%) Fattore 2 (23.0%)
-0.5 0.5
-1.0 0 1.0
-0.5 0.5 1.0
La rappresentazione grafica: il cerchio delle correlazioni
Fattore 1 (38.9%) Fattore 2 (23.0%)
2
1
0
-1
-2
-3
-3.0 -1.5 1.5 3.0
GERMANIA
FRANCIA BELGIO
DANIMARCA
AUSTRIA OLANDA
SVEZIA IRLANDA REGNO UNITO FINLANDIA
ISLANDA
NORVEGIA PORTOGALLO
GRECIA ITALIA
SPAGNA
La rappresentazione grafica: i punti-unità
1. La visualizzazione delle relazioni (12 variabili selezionate)
!
!
1. La visualizzazione delle relazioni (12 variabili selezionate)
2. La determinazione di una “graduatoria”
La graduatoria può essere determinata sulla base della prima componente
principale, ossia sulla base delle coordinate delle Province sul primo fattore di
sintesi, oppure sulla base di una media ponderata delle coordinate sui k fattori
ritenuti significativi.
2. La determinazione di una “graduatoria”
Grad Prov Punti
1 FE 100,00
2 RN 97,44
3 MO 96,64
4 MN 94,61
5 RE 93,60
6 RA 92,47
7 BO 90,20
8 MS 89,66
9 SO 88,41
10 LU 87,91
35 PV 61,78
36 BZ 61,29
37 BS 61,19
38 AL 61,07
39 MC 60,84
40 VE 59,77
41 PN 59,24
42 VI 58,46
43 IM 57,61
44 VR 57,50
45 GO 56,89
95 CT 17,69
96 AV 17,57
97 BN 16,78
98 TP 16,06
99 SA 15,96
100 VV 15,23
101 KR 13,19
102 CE 8,90
103 NA 0,00
Grad Prov Punti
Il confronto fra le graduatorie
GRAD
ACP Prov
1 FE
2 RN
3 MO
4 MN
5 RE
6 RA
7 BO
8 MS
9 SO
10 LU
GRAD
SOLE Prov
1 SO
2 FE
3 RN
4 BO
5 RE
6 MO
7 MN
8 RA
9 VB
10 PR
Il confronto fra le graduatorie
GRAD
ACP Prov
35 PV
36 BZ
37 BS
38 AL
39 MC
40 VE
41 PN
42 VI
43 IM
44 VR
45 GO
GRAD
SOLE Prov
35 MC
36 SV
37 UD
38 CR
39 IS
40 RO
41 PO
42 VE
43 AO
44 TV
45 TE
Il confronto fra le graduatorie
GRAD
ACP Prov
90 BR
91 FG
92 NU
93 CZ
94 EN
95 CT
96 AV
97 BN
98 TP
99 SA
100 VV
101 KR
102 CE
103 NA
GRAD
SOLE Prov
90 EN
91 RI
92 CS
93 CE
94 FG
95 FR
96 SA
97 SR
98 NU
99 CL
100 PA
101 AG
102 RC
103 VV