• Non ci sono risultati.

Esercizio Lezione 22

N/A
N/A
Protected

Academic year: 2021

Condividi "Esercizio Lezione 22"

Copied!
2
0
0

Testo completo

(1)

Esercizio Lezione 22

Esaminiamo i seguenti dati raccolti dallo studente Giuseppe Matisi, relativi alle variabili TD = tasso di disoccupazione, RD = Research & Developement,PE = Spesa nella pubblica istruzione (rispetto al PIL), HC = Health Care.

naz TD RD PE HC

Belg 6,6 0,41 5,93 9,99

Bulg 6,0 0,05 4,51 7,09

Czec 5,9 0,23 4,26 6,96

Denm 5,1 0,6 8,30 9,60

Ger 7,3 0,41 4,53 10,54

Est 12,3 0,39 4,88 5,08

Spa 16,0 0,33 4,23 8,36

Fra 7,5 0,4 5,65 11,03

Latvia 15,3 0,23 5,06 6,76

Lit 12,2 0,41 4,90 6,23

Lux 4,1 0,02 3,78 7,62

Hunga 8,8 0,24 5,47 8,09

Nether 2,8 0,54 5,48 9,72

Aust 4,0 0,61 5,48 10,26

Pol 6,8 0,18 5,47 6,20

Port 9,0 0,29 5,39 9,63

Roma 5,7 0,06 3,48 5,10

Sloven 5,2 0,24 5,67 8,23

Slovak 10,5 0,1 3,85 7,34

Fin 6,5 0,66 6,31 8,39

Sweden 6,0 0,79 6,97 8,93

Norw 2,2 0,47 7,02 8,65

M<-read.table("clipboard",dec=',',header=T,row.names=1); cor(M); plot(M) TD RD PE HC

TD 1.0000000 -0.1862693 -0.3357380 -0.3429866 RD -0.1862693 1.0000000 0.7414334 0.5306108 PE -0.3357380 0.7414334 1.0000000 0.4662142 HC -0.3429866 0.5306108 0.4662142 1.0000000

TD

0.0 0.2 0.4 0.6 0.8 5 6 7 8 9 10 11

24681014

0.00.20.40.60.8

RD

PE

45678

2 4 6 8 10 12 14 16

567891011

4 5 6 7 8

HC

(2)

Standardizziamo i dati su R. Ms<-M; for (i in 1:4) { Ms[,i]<-( M[,i]-mean(M[,i]))/sd(M[,i]) } PCA <- princomp(Ms); biplot(PCA)

Il risultato è molto interessante. Un utile esercizio potrebbe essere quello di mettere insieme questi indicatori con altri ancora trovati in altri momenti. Con summary(PCA) si legge:

Cumulative Proportion 0.5871166 0.8036344 0.9427123 1.00000000 Eseguire anche plot(PCA).

Se interpretiamo l’asse orizzontale come una variabile del tipo: “spese per il bene pubblico”, possiamo chiederci la classifica. Chiediamo: PCA$loadings

Loadings:

Comp.1 Comp.2 Comp.3 Comp.4

TD 0.345 0.884 0.247 -0.194

RD -0.556 0.413 -0.147 0.706

PE -0.565 0.203 -0.454 -0.658

HC -0.502 0.844 -0.174

Queste sono le componenti di una base rispetto all’altra. Proviamo:

0.345^2+0.884^2+0.247^2+0.194^2 = 0.999126 0.345^2+0.556^2+0.565^2+0.502^2 = 0.99939

E così via. L’ampiezza (e segno) dei numeri danno indicazione del legame. Es: TD è rappresentato più che altro da Comp.2; Comp.1 cattura soprattutto RD, PE, HC (in egual misura), un po’ meno TD; e così via. Tutte cose del resto chiare dal disegno. Non visibili nel disegno sono i ruoli di Comp.3 e Comp. 4.

La classifica è data dalle proiezioni delle nazioni su Comp.1, cambiate di segno perché, come si vede dai loadings e dal disegno, Comp.1 è orientata nel verso opposto al significato intuitivo di “ampia spesa”. La proiezione di un vettore su uno normalizzato è il prodotto scalare dei due. Il vettore Comp.1 ha componenti (nella base canonica) 0.345, -0.556 ecc. mentre le componenti delle nazioni (nella base canonica) sono i numeri della tabella (standardizzata). Pertanto, ad esempio, i punteggi di Belg e Bulg sono:

-sum(Ms[1,]* PCA$loadings[,1]) = 1.093552.

-sum(Ms[2,]* PCA$loadings[,1]) = -1.355473 Possiamo introdurre un vettore punteggio, P, P <- 1:nrow(Ms) e riempirlo con

for (i in 1:nrow(Ms)) { P[i] <- -sum(Ms[i,]* PCA$loadings[,1]) }

Così si perdono i nomi delle nazioni. Un trucco per leggere i punteggi a fianco delle nazioni è P<-Ms; for (i in 1:nrow(Ms)) { P[i,1] <- -sum(Ms[i,]* PCA$loadings[,1]) }; P

ed ora nella prima Colonna ci sono I punteggi. Cercare un metodo migliore.

Riferimenti

Documenti correlati

- la Banca d’Italia, quale gestore di BI-COMP, resta estranea ai rapporti intercorrenti tra il gestore del sistema di clearing e il gestore del sistema

Questi valori sono indicativi e possono variare secondo le condizioni clima- tiche, in particolare la temperatura e l’umidità relativa dell’aria.. VALORI

Articolo 13 Ordinanza sulla protezione della maternità (RS 822.111.52): Le donne incinte e le madri allattanti possono venire a contatto con questo prodotto (questa sostanza /

Ne deriva un aumento notevole della carica tossica interna del soggetto sottoposto ad esposizione., National Institute for Occupational Safety and Health, Institut National

OMBRELLONE MODELLO SHADOW Struttura in alluminio 8 stecche collano in nylon con appendiabiti chiusura a scorrimento antinfortunistica tessuto

Informazione generale : Non sono richieste particolari misure precauzionali per la sal- vaguardia dell'ambiente. SEZIONE 9: Proprietà fisiche e chimiche. 9.1 Informazioni

Valutazione : La sostanza/miscela non contiene componenti considerati aventi proprietà di interferenza endocrina ai sensi dell'articolo 57(f) del REACH o del regolamento

2 Le dimensioni sono espresse in cm – consultare il listino prezzi per le caratteristiche tecniche, i codici degli articoli e delle finiture ⁄ Dimensions are stated in cm –