• Non ci sono risultati.

Si può procedere dunque con l'analisi vera e propria.

Le componenti principali vengono trovate grazie alla funzione “princomp”, applicata all'oggetto “agricoltura” e con parametro cor=TRUE. Quest'ultimo indica che le componenti vengono calcolate basandosi sulla matrice di correlazione dei dati.

Il risultato della chiamata “princomp(agricoltura,cor=TRUE)” viene assegnato all'oggetto “pc” (vedi illustrazione 59).

A questo punto è necessario valutare quante componenti principali considerare nello studio. Per far ciò si sfruttano gli screeplot delle componenti principali e le proporzioni di varianza associate a queste ultime.

Dagli screeplot dell'oggetto “pc” (illustrazione 60), si nota un lieve cambiamento di pendenza in corrispondenza della seconda componente principale e uno molto più accentuato in corrispondenza della quinta. A questo punto è necessario considerare anche le proporzioni di varianza spiegata (visualizzabili grazie a “summary(pc)” prima di prendere una decisione. Si nota che alle prime due componenti principali corrisponde una proporzione di varianza cumulata di 0.47 (quindi il 47% della varianza viene spiegato dalle prime due cp), un valore relativamente basso rispetto alle aspettative. Si decide perciò di considerare le prime tre componenti principali (60% circa della varianza).

A questo punto è possibile procedere con l'interpretazione delle nuove variabili ottenute e ritenute rilevanti per l'analisi. Per far ciò, si osservano i coefficienti applicati a ciascuna variabile per ogni componente principale, attraverso la chiamata “pc$loadings” (vedi illustrazione 61).

La prima componente principale risulta essere influenzata da tutte le variabili originarie a parte “SAUmedia”, “azaltraconduz”, “azcoltivlegn” e “vendita”. I coefficienti di “azcondiretta”, “azpratiepascoli”, “altreattiv” e “azorti” sono positivi, mentre quelli di “SAU”, “SAT”, “azsalariati”, “azsemin” e “pagamdir” sono negativi, perciò questi due gruppi di variabili sono messi in contrasto. La seconda componente principale risulta essere influenzata da tutte le variabili originarie a parte “azorti” e “pagamdir”. I coefficienti positivi più rilevanti sono quelli corrispondenti a “azcondiretta”, “azcoltivlegn” e “vendita”. Questi sono messi in contrasto soprattutto con quelli relativi a “SAUmedia”, “SAT”, “azaltraconduz”, “azpratiepascoli” e “altreattiv” (coefficienti negativi).

Osservando ancora i “loadings”, si nota che la terza componente principale non è influenzata da “azorti”, “azpratiepascoli”, “vendita” e “altreattiv” (coefficienti nulli). Le variabili con coefficienti positivi più influenti sono “SAU”, “SAT” e “azcondiretta”, mentre quelle con coefficienti negativi più elevati in modulo sono “azsalariati” e “azaltraconduz”.

A questo punto è possibile concentrare l'attenzione sui valori delle nuove variabili per Bassano del Grappa e trarre ulteriori considerazioni sulle variabili originarie, grazie alla rappresentazione grafica degli scores delle prime due componenti tramite il biplot. Per questa analisi grafica non è stata utilizzata la chiamata “biplot(pc)”, ma bensì la funzione “PCbiplot”, con gli opportuni parametri impostati.

Per quanto riguarda Bassano del Grappa (vedi illustrazione 62), si nota che:

• “SAUmedia” e “vendita” hanno valori distintamente sotto la media e inferiori ai rispettivi primi quartile;

• “azaltraconduz” assume un valore distintamente sotto la media, ma compresi tra i rispettivi primi quartili e mediane;

• “azsemin” è lievemente inferiore alla media e compreso tra il primo quartile e la mediana; • “azsalariati” e “altreattiv” sono lievemente sotto la media, ma compresi tra le rispettive

mediane e terzi quartili;

• “azorti” è lievemente sopra la media e di poco superiore alla mediana;

• “azcondiretta” ha valore distintamente sopra la media, ma compreso tra il primo quartile e la mediana;

• “azpratiepascoli” e “pagamdir” hanno valori distintamente sopra la media e compresi tra le rispettive mediane e i terzi quartili;

• “SAU” e“SAT” hanno valori distintamente sopra la media e praticamente coincidenti con i relativi terzi quartili;

• “azcoltivlegn” assume valore particolarmente elevato e superiore al terzo quartile.

Osservando gli scores di Bassano, ovvero i valori assunti dalle nuove variabili create, di Bassano del Grappa, si nota infatti che (confrontando con i risultati di “summary(pc$scores)”, vedi

Illustrazione 62: Focus su Bassano del Grappa, dati e scores e creazione PCbiplot.

illustrazione 63):

• la prima componente principale è di poco inferiore allo zero (-0.07 circa) e alla mediana; • la seconda componente è di 0.62 circa, dunque superiore alla media e compresa tra la

mediana e il terzo quartile;

• la terza è di 0.61 circa, dunque superiore alla media e al terzo quartile.

Ne deriva che gli scores che distinguono maggiormente Bassano, sono quelli relativi alla terza componente principale. Questo è dovuto ai valori particolarmente elevati di “SAU” e “SAT”, a cui corrispondono coefficienti positivi alti.

Si costruisce dunque il biplot (vedi illustrazione 64) con le caratteristiche sopra citate, che rappresenta le prime due componenti principali (la prima lungo l'asse x e la seconda lungo l'asse y). Si ottengono così i seguenti risultati relativi alle prime due componenti principali:

• la prima componente principale è fortemente correlata soprattutto con “azorti” (correlazione positiva) e “pagamdir” (correlazione negativa). D'altro canto la correlazione è praticamente nulla con “azcoltivlegn”, “vendita”, “azaltraconduz” e “SAUmedia”;

• la seconda componente principale ha correlazione forte con “azcoltivlegn”, “vendita” (positiva), “azaltraconduz” e “SAUmedia” (negativa). D'altro canto è praticamente nulla con “azorti” e “pagamdir”.

Lo studio dei biplot permette però anche di valutare l'interazione iniziale tra le variabili originarie. Grazie a questa proprietà, si vede che le correlazioni positive più forti sono quelle esistenti tra :

– “azsalariati” e “SAUmedia”; – tra “SAU” e “azsalariati”;

– tra “altreattiv” e “azpratiepascoli”.

Valutando invece le variabili che hanno correlazione negativa particolarmente alta in modulo, emergono:

– “azorti” con “pagamdir”;

– “azcoltivlegn” con “azaltraconduz” e “SAUmedia”; – “azcondiretta” con “SAU”, “SAT” e “azsalariati”; – “azpratiepascoli” e “altreattiv” con “azsemin”.

Si notano infine alcuni comuni con valori anomali per una delle nuove variabili considerate:

– l'unità 116, ovvero Vicenza, con score della prima componente principale molto sotto la media;

– l'unità 114, ovvero Valstagna, con valore particolarmente elevato per la seconda componente;

– l'unità 32, ovvero Cismon del Grappa, con score particolarmente basso per la seconda componente;

– l'unità 50, ovvero Laghi, con valore particolarmente basso per la prima componente principale;

– l'unità 77, ovvero Pedemonte, con score particolarmente elevato per la prima componente. All'interno di questo grafico infine, da notare è che Bassano (rappresentato dal numero 13) si trova nel secondo quadrante, vicino all'asse corrispondente a “Comp. 1”=0.