• Non ci sono risultati.

Appendice B Le tecniche chemometriche

B.2. Principal Component Analysis (PCA)

PCA è una tecnica che, riducendo la dimensione dei dati, permette la loro visualizzazione, pur mantenendo quanto più possibile le informazioni presenti nei dati originali. Così, la PCA trasforma le variabili originali misurate in nuove variabili non correlate, denominate componenti principali (PC). Ciascuna PC è una combinazione lineare delle variabili originali. Questa tecnica permette una visualizzazione grafica

tramite un gruppo di assi ortogonali che rappresentano le direzioni nei dati

La prima PC (PC1) spiega la maggiore percentuale (PC2) è correlata con la prima e

così via, fino a che non sia spiegata

In una PCA classica la matrice dei dati originale è modificata da prima da un pre trttamento (centraggio o autoscaling), al fine di assicurare che la PC1 descriva la direzione corretta della varianza massima. Dopo il pre

dimensione “m x n”, con

oggetti, e decomposta per ottenere una nuova matrice degli scores di dimensioni “

a”, con a il numero delle PC, e una matrice dei loadings di dimensioni “

modo la matrice originale delle variabili, ottenuta per gli

ad m dimensioni, che definisce la posizione di ciascun campione.

Fig. B.1. Grafico rappresentativo di

182

gruppo di assi ortogonali che rappresentano le direzioni di varianza maggiore

spiega la maggiore percentuale della varianza totale, la seconda (PC2) è correlata con la prima e spiega la percentuale maggiore della varianza residua, e

a che non sia spiegata la varianza totale.

In una PCA classica la matrice dei dati originale è modificata da prima da un pre trttamento (centraggio o autoscaling), al fine di assicurare che la PC1 descriva la direzione corretta della varianza massima. Dopo il pre-trattamento la matrice dei dat

”, con m il numero delle variabili misurate e n

oggetti, e decomposta per ottenere una nuova matrice degli scores di dimensioni “ ”, con a il numero delle PC, e una matrice dei loadings di dimensioni “

modo la matrice originale delle variabili, ottenuta per gli n campioni, genera uno spazio dimensioni, che definisce la posizione di ciascun campione.

.1. Grafico rappresentativo di una Principal Component Analysis (PCA);

varianza maggiore

della varianza totale, la seconda della varianza residua, e

In una PCA classica la matrice dei dati originale è modificata da prima da un pre- trttamento (centraggio o autoscaling), al fine di assicurare che la PC1 descriva la

trattamento la matrice dei dati di il numero degli oggetti, e decomposta per ottenere una nuova matrice degli scores di dimensioni “m x ”, con a il numero delle PC, e una matrice dei loadings di dimensioni “a x n”. In questo campioni, genera uno spazio

La grande riduzione di questo spazio da

posizionamento degli oggetti nello nuovo spazio ortogonale rappresentato dalla matrice degli scores, e quindi. L’orientamento delle nuove assi rispetto alle coordinate originali definisce la matrice dei loadings, che è una matrice “

totale dei dati man mano che si aumenta il numero delle PC considerate.

AII.3. Cluster Analysis (CA)

La riduzione delle dimensioni dello spazio in piani e volume (2D

più agevole interpretazione delle relazioni tra campioni e tra di essi e le variabili esaminate, oltre a permettere l’identificazione di raggruppamenti differenti dei campioni.CA o clustering è una tecnica unsupervised che

insieme di oggetti a determinati gruppi (chiamati cluster) in modo che gli oggetti nello stesso cluster siano più simili tra loro rispetto a quelli di altri raggruppamenti. Il suo procedimento implica l’uso del concetto di di

campioni misurate sperimentalmente.

Fig. B.2. Grafico rappresentativo di

183

La grande riduzione di questo spazio da m a un numero di PC a, genera un nuovo posizionamento degli oggetti nello nuovo spazio ortogonale rappresentato dalla matrice degli scores, e quindi. L’orientamento delle nuove assi rispetto alle coordinate originali definisce la matrice dei loadings, che è una matrice “a x m”, che spiega la varianza totale dei dati man mano che si aumenta il numero delle PC considerate.

AII.3. Cluster Analysis (CA)

La riduzione delle dimensioni dello spazio in piani e volume (2D e 3D) permette una più agevole interpretazione delle relazioni tra campioni e tra di essi e le variabili esaminate, oltre a permettere l’identificazione di raggruppamenti differenti dei CA o clustering è una tecnica unsupervised che ha la capacità di assegnare un insieme di oggetti a determinati gruppi (chiamati cluster) in modo che gli oggetti nello stesso cluster siano più simili tra loro rispetto a quelli di altri raggruppamenti. Il suo procedimento implica l’uso del concetto di distanza calcolta dale varie proprieta dei campioni misurate sperimentalmente.

. Grafico rappresentativo di una Cluster Analysis (CA).

, genera un nuovo posizionamento degli oggetti nello nuovo spazio ortogonale rappresentato dalla matrice degli scores, e quindi. L’orientamento delle nuove assi rispetto alle coordinate originali ”, che spiega la varianza totale dei dati man mano che si aumenta il numero delle PC considerate.

e 3D) permette una più agevole interpretazione delle relazioni tra campioni e tra di essi e le variabili esaminate, oltre a permettere l’identificazione di raggruppamenti differenti dei ha la capacità di assegnare un insieme di oggetti a determinati gruppi (chiamati cluster) in modo che gli oggetti nello stesso cluster siano più simili tra loro rispetto a quelli di altri raggruppamenti. Il suo stanza calcolta dale varie proprieta dei

184

Il calcolo della distanza tra i campioni può essere valutata con diversi metodi (il più commune è il calcolo della distanza Euclidea) e i gruppi che si vengono a creare possono essere visualizzati graficamente in un dendrogramma con l’indicazione della distanza tra i campioni attrverso una scala normalizzata.In questo modo, noi classifichiamo i campioni al fine di avere una discriminazione efficace. Solitamente CA rappresenta uno step preliminare.