• Non ci sono risultati.

PARTE II: Autenticazione d'origine

II.2 Stato dell'arte in merito all'autenticazione degli alimenti ittici

II.2.5 analisi multivariata

Con Bo Jørgensen, potremmo affermare che la Natura è preda della covarianza (Jørgensen, 2009): davvero esistono ben poche entità o funzioni che possano essere tenute per “indipendenti”. Giusto come esempio, il nostro, cui peraltro ci siamo ispirati largamente per la stesura di questo paragrafo, ricorda che il riconoscimento di quale famiglia, specie o stock siano quelli di appartenenza di un dato esemplare di pesce si basa su ben più di un singolo attributo. Di conseguenza, la maggior parte delle attività di ricerca, come pure un imponente numero di casi di attività di supervisione routinaria, presuppone che lo/a scienziato/a (o il tecnico, per lui/lei) si ritrovi in mano parecchie, differenti, rilevazioni, tutte effettuate su di una stessa “entità”. Il susseguente assemblaggio di tutte queste informazioni allo scopo di estrarne di più rilevanti grazie all’analisi multivariata dei dati (a seguire MDA) è un passo di grande rilievo e peraltro ormai imperativo ai fini della “Quality prediction” tramite rilevazioni

on-line, oppure in-line (Bro et al., 2002).

Col termine MDA ci si riferisce ad un’ampia gamma di metodi matematici che trattano simultaneamente numerose misure prese su di uno stesso campione, alcuni dei quali metodi sono “generici”, mentre altri rispondono a problemi conoscitivi molto specifici. Fra i primi rientrano i modelli multilineari che, oltre ad essere adattabili a svariati contesti, offrono l’indubbio vantaggio di essere comprensibili ai “laici”, se così ci è permesso definire chi si occupa, nello specifico, di qualità degli alimenti senza essere né uno statistico, né, tantomeno, un matematico (Jørgensen, 2009).

La MDA mira a trarre vantaggio dal fatto che entro un pool di rilevazioni sussiste correlazione e lo fa sostituendo i singoli valori con veri e propri pattern di misure. A questo punto, un qualsivoglia campione sarà caratterizzato da una certa quantità di ciascun membro di quello che di solito è un piccolo set di tali pattern. Sempre a questo punto, la differenza esistente fra i campioni sarà espressa da una differenza nelle “quantità” sopra menzionate. Così operando, i

pattern fungono da caratteristiche fondamentali e quelle “quantità” finiscono per chiudere in

sé un più alto livello di variabilità. Diventa pertanto possibile considerarli come attributi “generali” sui quali, per esempio, è possibile basare valutazioni di qualità o autenticità (Jørgensen, 2009).

Più in dettaglio, quando si usa il tipo di MDA denominato “modellizzazione multilineare” (multi-linear modelling), i cosiddetti pattern prendono il nome di strutture latenti perché, inizialmente nascosti dietro le misure fisiche, possono venire alla luce come risultato dell’analisi dei dati. Le strutture latenti forniscono informazioni sulla correlazione che intercorre tra le grandezze misurate, cosa sovente degna di interesse almeno quanto i valori

assunti dalle grandezze stesse (Bro et al., 2002).

La modellizzazione multilineare (per la più parte bilineare, ma anche, frequentemente, trilineare e talvolta perfino di ordine superiore) si è rivelata essere un approccio generico, sì, ma dotato di grande efficienza. A tutta prima, questo può suonare sorprendente, perché non si può dubitare della non-linearità della natura dell’universo. Comunque, può accadere che i modelli lineari siano bastevoli alla bisogna, nel qual caso li si dovrebbe preferire, quantomeno per la loro relativa semplicità. Quanto sopra, ancora una volta, conduce ad un più elevato livello di interpretabilità, diversamente da quanto accade con i metodi non-lineari. Si considerino, per esempio, le reti neurali artificiali (Artificial Neural Networks, ANN), spesso utilizzate per calibrazioni basate su, per esempio, la spettroscopia NIR. Non v’è dubbio che le ANN favoriscono un migliore fit, ma questo accade a spese della trasparenza: eloquentemente, Jørgensen (2009) afferma che le ANN agiscono come “scatole nere”. In alternativa e sempre nel contesto multivariato, variabili non-lineari possono venire convenientemente introdotte nella modellizzazione lineare, per esempio aggiungendo alla matrice dei dati nuove colonne contenenti funzioni delle variabili, come l’elevazione al quadrato di una variabile (xi2) oppure il prodotto di due variabili (xixj).

Uno dei metodi bilineari più utili è l’analisi delle componenti principali (Principal

Component Analysis, PCA). Questo metodo risolve la matrice dei dati in strutture latenti

denominate “componenti principali”, la prima delle quali spiega la maggiore aliquota possibile della varianza totale del campione. I dati residui possono ancora segretamente obbedire ad una struttura non esplicitata, nella quale ipotesi la successiva componente principale dovrà catturare una frazione la più ampia possibile della varianza residua, sotto il vincolo che sia indipendente dall’altra/e componente/i principale/i. Questa decomposizione della matrice dei dati prosegue fintantoché i residui apparentemente non contengono altro che “rumore”. Poiché la aliquota più importante della variabilità tra campioni è spiegata dalle prime componenti principali e siccome con tutta probabilità è quella la variabilità più interessante, queste poche componenti principali spesso bastano a descrivere i risultati dell’esperimento in un modo facilmente interpretabile (Jørgensen, 2009).

Di tanto in tanto, accade che la variazione più importante fra i campioni non sia la più interessante, nel contesto in cui ci si muove. In questi casi, un altro metodo molto utile e ampiamente applicabile, la regressione PLS (che sta per Partial Least-Squares), può vantaggiosamente sostituire la PCA. L’acronimo PLS si focalizza sulla matematica, ma viene anche spiegato come “proiezione” sulle strutture latenti. Nella regressione PLS sono in gioco due blocchi di dati. Il secondo blocco viene usato come mezzo per ruotare la soluzione

bilineare dagli assi principali a nuovi assi, dove la variazione di nostro interesse si rende più evidente. Al di là del pregio di migliorare la interpretabilità dei risultati, questo metodo si è dimostrato davvero di successo nella calibrazione multivariata, dove una certa grandezza, per esempio il tenore in lipidi o quello in protidi del campione, viene determinato a partire da una misurazione strumentale rapida, come può essere uno spettro NIR (Jørgensen, 2009).

Considerando la possibilità di sfruttare la totalità di dati ottenuti dalle tecniche strumentali, l'analisi multivariata è stata applicata per fini autenticativi a svariati prodotti alimentari (Arvanitoyannis et al., 2005). Per esempio, unita alle tecniche GC, isotopica e spettrometrica è stata utile per discriminare metodo di produzione e provenienza di specie commerciali quali la spigola (Fasolato et al., 2010; Ottavian et al., 2012), l'orata (Morrison et al., 2007), il salmone (Thomas et al., 2008; Anderson et al., 2010), il pesce persico (Gonzalez et al., 2006) e molte altre ancora (Arvanitoyannis et al., 2005). Unita alla tecnica NMR è servita a discriminare specie diverse di gadoidi in base al loro profilo fosfolipidico (Standal et al., 2010), ad autenticare le specie e la zona d'origine di gadoidi da cui è stato estratto olio da vendere in capsule (Aursand et al., 2007; Standal et al., 2008, 2009, 2011), a discriminare in base al profilo acidico il metodo di produzione di esemplari di orata (Rezzi et al., 2007), ad identificare metaboliti attivi (come per esempio TMAO, TMA, DMA) in polpa di merluzzo (Martinez et al., 2005), a discriminare la zona d'origine di salmoni allevati (Martinez et al., 2009).

Dalla quantità di dati presenti nella letteratura recente, si evince che la MDA è uno step ormai obbligato lungo un iter di ricerca, soprattutto se si lavora con quantità rilevanti di campioni: utilizzata largamente in contesti universitari, industriali e governativi, l'avvento della MDA ha migliorato i metodi di controllo qualitativi ed ha reso più facile l'individuazioni di frodi alimentari (Arvanitoyannis et al., 2005).

Documenti correlati