L’analisi dell’espressione genica è stata effettuata tramite l’utilizzo di
microarrays in collaborazione con la piattaforma Affymetrix dell’Università
di Colonia, Germania (Balmer et al. 2012, Krug et al. 2013). I microarrays sfruttano una tecnica di ibridazione inversa, tra oligonucleotidi sintetici (detti probes) fissati su un supporto, e gli acidi nucleici marcati in esame (detti target) (Fig. 9.16). 100 ng di RNA, estratto secondo la metodica descritta sopra, è stato convertito in cDNA: il primo filamento è stato sintetizzato utilizzando un oligo-dT primer, con una sequenza T7 promoter, poi il secondo filamento, secondo complementarietà delle basi, grazie ad
104
una transcrittasi inversa. Il cDNA a doppio filamento ottenuto, è stato utilizzato per una trascrizione secondo, l’IVT, standard Affymetrix
procedure, utilizzando il Genechip 30 IVT Express Kit. In questo modo, è
stato sintetizzato l’aRNA (RNA amplificato o cRNA), in cui è stato incorporato un nucleotide biotinilato come marcatore. L’aRNA è stato poi frammentato con sfere magnetiche, in buffer di frammentazione seguendo le istruzioni del fornitore. 12.5 g di aRNA frammentato è stato così ibridizzato con gli Affymetrix microarrays. I chips sono stati posti in un incubatore per l’ibridazione (GeneChip Hybridization Oven-645) per 16 ore, a 60 rpm e a 45 °C. Per la colorazione e il lavaggio sono stati utilizzati
AffymetrixHWS kits su una Genechip Fluidics Station-450. Gli Affymetrix microarrays sono stati successivamente analizzati tramite lettura con scanner (Affymetrix Gene-Chip Scanner-3000-7G), per rilevare le intensità e
le posizioni dei segnali, e una valutazione della qualità delle immagini ottenute, è stata effettuata con Affymetrix GCOS software.
Da queste procedure sono stati ottenuti dei CEL files, che sono stati utilizzati per le analisi statistiche dei dati.
Tutti gli strumenti e reagenti utilizzati in questa fase sono stati forniti da
105
Figura 9.16. Rappresentazione schematica dello studio dell’espressione genica
106
9.19 ESPRESSIONE DEI RISULTATI ED ANALISI STATISTICA
Dai risultati dello studio della citotossicità è stata calcolata, tramite un’analisi di regressione, il valore di EC20 per ogni phytochemical utilizzato.
I risultati del saggio dei TBARS sono espressi come la media di 3 esperimenti ± deviazione standard, e la differenza rispetto al campione di controllo è stata analizzata tramite il t-test, in cui risultano significative le differenze per cui p < 5 % o <1 % cioè la probabilità di evenienza casuale è minore del 5% o 1%.
I risultati ottenuti dall’analisi dei microarrays sono stati analizzati in collaborazione con il Dipartimento di Statistica dell’Università di Dortmund, (Germania). Un moderated t-test R-package (Limma) è stato effettuato per valutare le differenze significative relative all’espressione genica tra i campioni esposti alle molecole in studio e i rispettivi controlli, in cui risultano significative le differenze per cui p < 5 % cioè la probabilità di evenienza casuale è minore del 5 %.
9.19.1 ANALISI DELLE COMPONENTI PRINCIPALI
L’analisi delle componenti principali (PCA) è una tecnica per la semplificazione dei dati, con lo scopo principale di ridurre un numero elevato di variabili (rappresentative del fenomeno analizzato) in alcune principali variabili latenti. Ciò avviene tramite una trasformazione lineare delle variabili che proietta quelle originarie in un nuovo sistema cartesiano, in cui la variabile con maggiore varianza viene proiettata sul primo asse e la seconda sul secondo asse. Questa riduzione della “complessità” avviene riducendo la dimensione dello spazio di rappresentazione, tramite l’individuazione di opportune trasformazioni lineari delle variabili osservate e capaci di evidenziare e sintetizzare l’informazione insita nella matrice iniziale.
107
In questo studio la PCA è stata utilizzata per visualizzare i dati di espressione genica in due dimensioni, che rappresentano le prime due componenti principali, cioè le due direzioni, perpendicolari tra loro, che rappresentano la maggior varianza dei dati. Per questa analisi è stato utilizzato il software R-version 2.15.1, che ha permesso di calcolare e di ottenere, una rappresentazione grafica del pattern complessivo di espressione genica, ottenuto tramite l’analisi dei microarrays, per ogni condizione sperimentale studiata. Per diminuire la variabilità sperimentale non biologica (batch effect), al valore di ogni campione è stato sottratto il valore del rispettivo controllo. In questo modo il batch effect può essere corretto e/o diminuito rendendo così confrontabili e raggruppabili differenti
set di dati (Krug et al. 2013).
9.19.2 HEATMAP
Per una visualizzazione più specifica del grado di espressione genica, è stata elaborata una heatmap, basata sui 100 geni più significativi modulati dalle molecole in studio, con i più bassi valori di FDR - valore di p corretto, secondo il Limma t test. In questo tipo di rappresentazione, effettuata tramite il software R-version 2.15.1, viene visualizzato il grado di espressione genica con una scala di colori (dal giallo al rosso), e viene creata una struttura gerarchica di raggruppamento, chiamata dendrogramma, basata sulla correlazione di Pearson, che fornisce informazioni qualitative sul grado di somiglianza riguardante il pattern di espressione genica (Krug
et al. 2013).
9.19.3 ANALISI DELL’ONTOLOGIA GENICA
Per ottenere informazioni relative ai principali processi biologici influenzati dalle molecole utilizzate, i geni modulati significativamente, sono stati sottoposti ad un’analisi ontologica genica, gene ontology (GO) analysis, col fine di suddividerli in categorie funzionali. A tal proposito, il progetto GO
108
fornisce un’ontologia di termini ben definiti per la descrizione di prodotti genici in termini di funzione molecolare, di ruolo biologico e di ubicazione cellulare (Kammers et al. 2011).
I geni sono stati quindi suddivisi in gruppi in base ai processi biologici in cui sono coinvolti, ed ordinati in tabelle secondo il contenuto di geni significativamente modulati.
9.19.4 DIAGRAMMI DI VENN
Per confrontare ed identificare il grado di sovrapposizione in termini di espressione genica, tra i vari composti studiati, sono stati “costruiti” dei diagrammi di Venn (Chow et al. 2005). Questi diagrammi mostrano il numero di geni alterati dall’esposizione ad ogni molecola, in base all’entità della modulazione (fold change) e a diversi gradi di restrizione (valori di p) applicata. Le zone di sovrapposizione identificano il numero di geni che vengono alterati in comune con l’esposizione al BaP, o tra i vari
phytochemicals utilizzati.
I geni in comune modulati dai composti in studio e dal BaP, almeno di 4 volte rispetto ai controlli e con p<0.001 sono stati identificati singolarmente.
109