3. Materiale e Metodi
3.2 Protocolli utilizzati
3.2.8 Microarrays
ristiche degli arrays
orniti dal gruppo Unilever Research di
progetto sono stati utilizzati arrays di capacità
3.2.8.1 Caratte
Tutti gli arrays utilizzati sono stati f
Bedford (UK) con il quale è stata avviata una collaborazione a partire dal 2003
nell’ambito del Progetto Europeo T-CIA (T cell Immunity and Ageing). Gli
arrays contengono una vasta gamma di oligonucleotidi selezionati per
specificità in grado di riconoscere selettivamente geni coinvolti in fenomeni
quali l’invecchiamento, l’infiammazione, lo stress ossidativo, il riparo del
DNA, la cancerogenesi, l’apoptosi e la regolazione del ciclo cellulare. Gli
oligonucleotidi sono stati “spottati” utilizzando un Biorobotics MicroGrid
Arrayer che utilizza una configurazione a 32-pin per imprimere una quantità
definita di materiale su vetro. Ogni oligonucleotide è replicato su ciascun array
per migliorare la potenza statistica della misura di ciascun gene. Inoltre,
all’interno di ciascun array è stato incluso un set di 10 oligonucleotidi di
controllo o standards (Stratagene) per testare la qualità dell’ibridazione, i
controlli negativi e quelli contenenti i buffers, nonché quelli di intensità
(oligonucleotidi premarcati con diffenti quantità del fluorocromo Cy3) per
definire i parametri di fissaggio iniziale. Le condizioni di spottaggio hanno
previsto condizioni di temperatura (20°C) e di umidità (45%) costanti e le
operazioni successive allo spotting hanno riguardato la marcatura dei campioni
e la loro ibridazione sulla superficie del vetrino secondo le istruzioni fornite dal
protocollo (Amersham).
Per ciascuna parte del
differente. Nel primo disegno sperimentale, volto alla valutazione della
variabilità individuale, gli arrays contenevano circa 6500 oligonucleotidi: il
numero limitato di geni è servito a mettere appunto la tecnica e ad ottimizzare
le varie fasi del procedimento al fine di procedere alla valutazione
dell’espressione genica in relazione all’età mediante l’utilizzo di arrays che
potessero riconoscere un numero più elevato di geni. Infatti, in questo disegno
sperimentale gli oligonucleotidi “spottati” sono stati circa 19,000. Nella terza
parte del progetto, ossia nel confronto dei livelli di espressione in gemelli MZ,
sono stati utilizzati vetrini a “whole genome” (Affimetrix) contenenti circa
50,000 oligonucleotidi.
3.2.8.2 Retrotrascrizione e marcatura del cDNA
La retrotrascrizione dell’RNA a cDNA e la marcatura sono state effettuate
utilizzando il Genisphere 3DNA labelling kit (Amersham) con l’eccezione che
6μg di RNA totale sono stati usati per ciascun canale di fluorescenza.
L’approccio, riassunto in figura 3, consiste nell’inserimento, durante la
retrotrascrizione, di primers dT modificati contenenti specifiche sequenze di
cattura all’estremità 5’in grado di legare o il fluorocromo Cy3 o il fluorocromo
Cy5. Questa procedura risulta in un processo di ibridazione a due step: quella
iniziale del cDNA agli oligonucleotidi spottati sul vetrino, seguita da una
seconda ibridazione dei dendrimeri (molecole contenenti una quantità definita
di fluorocromo di Cy3 o Cy5) alle sequenze di cattura specifiche.
Figura 3. Metodo utilizzato per la marcatura (dendrimeri) e l’ibridazione del cDNA (target) su
vetro. Ciascun campione è stato confrontato con un pool di cDNA di riferimento (Stratagene).
In alcuni casi, ove la quantità di RNA lo consentiva, è stato possibile eseguire
il dye-swap, ossia l’inversione di marcatura tra il cDNA target e quello di
riferimento (pool di cDNA, Stratagene). Tale condizione consente di verificare,
mediante la sovrapposizione delle due immagini, l’assenza di errori causati
dalla diversa incorporazione dei fluorocromi, in questo caso Cy3 e Cy5.
3.2.8.3 Ibridazione della sonda sul vetrino
L’ibridazione su vetro è stata ottimizzata utilizzando il protocollo della Lucidea
SlidePro hybrisation (Amersham) che prevede la combinazione dei campioni
da ibridare in una soluzione contenente formamide e destrano-solfato al 4%
(peso/volume). Brevemente, la fase di ibridazione iniziale del cDNA su vetro è
stata eseguita per 17h a 42°C in leggera agitazione, dopodichè è seguita una
fase di lavaggio e una di asciugatura. La seconda fase di ibridazione (marcatura
con dendrimeri) ha impiegato 4h a 50°C in leggera agitazione e riducendo la
concentrazione del destrano-solfato al 2.5% (peso/volume).
I microarrays completati sono stati conservati al buio prima dello scanning.
3.2.8.4 Cattura dei dati ed elaborazione
La scansione dei vetrini è stata eseguita mediante l’utilizzo dello scanner GSI
Luminomics 4000XL secondo le indicazioni del software (Scanarray versione
3.0). I due canali di fluorescenza, Cy3 (546) e Cy5 (646), sono stati analizzati
separatamente utilizzando una potenza laser e parametri di settaggio ottimizzati
in modo da ottenere un rapporto segnale:rumore elevato e valori finali di
fluorescenza bilanciati. Le immagini per ciascun canale sono state memorizzate
in formato Tiff e successivamente comparate (Silicon Genetics).
3.2.8.5 Normalizzazione dei dati e Analisi Statistica
Una prima analisi è stata effettuata utilizzando il software GeneSpring: dalla
sovrapposizione delle immagini sono stati estratti i dati di fluorescenza, gli
spots di controllo sono stati rimossi ed è stata applicata una prima
normalizzazione dei dati utilizzando la funzione Loess. La procedura è stata
eseguita due volte ove presente il dye-swap, in modo da eliminare un eventuale
errore dovuto ai canali presenti in GeneSpring. E’ stata quindi estratta una lista
di geni da cui sono stati esclusi i controlli, i geni privi di dye-swap valido,
quelli con intensità di fluorescenza bassa e quelli di scarsa qualità. Su questi
geni selezionati è stata condotta l’analisi statistica comparando i livelli di
espressione genica tra soggetti diversi o tra tempi diversi dello stesso soggetto
in base al disegno sperimentale. L'analisi statistica dei risultati è stata effettuata
sia dall’Unilever Research (Colworth, UK) sia in collaborazione con il Prof.
Gastone Castellani, il Dr. Daniel Remondini e il Dr. Mirko Francesconi del
Centro Interdipartmentale "L.Galvani" (C.I.G.) dell’Università di Bologna.
In dettaglio, l’analisi statistica nella prima parte (dataset over-time) del disegno
sperimentale ha previsto:
- l’applicazione dell’analisi dei Componenti Principali (o PCA, Principle
Component Analysis) per l’analisi della variabilità dell’espressione genica
nel tempo. Tale metodo consente di definire quali sono gli andamenti
principali dei livelli di espressione nel tempo, la percentuale dei geni
(rispetto al totale) che segue un determinato andamento e la lista dei geni
associata a ciascuna componente;
- l’applicazione del software Ingenuity (Ingenuity Systems,
www.ingenuity.com) per l’analisi dei pathways di quei geni che oscillano
maggiormente nel tempo (estratti con il metodo PCA);
- L’applicazione della statistica F e il calcolo del ratio della varianza per
l’identificazione dei geni con la maggiore variabilità tra gli individui.
Tale metodo si basa sulla divisione della varianza dei livelli di espressione
tra gli individui per la varianza all'interno dei singoli individui (rif. Cheung
et al., Nature Genetics, 2003). Successivamente, i risultati emersi sono stati
confrontati con quelli ottenuti dall'applicazione del test ANOVA al fine di
confermare la prima analisi.
L’analisi statistica nella seconda parte del disegno sperimentale (dataset time-
series) ha previsto:
- l’applicazione del software Genespring (Unilever) per comparare
l’espressione genica tra la classe di giovane e quella dei soggetti di età più
avanzata;
- la Complex Network Analysis (Università di Bologna) in grado di
investigare gli andamenti in set di dati che comprendono vari punti
temporali di una variabile. Tale metodo è stato utilizzato per definire
l’effetto dell’età sui livelli di espressione genica nell’intera durata di vita;
essa comprende:
o
il cluster gerarchico per la visualizzazione dei profili di
espressione;
o
l’analisi PCA (Principle Component Analysis) per la
classificazione dei livelli di espressione in gruppi che mostrano una
similarità nell’andamento con l’avanzare dell’età;
o
il
database KEGG per l’analisi dei pathways
(www.genome.jp/kegg);
o
il metodo SVD (Singular Value Decomposition) per
l’individuazione dei “modelli di andamento” principali applicata ai
livelli di espressione genica;
o
i databases Toucan e Jaspar per l’analisi dei fattori di
trascrizione di geni che condividono lo stesso andamento.
L’analisi dei dati nella terza ed ultima parte del disegno sperimentale (dataset
dei gemelli MZ) ha previsto:
- l’applicazione del metodo della correlazione per definire l’eventuale
divergenza dei profili di espressione dei due membri della coppia in
relazione all’avanzare dell’età (Tan et al., 2005);
- l’analisi PCA (Principle Component Analysis) per la classificazione dei
livelli di espressione in gruppi che mostrano una similarità nell’andamento
con l’avanzare dell’età;
- il metodo SVD (Singular Value Decomposition) per l’individuazione dei
“modelli di andamento” principali applicata ai livelli di espressione genica.
Nel documento
Studi di espressione genica in linfociti T di soggetti di diversa età
(pagine 48-52)