• Non ci sono risultati.

3. Materiale e Metodi

3.2 Protocolli utilizzati

3.2.8 Microarrays

ristiche degli arrays

orniti dal gruppo Unilever Research di

progetto sono stati utilizzati arrays di capacità

3.2.8.1 Caratte

Tutti gli arrays utilizzati sono stati f

Bedford (UK) con il quale è stata avviata una collaborazione a partire dal 2003

nell’ambito del Progetto Europeo T-CIA (T cell Immunity and Ageing). Gli

arrays contengono una vasta gamma di oligonucleotidi selezionati per

specificità in grado di riconoscere selettivamente geni coinvolti in fenomeni

quali l’invecchiamento, l’infiammazione, lo stress ossidativo, il riparo del

DNA, la cancerogenesi, l’apoptosi e la regolazione del ciclo cellulare. Gli

oligonucleotidi sono stati “spottati” utilizzando un Biorobotics MicroGrid

Arrayer che utilizza una configurazione a 32-pin per imprimere una quantità

definita di materiale su vetro. Ogni oligonucleotide è replicato su ciascun array

per migliorare la potenza statistica della misura di ciascun gene. Inoltre,

all’interno di ciascun array è stato incluso un set di 10 oligonucleotidi di

controllo o standards (Stratagene) per testare la qualità dell’ibridazione, i

controlli negativi e quelli contenenti i buffers, nonché quelli di intensità

(oligonucleotidi premarcati con diffenti quantità del fluorocromo Cy3) per

definire i parametri di fissaggio iniziale. Le condizioni di spottaggio hanno

previsto condizioni di temperatura (20°C) e di umidità (45%) costanti e le

operazioni successive allo spotting hanno riguardato la marcatura dei campioni

e la loro ibridazione sulla superficie del vetrino secondo le istruzioni fornite dal

protocollo (Amersham).

Per ciascuna parte del

differente. Nel primo disegno sperimentale, volto alla valutazione della

variabilità individuale, gli arrays contenevano circa 6500 oligonucleotidi: il

numero limitato di geni è servito a mettere appunto la tecnica e ad ottimizzare

le varie fasi del procedimento al fine di procedere alla valutazione

dell’espressione genica in relazione all’età mediante l’utilizzo di arrays che

potessero riconoscere un numero più elevato di geni. Infatti, in questo disegno

sperimentale gli oligonucleotidi “spottati” sono stati circa 19,000. Nella terza

parte del progetto, ossia nel confronto dei livelli di espressione in gemelli MZ,

sono stati utilizzati vetrini a “whole genome” (Affimetrix) contenenti circa

50,000 oligonucleotidi.

3.2.8.2 Retrotrascrizione e marcatura del cDNA

La retrotrascrizione dell’RNA a cDNA e la marcatura sono state effettuate

utilizzando il Genisphere 3DNA labelling kit (Amersham) con l’eccezione che

6μg di RNA totale sono stati usati per ciascun canale di fluorescenza.

L’approccio, riassunto in figura 3, consiste nell’inserimento, durante la

retrotrascrizione, di primers dT modificati contenenti specifiche sequenze di

cattura all’estremità 5’in grado di legare o il fluorocromo Cy3 o il fluorocromo

Cy5. Questa procedura risulta in un processo di ibridazione a due step: quella

iniziale del cDNA agli oligonucleotidi spottati sul vetrino, seguita da una

seconda ibridazione dei dendrimeri (molecole contenenti una quantità definita

di fluorocromo di Cy3 o Cy5) alle sequenze di cattura specifiche.

Figura 3. Metodo utilizzato per la marcatura (dendrimeri) e l’ibridazione del cDNA (target) su

vetro. Ciascun campione è stato confrontato con un pool di cDNA di riferimento (Stratagene).

In alcuni casi, ove la quantità di RNA lo consentiva, è stato possibile eseguire

il dye-swap, ossia l’inversione di marcatura tra il cDNA target e quello di

riferimento (pool di cDNA, Stratagene). Tale condizione consente di verificare,

mediante la sovrapposizione delle due immagini, l’assenza di errori causati

dalla diversa incorporazione dei fluorocromi, in questo caso Cy3 e Cy5.

3.2.8.3 Ibridazione della sonda sul vetrino

L’ibridazione su vetro è stata ottimizzata utilizzando il protocollo della Lucidea

SlidePro hybrisation (Amersham) che prevede la combinazione dei campioni

da ibridare in una soluzione contenente formamide e destrano-solfato al 4%

(peso/volume). Brevemente, la fase di ibridazione iniziale del cDNA su vetro è

stata eseguita per 17h a 42°C in leggera agitazione, dopodichè è seguita una

fase di lavaggio e una di asciugatura. La seconda fase di ibridazione (marcatura

con dendrimeri) ha impiegato 4h a 50°C in leggera agitazione e riducendo la

concentrazione del destrano-solfato al 2.5% (peso/volume).

I microarrays completati sono stati conservati al buio prima dello scanning.

3.2.8.4 Cattura dei dati ed elaborazione

La scansione dei vetrini è stata eseguita mediante l’utilizzo dello scanner GSI

Luminomics 4000XL secondo le indicazioni del software (Scanarray versione

3.0). I due canali di fluorescenza, Cy3 (546) e Cy5 (646), sono stati analizzati

separatamente utilizzando una potenza laser e parametri di settaggio ottimizzati

in modo da ottenere un rapporto segnale:rumore elevato e valori finali di

fluorescenza bilanciati. Le immagini per ciascun canale sono state memorizzate

in formato Tiff e successivamente comparate (Silicon Genetics).

3.2.8.5 Normalizzazione dei dati e Analisi Statistica

Una prima analisi è stata effettuata utilizzando il software GeneSpring: dalla

sovrapposizione delle immagini sono stati estratti i dati di fluorescenza, gli

spots di controllo sono stati rimossi ed è stata applicata una prima

normalizzazione dei dati utilizzando la funzione Loess. La procedura è stata

eseguita due volte ove presente il dye-swap, in modo da eliminare un eventuale

errore dovuto ai canali presenti in GeneSpring. E’ stata quindi estratta una lista

di geni da cui sono stati esclusi i controlli, i geni privi di dye-swap valido,

quelli con intensità di fluorescenza bassa e quelli di scarsa qualità. Su questi

geni selezionati è stata condotta l’analisi statistica comparando i livelli di

espressione genica tra soggetti diversi o tra tempi diversi dello stesso soggetto

in base al disegno sperimentale. L'analisi statistica dei risultati è stata effettuata

sia dall’Unilever Research (Colworth, UK) sia in collaborazione con il Prof.

Gastone Castellani, il Dr. Daniel Remondini e il Dr. Mirko Francesconi del

Centro Interdipartmentale "L.Galvani" (C.I.G.) dell’Università di Bologna.

In dettaglio, l’analisi statistica nella prima parte (dataset over-time) del disegno

sperimentale ha previsto:

- l’applicazione dell’analisi dei Componenti Principali (o PCA, Principle

Component Analysis) per l’analisi della variabilità dell’espressione genica

nel tempo. Tale metodo consente di definire quali sono gli andamenti

principali dei livelli di espressione nel tempo, la percentuale dei geni

(rispetto al totale) che segue un determinato andamento e la lista dei geni

associata a ciascuna componente;

- l’applicazione del software Ingenuity (Ingenuity Systems,

www.ingenuity.com) per l’analisi dei pathways di quei geni che oscillano

maggiormente nel tempo (estratti con il metodo PCA);

- L’applicazione della statistica F e il calcolo del ratio della varianza per

l’identificazione dei geni con la maggiore variabilità tra gli individui.

Tale metodo si basa sulla divisione della varianza dei livelli di espressione

tra gli individui per la varianza all'interno dei singoli individui (rif. Cheung

et al., Nature Genetics, 2003). Successivamente, i risultati emersi sono stati

confrontati con quelli ottenuti dall'applicazione del test ANOVA al fine di

confermare la prima analisi.

L’analisi statistica nella seconda parte del disegno sperimentale (dataset time-

series) ha previsto:

- l’applicazione del software Genespring (Unilever) per comparare

l’espressione genica tra la classe di giovane e quella dei soggetti di età più

avanzata;

- la Complex Network Analysis (Università di Bologna) in grado di

investigare gli andamenti in set di dati che comprendono vari punti

temporali di una variabile. Tale metodo è stato utilizzato per definire

l’effetto dell’età sui livelli di espressione genica nell’intera durata di vita;

essa comprende:

o

il cluster gerarchico per la visualizzazione dei profili di

espressione;

o

l’analisi PCA (Principle Component Analysis) per la

classificazione dei livelli di espressione in gruppi che mostrano una

similarità nell’andamento con l’avanzare dell’età;

o

il

database KEGG per l’analisi dei pathways

(www.genome.jp/kegg);

o

il metodo SVD (Singular Value Decomposition) per

l’individuazione dei “modelli di andamento” principali applicata ai

livelli di espressione genica;

o

i databases Toucan e Jaspar per l’analisi dei fattori di

trascrizione di geni che condividono lo stesso andamento.

L’analisi dei dati nella terza ed ultima parte del disegno sperimentale (dataset

dei gemelli MZ) ha previsto:

- l’applicazione del metodo della correlazione per definire l’eventuale

divergenza dei profili di espressione dei due membri della coppia in

relazione all’avanzare dell’età (Tan et al., 2005);

- l’analisi PCA (Principle Component Analysis) per la classificazione dei

livelli di espressione in gruppi che mostrano una similarità nell’andamento

con l’avanzare dell’età;

- il metodo SVD (Singular Value Decomposition) per l’individuazione dei

“modelli di andamento” principali applicata ai livelli di espressione genica.

Documenti correlati