• Non ci sono risultati.

4. Applicazione a dati reali

4.4. Analisi dei dati di tumore all’ovaio

4.4.5. Gene set Analysis

Come spiegato nel §2.6 la fase successiva a quella di identificazione dei geni differenzialmente espressi è la gene set analysis. A seconda del metodo che si vuole utilizzare, questa può sfruttare i risultati ottenuti in fase di identificazione dei geni differenzialmente espressi (metodi competitivi) oppure può essere svolta indipendentemente da questi, utilizzando l’intera matrice dei valori di espressione (metodi indipendenti); inoltre può guadagnare potenza dalle informazioni contenute nei pathway (metodi topologici) oppure considerare questi come semplici liste di geni (metodi non topologici). In questo paragrafo si vogliono mostrare i risultati ottenuti dall’applicazione delle quattro tecniche di analisi di gene set spiegate nel §2.6, ossia l’analisi di arricchimento classica, il Global Test, la Signaling Pathway Impact Analysis (SPIA) e CliPPER. Questi sono stati scelti per le loro differenti caratteristiche, sapendo che alcuni riusciranno a cogliere aspetti non colti da altri e sperando che l’unione dei risultati ottenuti possa dare qualche indicazione sulle possibili classi funzionali o sui pathway coinvolti nei processi biologici che spiegano la diversa sopravvivenza delle pazienti affette da tumore all’ovaio.

La distinzione che genera la maggiore differenza tra tutte le analisi di gene set è quella tra metodi competitivi e metodi indipendenti, proprio a causa della diversa ipotesi nulla alla base dei test che queste analisi effettuano. L’analisi di arricchimento è l’unico metodo competitivo, dato che, in realtà, SPIA è un metodo misto. E’ risaputo, però, che il punteggio di perturbazione del pathway

CAPITOLO 4: APPLICAZIONE A DATI REALI 101

calcolato da SPIA (pPERT), il quale rappresenta la “componente indipendente” dell’analisi, è solitamente poco influente rispetto alla componente “competitiva” (pNDE) dello stesso; per questo motivo i risultati che SPIA produce non sono solitamente molto diversi da quelli dell’analisi di arricchimento. Global test e CliPPER sono, invece, metodi indipendenti. In definitiva, ci si attende che l’analisi di arricchimento e SPIA conducano a risultati abbastanza simili tra loro ma, probabilmente, differenti rispetto a quelli del Global Test e di CliPPER, i quali a loro volta dovrebbero essere abbastanza concordi tra loro nei risultati.

Per effettuare le suddette analisi si è utilizzato un web server pubblico chiamato Graphite Web, nato per l’analisi di dati di espressione genica e la visualizzazione di pathway biologici. Graphite Web permette di eseguire tutte le quattro gene set analysis nominate in questo elaborato, offrendo una visualizzazione dei pathway che mira a semplificare l’interpretazione dei risultati ottenuti. L’applicativo è nato grazie ad un gruppo di ricercatori del dipartimento di Biologia dell’università di Padova ed il suo funzionamento è descritto in Sales et. al. (2013).

L’interpretazione dei risultati prodotti dalle analisi di gene set non è per niente banale e prevede non solo approfondimenti sulle funzioni che sono rappresentate dai pathway individuati, ma anche la ricerca in letteratura di comportamenti analoghi riscontrati in altre condizioni simili. Per questi motivi si è voluto individuare, innanzitutto, i pathway comuni ai metodi utilizzati per le analisi di gene set, tenendo presente le considerazioni fatte riguardo le grosse differenze tra tipologie di metodi.

Per l’analisi di arricchimento e per SPIA, i quali sfruttano la lista dei geni identificati in precedenza come differenzialmente espressi, si è deciso di utilizzare quelli identificati dal test SAM, in quanto di numerosità più elevata. Inoltre si ricordi che SAM ed Ebayes, nei dati corretti con il metodo COMBAT, danno risultati tra loro concordanti, dato che tutti i geni dichiarati differenzialmente espressi con SAM, anche se non significativi per Ebayes, hanno un ranking alto nella lista dei geni ordinata per valore della statistica test.

L’analisi di arricchimento conduce all’individuazione di un solo pathway modificato significativamente tra le due condizioni di sopravvivenza alta e bassa delle pazienti, il quale è l’unico rilevato anche da SPIA. Il Global Test ne

102 CAPITOLO 4: APPLICAZIONE A DATI REALI

identifica 50, mentre CliPPER ne identifica 67. L’unico pathway individuato dall’analisi di arricchimento e da SPIA è presente anche tra quelli individuati dal Global Test, ma non tra quelli trovati da CliPPER. Tutte le analisi sono state svolte considerando un q-value del 10%. La Figura 4.30 mostra tramite un diagramma di Venn i pathway comuni tra quelli identificati dal Global Test e quelli individuati da CliPPER. Questi, unitamente a quello rilevato dall’analisi di arricchimento, da SPIA e dal Global Test, ma non da CliPPER, sono tutti riportati nella Tabella 4.17.

Come fatto in fase di identificazione dei geni differenzialmente espressi, si è voluto verificare se i pathway rilevati nei dati corretti con COMBAT fossero circa gli stessi di quelli rilevati sui dati corretti con RUV-4. Per questo è stata aggiunta una colonna con un flag. Come accade per i dati corretti con COMBAT, il pathway ECM-receptor interaction viene rilevato da tutti i metodi tranne che da CliPPER, mentre per decidere se il flag doveva essere positivo o negativo si sono considerati solo i pathway derivanti dall’intersezione tra Global Test e CliPPER, esattamente come si era proceduto sui dati corretti con COMBAT.

Sui pathway riportati nella suddetta tabella sono stati fatti degli approfondimenti per verificare se, in letteratura, siano presenti studi con caratteristiche simili a quello svolto in questo elaborato e che abbiano portato ad identificare qualcuno di questi.

CAPITOLO 4: APPLICAZIONE A DATI REALI 103

Nome Pathway Global Test q-value α-Mean α-Var RUV-4

ECM-receptor interaction 0,036 - - 

Axon guidance 0,036 0,01 0,50 

beta-Alanine metabolism 0,036 0,00 0,72 

Small cell lung cancer 0,036 0,02 0,69 

Toll-like receptor signaling pathway 0,036 0,00 0,70 

Carbohydrate digestion and

absorption 0,039 0,00 0,93 

Epithelial cell signaling in

Helicobacter pylori infection 0,039 0,01 0,87 

Glycolysis / Gluconeogenesis 0,039 0,01 1,00 

NF-kappa B signaling pathway 0,039 0,00 0,32 

Terpenoid backbone biosynthesis 0,039 0,00 0,09 

TGF-beta signaling pathway 0,039 0,00 0,57 

Toxoplasmosis 0,048 0,03 0,89 

Gap junction 0,056 0,01 0,61 

Fructose and mannose metabolism 0,058 0,01 0,59 

Legionellosis 0,058 0,02 0,12 

Nicotinate and nicotinamide

metabolism 0,058 0,00 0,64 

Prostate cancer 0,058 0,00 0,96 

Type II diabetes mellitus 0,058 0,04 0,67 

Bacterial invasion of epithelial cells 0,062 0,00 1,00 

Folate biosynthesis 0,064 0,00 0,39 

Complement and coagulation

cascades 0,065 0,03 0,67 

Glycosylphosphatidylinositol (GPI)-

anchor biosynthesis 0,065 0,02 0,77 

Jak-STAT signaling pathway 0,065 0,00 1,00 

Leukocyte transendothelial

migration 0,065 0,00 0,28 

Pancreatic cancer 0,065 0,01 0,96 

Shigellosis 0,065 0,00 1,00 

Wnt signaling pathway 0,065 0,00 0,08 

VEGF signaling pathway 0,072 0,01 0,85 

Melanoma 0,075 0,00 1,00 

Pantothenate and CoA biosynthesis 0,075 0,01 0,62 

Apoptosis 0,090 0,00 0,45 

p53 signaling pathway 0,092 0,00 0,68 

Non-small cell lung cancer 0,096 0,05 0,98 

Tryptophan metabolism 0,101 0,02 0,13 

Tabella 4.17: Lista dei 34 pathway risultati significativamente modificati nelle due condizioni di alta e bassa sopravvivenza. Il primo è il pathway comune a 3 metodi: analisi di arricchimento, SPIA e Global Test. Tutti gli altri risultano dall’intersezione tra la lista dei pathway trovati con il Global Test e quelli trovati con CliPPER. La seconda colonna è il q-value del Global Test, mentre la terza è il p-value relativo alla differenza media di espressione tra i geni del pathway nelle due condizioni; la quarta colonna è relativa alla differenza nelle correlazioni tra i geni del pathway nelle due condizioni.

104 CAPITOLO 4: APPLICAZIONE A DATI REALI

Le liste di tutti i pathway risultati significativi per ognuno dei metodi utilizzati sono riportate in appendice (§A.8).

I pathway individuati sono coerenti con i risultati noti in letteratura sulla progressione tumorale. Un coinvolgimento del pathway relativo alla Matrice Extracellulare (ECM) è stato dimostrato anche nello sviluppo del tumore alla mammella (Emery, et al., 2009), mentre sono già note sregolazioni di molti geni coinvolti nel pathway NF-kappa B durante lo sviluppo e la progressione del tumore all’ovaio. Ci sono cinque proteine della famiglia NF-kB che controllano diversi processi chiave richiesti per lo sviluppo dei tumori, come l’attivazione dei geni anti-apoptotici, per cui la cellula tumorale non muore ed è libera di riprodursi (Alvero, 2010). Il coinvolgimento del pathway TGF-beta, poi è compatibile con ciò che avviene solitamente nelle cellule tumorali; questa famiglia di proteine, infatti, è responsabile della proliferazione cellulare ed è stata rilevata in casi di tumore all’ovaio da Yeung et. al. (2013).

CAPITOLO 5: POTERE DISCRIMINANTE DEI 105 GENI DIFFERENZIALMENTE ESPRESSI

Capitolo 5