• Non ci sono risultati.

L’interrogazione in GeneCards avviene gene per gene perdendo in questo modo la complessa, ma estremamente ricca di significato, visione d’insieme procurata dai microarray.

A tale scopo sono stati prodotti diversi software che realizzano la cosiddetta “pathway analysis” o “enrichment analysis” attraverso l’uso delle informazioni contenute in KEGG. Con questo termine si intende un tipo di analisi mirata alla rivelazione di particolari “temi biologici” dei quali è “arricchita” la lista dei geni differenzialmente espressi, che potrebbero suggerire la formulazione di ipotesi biologiche a giustificazione della variazione di espressione genica osservata fra i campioni.

Gli strumenti che realizzano l’analisi di “pathway” si dividono essenzialmente in due classi: quelli che sovrappongono semplicemente la lista di geni differenzialmente espressi alle mappe di co-regolazione contenute in KEGG, e realizzano così una Over Representation Analysis (ORA), e quelli che cercano di associare un parametro statistico ad un “pathway” che sia esplicativo dell’importanza che esso assume dati i geni differenzialmente espressi che vengono mappati al suo interno.

Al primo gruppo di strumenti appartiene PathwayExplorer [60], mentre al secondo PathwayExpress [61].

88

8.3.1 Pathway Explorer

Indirizzo: https://pathwayexplorer.genome.tugraz.at/

L’accesso a PathwayExplorer può avvenire o via web, solo per l’organismo homo sapiens, oppure il software può essere installato sul proprio pc, scaricando in locale da KEGG i file che contengono la schematizzazione delle mappe per tutti gli organismi di cui è noto il genoma.

L’interfaccia di PathwayExplorer è estremamente semplice ed intuitiva:

Figura 8.2: Interfaccia iniziale di PathwayExplorer

Il software a seguito della sottomissione della lista dei geni differenzialmente espressi, costituita almeno da una colonna di identificativi del tipo suggerito da PathwayExplorer e da quella dei “fold-change”, posiziona all’interno delle mappe quei geni per i quali trova la corrispondenza con la banca dati di codici, specificata in fase di sottomissione.

Per ciascuna mappa viene visualizzata la posizione dei geni appartenenti alla lista sottomessa, mentre i differenti colori rappresentano i diversi livelli di espressione eventualmente caricati nel file.

89

Figura 8.3: Visualizzazione della posizione di sei geni differenzialmente espressi utilizzando PathwayExplorer

La rappresentazione del risultato di un esperimento sulle mappe di co- regolazione genica semplifica l’interpretazione del risultato, dal momento che fornisce automaticamente la ricostruzione delle possibili interazioni biologiche fra geni.

8.3.2 PathwayExpress

Indirizzo:http://vortex.cs.wayne.edu/projects.htm#Pathway-Express

PathwayExpress fornisce un parametro, denominato “Impact Factor”, che è esplicativo dell’importanza che una mappa di co-regolazione assume rispetto alle altre in relazione ai geni differenzialmente espressi che vengono mappati in esso.

All’interno della topologia di un “pathway” ciascun gene occupa una posizione che può essere utilizzata per organizzare gerarchicamente la lista dei geni coinvolti nella mappa. Schematizzando ciascun “pathway”come una rete costituita da nodi, rami di collegamento e foglie, è intuibile come un gene situato su di un nodo sia più importante di uno posizionato su una foglia collocata alla terminazione di un percorso. L’impatto che un gene differenzialmente espresso può avere sulla trasmissione del segnale genico è assai maggiore se esso si trova a monte del “pathway” o di una sua sottorete, piuttosto che in posizione isolata o alla sua terminazione.

90

Figura 8.4: Schematizzazione della propagazione del segnale genico

La mappatura all’interno di un “pathway” di geni differenzialmente espressi con queste caratteristiche di importanza aumenta l’impatto biologico del “pathway”.

PathwayExpress traduce questo concetto biologico in una misura statistica di rilevanza biologica del “pathway”. Essa combina in un unico parametro la topologia della rete nei termini appena illustrati e la quota di geni differenzialmente espressi mappati all’interno di un “pathway” rispetto all’insieme dei geni presenti in esso. L’”Impact Factor” è accompagnato da una misura della sua significatività statistica, ricavata in termini di p-value valutando la probabilità che prendendo casualmente un insieme di geni appartenenti al “pathway” della stessa numerosità di quelli differenzialmente espressi mappati si possa misurare lo stesso effetto di perturbazione della mappa. Il p-value viene corretto per i test multipli utilizzando il False Discovery Rate.

91

L’uso di uno strumento come quello appena illustrato modifica in maniera sostanziale la strutturazione stessa dell’interpretazione biologica dei risultati dal momento che l’informazione da esso fornita sposta il piano di osservazione dei risultati dai singoli geni all’intero “pathway” che li contiene. In questo senso l’interpretazione dovrebbe tentare di mettere in relazione i risultati ottenuti dall’esperimento e il fenomeno molecolare studiato attraverso l’indicazione fornita dai “pathway” statisticamente rilevanti, prima ancora che dai geni differenzialmente espressi in esso mappati.

Il successivo e più complesso passaggio è capire se la mappatura dei geni in un “pathway” è coerente con le informazioni biologiche disponibili su di essi e se è possibile produrre un’ipotesi biologica che spieghi il loro simultaneo coinvolgimento.

Quest’ultimo passaggio è ancora ben lontano dal poter essere automatizzato poiché è strettamente dipendente dalla capacità di schematizzare matematicamente le interazioni fra geni visualizzate nei “pathway”. Alla loro base vi sono molteplici processi biologici, messi in atto dalla cellula per la regolazione dell’espressione e che possono modulare la trasmissione del segnale in maniera differente a seconda di quale di essi sceglie la cellula per rispondere allo stimolo. La conoscenza di questi processi costituisce la parte preponderante dell’interpretazione biologica dei risultati e, al momento, non vi è ancora uno strumento bioinformatico che riesca a sostituire il biologo in questo compito.