• Non ci sono risultati.

Curve di Andrews per il dataset completo 56

Capitolo 3 Analisi esplorativa 51

3.2 Curve di Andrews 51

3.2.1 Curve di Andrews per il dataset completo 56

Anzitutto i profili di Andrews sono stati tracciati per tutti i geni, distinguendo per ciascuna patologia, in modo da verificare se esiste una differenza di fondo tra l’espressione degli stessi geni in gruppi diversi. I grafici della Figura 3.4 mettono in luce una effettiva diversità tra i profili di gruppi diversi: in particolare risultano ben distinti i gruppi delle leucemie di tipo ALL- B e ALL-T dai gruppi ALL-Tr e AML. Si noti anche una significativa differenza tra il campo di variazione delle curve nelle diverse patologie.

CAPITOLO 3 ANALISI ESPLORATIVA

Figura 3.4 Curve di Andrews per i 4992 geni distinti nelle quattro forme di leucemia. Ciascun grafico raccoglie i profili dei geni calcolati sui solo soggetti affetti dalla corrispondente patologia.

Bisogna comunque tenere presente che la forma delle curve di Andrews dipende anche dal numero di osservazioni di cui si dispone. Dal momento che i gruppi hanno numerosità diverse, è possibile che le (a volte notevoli) discrepanze tra le curve siano imputabili a questo più che ad una effettiva differenza dei livelli d’espressione dei geni.

Per verificare questa ipotesi si sono selezionati tre soggetti a caso in ciascun gruppo in modo da avere la stessa numerosità in ogni classe e si sono nuovamente tracciati i profili, proposti in Figura 3.5. Effettivamente ora le

CAPITOLO 3 ANALISI ESPLORATIVA

casi è difficile individuare diversità tra due curve relative allo steso gene a causa dell’elevata dimensionalità del dataset che probabilmente occulta le differenze tra le espressioni del singolo gene.

Figura 3.5 Curve di Andrews per i 4992 geni distinti nelle quattro forme di leucemia. Ciascun grafico raccoglie i profili dei geni calcolati per soli tre soggetti affetti dalla corrispondente patologia.

CAPITOLO 3 ANALISI ESPLORATIVA

La funzione andrews.plot, con l’ausilio della quale si sono tracciati i profili di Andrews, fornisce in output l’elenco dei geni le cui curve oltrepassano due bande fissate in modo da lasciar uscire il 25% dei profili sia verso l’alto che verso il basso.

Per ciascun gruppo si sono dunque messi a confronto gli elenchi di questi geni (attraverso la routine A3.5.r1) per avere una prima idea su quali di essi hanno comportamenti diversi a seconda della patologia. Un secondo problema è quello di estrapolare informazioni specifiche per una fissata patologia. Questo può fornire informazioni sull’efficacia discriminante. È possibile infatti che un gene abbia un buon potere discriminante se il suo profilo di Andrews fuoriesce (o non fuoriesce) dalle bande per un solo tipo di patologia.

Il confronto è stato condotto fissando le bande a diversi livelli, in particolare oltre al 25% si è usato il 20%, 15%, 10%, 5%, 3%, 1%. In appendice si forniscono i risultati di questa prima analisi (Tabella A3.8 e A3.9). Al fine di rendere visibili a colpo d’occhio i diversi comportamenti dei geni nei quattro gruppi, si propongono i grafici della Figura 3.6 in cui vengono evidenziati con un punto pieno i geni le cui curve di Andrews escono dalle bande. La collocazione dei punti (ossia dei geni) all’interno del singolo grafico non ha particolare rilevanza se non per il fatto che, nei vari confronti tra grafici, a posizione uguale corrisponde lo stesso gene. La colorazione si fa invece più intensa man mano che le due bande si separano ossia è più intensa per quei geni le cui curve raggiungono livelli più alti o più bassi nell’asse delle ordinate. Le immagini sono state realizzate con le routines A3.5.r2 e A3.5.r3.

CAPITOLO 3 ANALISI ESPLORATIVA

Figura 3.6 Confronto tra patologie: ciascun grafico rappresenta i geni le cui curve di Andrews fuoriescono dalle bande fissate a diverse percentuali. La colorazione si fa più intensa per quei geni che generano curve di Andrews che raggiungono livelli più alti o più bassi nell’asse delle ordinate. La dis posizione dei punti all’interno della stessa matrice non ha particolare rilevanza, ma permette di confrontare le varie patologie: infatti, ogni gene occupa la medesima posizione in tutti quattro grafici.

CAPITOLO 3 ANALISI ESPLORATIVA

Complessivamente si può affermare che la collocazione dei geni che fuoriescono dalle bande non varia molto da gruppo a gruppo, ossia i geni che presentano curve di Andrews con un campo di variazione più ampio in un gruppo, in linea di massima presentano i campi di variazione maggiori anche negli altri gruppi o, al contrario, i geni che hanno un andamento regolare in un gruppo, godono della stessa caratteristica anche negli altri, è probabile che si tratti di geni la cui espressione viene alterata da tutte le forme di leucemia.

In un secondo momento queste bande sono state fissate non più con criteri statistici ma partendo da ± 4 sull’asse delle ordinate, fino ad arrivare a ± 30 con un passo di 2, in modo da avere una visione non più relativa ma assoluta. Ora, l’analisi dei grafici in Figura 3.1 mette in luce delle notevoli differenze, soprattutto per quanto riguarda il primo ed il secondo gruppo: ciò significa che le curve di Andrews degli stessi geni all’interno di gruppi diversi, presentano andamenti dissimili ed hanno campo di variazione differenti.

In realtà, un’analisi di questo tipo dovrebbe essere condotta su tutte le possibili permutazioni delle unità prese tre a tre da ciascun gruppo. Una volta costruite, per ogni tripletta, le liste dei geni che fuoriescono dalle varie bande, queste dovrebbero essere poste a confronto all’interno di ciascun gruppo per vedere quali geni generano curve che escono dalle bande per tutte le triplette. A questo punto si dovrebbero selezionare quei geni le cui curve di Andrews escono (o rimangono all’interno) della bande per un solo gruppo. In questo elaborato non è stata affrontata un’analisi di questo tipo in quanto avrebbe richiesto tempi di elaborazione troppo lunghi. Forse un’analisi del genere avrebbe realmente messo in luce geni dotati di un buon potere discriminante o geni rilevanti dal punto di vista biologico.

CAPITOLO 3 ANALISI ESPLORATIVA

Figura 3.7 Confronto tra patologie: ciascun grafico rappresenta i geni le cui curve di Andrews fuoriescono dalle bande fissate a vari livelli sull’asse delle ordinate, partendo da ±4 fino ad arrivare a ±30 con passo di due; i geni con i profili che toccano livelli più alti o più bassi nell’asse delle ordinate, vengono evidenziati con colori man mano più intensi Anche in questo caso, i grafici non vanno considerati singolarmente ma devono essere letti in un’ottica di confronto.

CAPITOLO 3 ANALISI ESPLORATIVA

Documenti correlati