• Non ci sono risultati.

1.5 Metodi sperimentali per lo studio delle ricombinazion

1.5.1 Programmi per l’analisi delle ricombinazioni 1 SIMPLOT

Una delle applicazioni più versatili per lo studio delle ricombinazioni è il software Simplot ideato da Stuart Ray (1998) (Lole et al.,1999). Questo programma è in grado di leggere un allineamento di sequenze ed eseguire un tracciato di somiglianza/ dissomiglianza della sequenza denominata query, nei confronti delle altre che si stanno analizzando. Simplot calcola e grafica la percentuale di identità della sequenza query rispetto alle sequenze di riferimento all’interno di una finestra che scorre lungo tutto l’allineamento (Figura 2). Diversi parametri dell’analisi possono essere variati, quali la grandezza della finestra di analisi, l’utilizzo della correzione della distanza evoluzionistica, i plot di somiglianza/dissomiglianza ed i grafici possono essere esportati in diversi formati.

Figura 2. Finestra di Simplot che rappresenta il tracciato di similarità originato dall’analisi delle sequenze (http://sray.med.som.jhmi.edu/SCRoftware/simplot/Screenshots/images/Similar.jpg).

Il programma permette la mappatura precisa del punto di rottura di ricombinazione riportando le posizioni nell’allineamento. Un’altra proprietà utile di Simplot è

l’abilità di esportare segmenti di un allineamento su file separati, che possono poi essere utilizzati per l’analisi filogenetica e per il controllo del punto di rottura mappato. Simplot può anche eseguire il metodo Bootscanning (Salminen et al.,1995) per mappare il punto di rottura (Fig. 3). In questo tipo di analisi, i rapporti filogenetici delle sequenze in ogni finestra sono calcolati utilizzando il ri-campionamento “bootstrap” e vengono annotati i valori di bootstrap del cluster contenente la sequenza query e le sequenze di riferimento. Il vantaggio del metodo Bootscanning è che lo spostamento da un alto valore di bootstrap ad uno basso è molto pronunciato. In situazioni in cui la ricombinazione è avvenuta in tempi recenti, il relativo valore di bootstrap si sposterà rapidamente dal 100% allo 0% per uno dei due lineage parentali e dallo 0% al 100% per l’altro. Questo consente una mappatura più precisa del punto di rottura. Ad ogni modo, in un recente studio di simulazione, Posada e Crandall (2001) hanno mostrato che i metodi come il bootscanning, ovvero basati sulla ricostruzione filogenetica, non riescono ad individuare la ricombinazione quando questo tipo di eventi è raro e la variabilità nucleotidica nel set di dati è bassa.

Figura 3. Finestra di Simplot che appare dopo analisi del punto di ricombinazione fra le sequenze (http://sray.med.som.jhmi.edu/SCRoftware/simplot/Screenshots/images/Bootscan.jpg).

1.5.1.2 SPLITSTREE

Splitstree è un programma interattivo per l’analisi e la visualizzazione dei dati evolutivi, che implementa il metodo di decomposizione denominato “split

decomposition”. L’analisi con Split decomposition consente la scomposizione di

qualsiasi misura di distanza, come ad esempio la distanza genetica generata da un set di sequenze nucleotidiche o aminoacidiche allineate, in una somma di splits metrici. In generale, se le distanze fornite sono di tipo tree-like, lo split graph produrrà un albero; network più complessi vengono generati quando le distanze deviano dalla situazione precedente. Il vantaggio di utilizzare uno split graph piuttosto che un albero filogenetico per rappresentare i rapporti evolutivi fra un dato set di sequenze, è che l’albero presume sempre che i processi evolutivi siano biforcati o multiforcati al contrario di uno split graph. In presenza di ricombinazione, i dati mostreranno segnali filogenetici contrastanti poiché ripartizioni differenti potrebbero supportare differenti storie evolutive. Gli split graph consentono una maggiore flessibilità nel rappresentare questi dati dal momento che il segnale contrastante non sarà necessariamente forzato all’interno di un albero. Uno studio condotto da Salemi e collaboaratori (2003) infatti, suggerisce che il metodo dello “split decomposition” abbia il vantaggio di non forzare i dati in un albero sbagliato ma lo svantaggio di essere poco intuitivo quando, molteplici segnali contrastanti presenti nei dati, producono network complessi. L’algoritmo diventa inaffidabile quando vengono analizzati più di 15 o 20 taxa, e con un numero così grande di ceppi esso tende a dare un grafico di tipo star-like con una risoluzione scarsa o assente. Nonostante la decomposizione, condotta con questo metodo, rappresenti una valida applicazione per visualizzare i rapporti evolutivi fra le sequenze non tree-like, questa non permette la mappatura del sito di ricombinazione e non fornisce un supporto statistico (Holmes

et al.,1999).

Per questa ultima ragione, Splitstree supporta l’analisi bootstrap (Felsenstein, 1985) per verificare l’attendibilità statistica dei grafici splits calcolati. Il programma genera ripetutamente e casualmente nuovi set di dati e per ognuno di questi set di dati viene calcolato uno split graph. Alla fine della procedura, ad ogni split generato nel grafico originale verrà associata una percentuale indicante l’attendibilità statistica dello split stesso e quindi del metodo.

1.5.1.3 RDP

Il Recombination Detection Program (RDP) utilizza un approccio basato sulla “scansione a coppia”. Iniziando con un allineamento multiplo di sequenze in formato Phylip, Fasta o Clustal, il software esamina ogni possibile combinazione di tre sequenze per evidenziare la ricombinazione secondo una procedura in tre step. Nel primo step tutti i siti non informativi, dal punto di vista filogenetico, sono scartati dal gruppo delle tre sequenze per ottenere sub-sequenze più ricche di informazioni. Nel secondo step, una finestra dalla larghezza definita dall’utente viene spostata un nucleotide alla volta lungo le sub-sequenze allineate e una media della percentuale di identità per ognuna delle tre possibili coppie di sequenze viene calcolata ad ogni posizione. Le sequenze che possono avere una possibile origine ricombinante sono definite come regioni in cui la percentuale di identità di una sequenza A e C o B e C sono più alte che per le sequenze A e B. Nel terzo step, viene calcolata la probabilità che l’arrangiamento nucleotidico nelle regioni identificate come più strettamente correlate tra le sequenze in analisi potrebbe essere capitato per caso. Una volta che ogni combinazione di tre sequenze è stata analizzata, un’interfaccia grafica consente all’utente di accedere alle informazioni generate. Recentemente Martin e collaboratori (2005) hanno creato la versione aggiornata RDP2, in cui oltre ad essere presente il metodo basato sulla scansione a coppia, il programma ha implementato diversi altri algoritmi per l’analisi delle ricombinazioni. Il confronto condotto da Posada (2002) sulla capacità di 14 diversi metodi, utilizzati per l’individuazione degli eventi ricombinanti a partire da un set di dati simulati e reali, ha dimostrato che nonostante alcuni siano più efficienti di altri, non esiste un singolo metodo capace di individuare meglio le ricombinazioni (Posada and Crandall, 2001; Posada, 2002). RDP2 presenta una varietà di metodi non parametrici per individuare le ricombinazioni ed è in grado di utilizzare qualsiasi combinazione di questi metodi per identificare automaticamente le sequenze parentali da quelle ricombinanti, stimare la posizione dei punti di rottura, e calcolare gli indici di probabilità per potenziali eventi di ricombinazione. Una volta che tutti i potenziali eventi di questo tipo vengono

identificati, RDP2 seleziona i risultati dell’analisi e cerca di determinare il numero degli eventi di ricombinazione a partire dall’allineamento. RDP2 può essere programmato per filtrare automaticamente gli eventi ricombinanti individuati da un particolare algoritmo rispetto ad un numero specificato di metodi, per identificare le sequenze consenso parentali e per determinare la posizione del più probabile punto di rottura. Per ogni evento rilevato, possono essere visualizzate le informazioni sul tipo di metodo utilizzato per l’analisi, la posizione del punto di rottura, le sequenze parentali, i valori di probabilità, i gradi di accordo dei risultati ottenuti con altri metodi analitici, i siti informativi nell’allineamento e nell’albero filogenetico, semplicemente cliccando sulla rappresentazione grafica dell’evento. Quando un evento è selezionato per studi più dettagliati, si può testare l’evidenza della ricombinazione utilizzando 10 diversi metodi di identificazione delle ricombinazioni semplicemente selezionando il metodo dal menu principale. Per facilitare la valutazione della ricombinazione, RDP2 può anche utilizzare contemporaneamente i componenti di PHYLIP (Felsenstein, 1989; Olsen et al.,1994) per visualizzare gli alberi filogenetici costrutiti da differenti porzioni dell’allineamento. Recentemente è disponibile la versione RDP3.

2 PARAPOXVIRUS

Documenti correlati