• Non ci sono risultati.

ANALISI DEI RISULTATI DI DOCKING

La suite di Gold fornisce anche alcuni programmi per l’analisi dei risultati ottenuti dal docking, in particolare tramite il calcolo dello scarto quadratico medio (root mean square deviation: RMSD) fra la geometria risultante dal calcolo e quella sperimentale.

Questo valore è definito in Statistica come scarto quadratico medio e, per proprietà matematica risulta essere un valore sempre positivo. Data l’elevazione a potenza della differenza di valore tra coordinate iniziali e finali del ligando, più c’è corrispondenza più avremo dei contributi bassi, il che rende il valore ultimo, posto sotto radice, prossimo allo zero. Lo zero, infatti, a livello teorico si ottiene quando le coordinate iniziali e finali coincidono. smart_rms calcola la deviazione rms tra due conformazioni della stessa struttura. Il comando da utilizzare da shell per eseguire questa analisi è:

$GOLD_DIR/utilities/smart_rms –hv file1.mol2 file2.mol2

rms_analysis compie un gruppo di analisi su un set di soluzioni del docking. In particolare, calcola la matrice della differenza di rms per un set di strutture (come MOL2 file) e compie un gruppo di analisi gerarchiche. Il grafico dell’algoritmo dell’isomorfismo è utilizzato per determinare il valore ottimale di rms. Il comando da utilizzare da shell per eseguire questa analisi è:

$GOLD_DIR/utilities/rms_analysis -method simple file1.mol2 file2.mol2

AUTODOCK

AutoDock11 è un programma sviluppato al fine di ottenere una procedura automatizzata per predire le interazioni di ligandi flessibili con targets macromolecolari statici.

La procedura originale prevedeva una tecnica di Monte Carlo simulated annealing (metodo Metropolis) per la ricerca conformazionale e una valutazione rapida dell’energia mediante potenziali d’affinità molecolare basati su una griglia, precalcolando i potenziali di affinità atomici per ogni atomo del substrato nella maniera descritta da Goodford10.

Il primo step della procedura di docking concerne la costruzione della griglia nella macromolecola. A tale scopo è presente il programma Autogrid che costruisce una griglia tridimensionale sulla macromolecola con un atomo

32

probe in ogni suo punto; l’energia d’interazione di questo singolo atomo con la proteina è assegnata a ciascun

punto della griglia. Il programma calcola un grid per ogni tipo di atomo del substrato: carbonio, ( alifatico e aromatico ), ossigeno, azoto, zolfo e idrogeno.

L’energia di una particolare configurazione del substrato viene poi ricavata da un’interpolazione tri-lineare dei valori d’affinità degli otto punti della griglia che circondano ogni atomo del substrato. Il tempo per il calcolo dell’energia dipende esclusivamente dal numero di atomi del substrato e non della proteina.

La simulazione del docking attualmente può essere eseguita con diversi metodi di ricerca:

1. Monte Carlo simulated annealing (SA) in cui in ogni ciclo di annealing a temperatura costante vengono

variati casualmente la posizione, l’orientamento e la conformazione del ligando flessibile a partire dal suo stato iniziale. Il nuovo stato viene poi paragonato al precedente: se ha un’energia minore esso è immediatamente accettato, se ha un’energia maggiore viene accettato o rifiutato secondo il fattore di probabilità P(∆E)= e-(∆E) / KBT (KB è la costante di Boltzmann) che dipende dalla temperatura e

dall’energia del ciclo; a temperature maggiori in genere vengono accettate più conformazioni.

2. Genetic algorithm (GA) e hybrid genetic algorithm-local search (LGA); entrambe iniziano con una

popolazione di conformazioni con orientazione e traslazione casuali che sono descritte nelle variabili di stato codificate da un numero variabile di geni che formano il genoma. Il metodo GA impone un utilizzo esclusivamente binario mentre il metodo LGA è un metodo ibrido tra il GA e l’SW e consiste di un ottimizzatore globale adattabile e un ricercatore locale; esso infatti ha 2 punti di incrocio e mutazione casuale per il ricercatore globale, mentre il ricercatore locale modificando il fenotipo può aggiornare il genotipo.

3. Evolutionary programming (EP) si ottiene imponendo la velocità dell’incrocio genetico del GA uguale a

zero.

4. Pure local search (SW) utilizza delle varianze fisse che inizialmente sono uguali ad 1, per determinare

probabilisticamente i cambiamenti di una certa variabile di stato. Queste varianze vengono poi raddoppiate o dimezzate durante la ricerca secondo il numero di movenze consecutive che provocano una diminuzione dell’energia.

La procedura per avviare i calcoli di docking prevede varie operazioni: La preparazione dei file di input attraverso AutoDockTools.

Creazione della griglia delle affinità atomiche attraverso AutoGrid. Docking di ligandi attraverso AutoDock.

33 Preparazione dei File di Input

Il primo passo è la preparazione dei file di input specifici per AutoDock, ma a differenza di Gold serve la conversione dei file molecolari (.pdb o .mol2) nel nuovo formato PDBQT. Questa tipologia di file, oltre alle coordinate degli atomi di proteina o ligando, raccoglie dati sulla tipologia di atomi presenti nella struttura, le cariche parziali, gli atomi di idrogeno non polari e la flessibilità della molecola, tutte informazioni necessarie al corretto funzionamento di AutoGrid e AutoDock. Una volta aperto il file del composto mediante l’opzione Ligand > Input > Open il programma verifica in automatico la composizione atomica del ligando, e ne riporta in un messaggio successivo tutti i dati. Per il riconoscimento è necessario che il composto presenti tutti gli idrogeni della struttura, sia quelli polari che quelli non polari, in maniera tale da permettere ad AutoDock il calcolo delle cariche di Gasteiger12. Il programma, infatti, necessita che il ligando abbia cariche atomiche parziali definite e che gli atomi siano riconosciuti secondo la classificazione interna del programma. Oltre a ciò AutoDock adotta l’idea che la molecola possa essere considerata come un ‘albero’ nel quale il nucleo rigido della molecola è la ‘radice’ e le parti flessibili, ossia i torsionali della molecola, sono i ‘rami’. Attraverso il comando TorsionTree > DetectRoot il programma valuta e sceglie in autonomia quale parte considerare come ‘radice’ e ci mostra il risultato rimarcando questa con una sfera verde.

A livello teorico la scelta viene concettualmente operata guardando quale sia l’atomo del ligando con la più piccola sequenza ivi connessa. Nel caso alcuni atomi competano tra loro viene scelto quello che possegga ulteriori caratteristiche che denotino una maggior rigidità, come l’appartenenza ad un ciclo.

Un altro parametro usato da AutoDock è il Torsdof, che riguarda il numero dei legami ruotabili della molecola, ossia i torsionali, e quindi in generale i gradi di libertà del ligando. Da questo conteggio sono esclusi i legami presenti in un anello, i legami degli atomi terminali, i legami ammidici, etc. Torsdof è usato per calcolare il cambio dell’energia libera causata dalla perdita dei gradi di libertà dei torsionali durante il legame con la proteina.

Terminate queste fasi preliminari sarà opportuno salvare il file nel nuovo formato pdbqt, passando quindi all’analisi della proteina. Tutto questo considerando che attraverso l’opportuno settaggio è possibile impostare:

Il docking considerando il ligando completamente rigido. (tramite il comando Ligand > Input > OpenAsRigid).

La selezione manuale dell’atomo da considerare come ‘radice’. (tramite il comando TorsionTree > ChooseRoot).

34 L’impostazione di quanti e quali siano i Torsionali, compresi quei legami che sono potenzialmente ruotabili ma bloccati come il legame ammidico (tramite i comandi TorsionTree > ChooseTorsions / Set Number Of Torsions).

La preparazione dei ligandi, con la relativa conversione da un formato all’altro, può essere svolta anche attraverso un comando da tastiera, che permette di ovviare a tutta questa procedura manuale. Molto spesso il numero di ligandi da ottimizzare risulta essere molto alto per cui è importante poter sfruttare la procedura automatica, riportata qui sotto:

prepare_ligand4.py -l nomefile.pdb -o nomefile.pdbqt dove:

–l : nome dell’input in formato PDB. –o : nome dell’output in formato PDBQT.

Per quanto riguarda la proteina il discorso è analogo: si procede, infatti, col selezionare la macromolecola attraverso il comando Grid > Macromolecule > Open lasciando che il programma analizzi automaticamente la struttura, assegni le cariche e classifichi gli atomi secondo la sua dicitura. Nel caso di proteine rigide la selezione procede col salvataggio diretto del file PDBQT, altrimenti, nei casi in cui specifiche catene laterali della proteina sono trattate come flessibili, verrà creato un file PDBQT separato con le specifiche coordinate della catena laterale.

Nel caso in cui il file .pdb importato sia senza idrogeni non polari, si aggiungono le cariche parziali tramite l’opzione Add Kollmann charges del menu Edit, dopodichè si aggiungono i parametri del solvente con l’opzione Add solvent parameters del menu Macromolecule e quindi è possibile salvare il file in formato .pdbqs13.

Creazione della griglia con AutoGrid

Il secondo passaggio prima del calcolo di docking consiste nell’avviare la creazione della griglia che è richiesta per questo genere di programma. AutoDock, infatti, sfrutta come metodo di valutazione della predizione un sistema basato sulla scomposizione del sito di legame in una griglia di valutazione energetica rapida, ottenendo così informazioni sull’energia potenziale e quindi l’affinità per ogni tipo di atomo che il ligando possiede. Ad occuparsi della creazione di questa mappa, è l’applicazione AutoGrid, che incorpora una parte della proteina in una griglia tridimensionale e pone in ogni punto della stessa un atomo sonda, detto probe. Il volume di questo

35 reticolo viene stabilito tramite selezione manuale e per ogni punto di essa vengono posti in sequenza dei probes in maniera tale da avere dei dati sull’energia d’interazione tra questo singolo atomo e la proteina.

Tipicamente AutoGrid misura le affinità calcolando le griglie per ogni tipo di atomo del ligando, come carbonio, ossigeno, azoto e idrogeno, ma tiene presenti anche i potenziali elettrostatici e il contributo di de- solvatazione. Questi valori andranno a comporre tutta una serie di ‘mappe’ che durante il calcolo con AutoDock serviranno a valutare particolari configurazioni del ligando. AutoGrid inoltre genera altri due file, con le estensioni .fld e .xyz, dove il primo è un file di campo che riassume le mappe della rete, e il secondo descrive l'estensione territoriale delle griglie nello spazio cartesiano.

Attuato questo passaggio, dovremo avviare la creazione del file di configurazione della griglia stessa, che è necessario ad AutoGrid per procedere tanto quanto lo sono i file di input da noi ottimizzati. La creazione può avvenire tramite l’interfaccia grafica di AutoDock, ma è disponibile anche un pratico comando da tastiera da poter utilizzare anche all’interno di vari script:

prepare_gpf4.py –l ligand.pdbqt –r prot.pdbqt dove:

–l : nome e indirizzo del ligando originale in formato PDBQT; –r : nome e indirizzo della proteina in formato PDBQT.

Anche per l’avvio della creazione della mappatura della griglia è possibile utilizzare un pratico comando da tastiera :

autogrid4 -p macro.gpf [-l macro.glg] dove:

–p : file coi i parametri del calcolo, in formato GPF.

–l : file di output con i risultati del conteggio, ove possiamo controllare le energie minime e massime di ogni griglia, in formato GLG.

Docking e script con AutoDock

Il successo di un programma di docking, come precedentemente detto per Gold, dipende fondamentalmente da due fattori: l’algoritmo di ricerca e la funzione di score. Nel caso di AutoDock la procedura prevede la

36 creazione dei file PDBQT di input, l’utilizzo come metodo di ricerca di uno dei diversi algoritmi integrati nel programma, mentre per la valutazione finale la funzione di punteggio viene sostituita dalla griglia. Così come in Gold, il set dei metodi di ricerca di AutoDock comprende l’Algoritmo Genetico, ma sono disponibili anche il MonteCarlo Simulated Annealing e l’algoritmo genetico Lamarck (LGA, ritenuto dagli autori come il metodo più efficiente). Attraverso questi vengono esplorati gli stati conformazionali dei ligandi flessibili, che saranno poi affiancati e valutati usando le mappe costruite che permettono di valutare l’interazione ligando-proteina in ogni punto della simulazione di docking.

Figura 2.3: Percorso ideale per il lancio dei calcoli con AutoDock.

I calcoli di docking, così come in Gold e negli altri programmi, sono avviabili con l’interfaccia grafica di AutoDock, ma sfruttare gli script è un passaggio consigliato. La comodità sta nel fatto che si possono lanciare in sequenza, in caso di necessità, una grande quantità di docking. Gli script possono essere implementati da altri script in grado di regolare i nomi da attribuire ai file DPF (o GPF nel caso si debba avviare AutoGrid) nelle stringhe, rendendo pratico e veloce un percorso altrimenti molto lungo.

Per quanto riguarda il docking vero e proprio, avviene una situazione simile a quella già intravista con AutoGrid, infatti è necessario attuare prima la creazione dei file di configurazione :

prepare_dpf4.py –l cs_ligand.pdbqt –r prot.pdbqt –p ga_run num –o name.dpf dove:

–l : nome e indirizzo del ligando dopo analisi conformazionale in formato PDBQT; –r : nome e indirizzo della proteina in formato PDBQT;

37

–p : numero di simulazioni che s’intendono far svolgere all’Algoritmo Genetico; –o : nome del file di output in formato DPF.

e poi avviare il calcolo di docking attraverso la relativa istruzione: autodock4 -p macro.dpf [-l macro.dlg]

dove:

–p : file con i parametri del calcolo, in formato DPF;

–l : file di output con i risultati del docking, in formato DLG ma facilmente convertibili in PDBQT o PDB.

Prendendo in esame gli opportuni script utilizzati per avviare i calcoli i comandi per la preparazione dei file di configurazione e per l’avvio sia di AutoGrid e AutoDock sono quasi sempre associati all’istruzione foreach file che consente di estrarre il codice numerico del ligando, memorizzarlo fino al termine del ciclo, e di riportarlo automaticamente ove si desidera, citando la dicitura $code all’interno dell’oggetto che si intende creare. In questa maniera basterà introdurre i ligandi all’interno della cartella (es. lig_2xpb.pdbqt) che lo script riconoscerà automaticamente tutti i composti e riuscirà ad utilizzare il codice per le fasi successive.

38 Il primo passaggio di questo primo script parte dalla creazione, tramite il comando prepare_gpf4.py del file di configurazione della griglia, cui è accompagnata la generazione delle relative mappature. Come output finale avremo i file di configurazione con l’estensione GPF, ognuno dei quali contenente il codice di riferimento. Per quanto riguarda la creazione della griglia vera e propria con AutoGrid non viene svolta automaticamente ma ne viene addizionata l’istruzione per lo script successivo. Il tutto è reso possibile tramite il comando echo, che è in grado di trascrivere una riga di testo a nostro piacimento (l’oggetto compreso tra parentesi) all’interno di un file qualsiasi a nostra scelta (dicitura >> nome_del_file) :

echo 'autogrid4 -p prot_'$code'.gpf -l prot_'$code'.glg' >> script_adt

Questa sequenza di passaggi, che vedono prima la creazione dei file di configurazione, è stata ideata con lo scopo di suddividere la parte preparatoria da quella di calcolo vero e proprio. Questo ci consente di verificare la buona riuscita di ogni passaggio, privilegiando e valorizzando l’azione che stiamo compiendo piuttosto che l’analisi di un complesso alla volta.

Per quanto riguarda il calcolo di docking, la strutturazione degli script è la medesima. Nella parte successiva dello script visto in precedenza, dopo l’impostazione per AutoGrid, viene implementata la creazione del file con tutti i parametri per la preparazione del calcolo di docking:

seguito dall’istruzione per consentire l’estrazione dell’rmsd dal file di calcolo.

La parte finale dello script termina analogamente alla precedente, con l’implementazione, sempre attraverso l’istruzione echo, delle operazioni successive:

39 Per quanto riguarda invece il cross-docking, il settaggio, questa volta, ha coinvolto in maniera doppia rispetto al self-docking, il comando foreach, allo scopo sostanzialmente di rinominare tutti i file di configurazione del docking attraverso una doppia nomenclatura. Rispetto al cross-docking con Gold, AutoDock svolge i calcoli coinvolgendo un solo ligando alla volta, per questo motivo è necessario creare N2 file di configurazione GPF. Formulando istruzioni che sono in grado di estrarre due codici (uno dalla proteina, l’altro dal ligando) contemporaneamente è possibile associare ogni variabile all’altra in sequenza e produrre il risultato desiderato. Lo svolgimento del resto delle istruzioni è identico a tutto quello visto precedentemente, chiaramente con lo sfruttamento dei due codici, ma con la differenza che non sono necessarie le istruzioni necessarie a far partire AutoGrid, in quanto possono essere sfruttate tranquillamente le griglie create per il self-docking.

Rocs

L'applicazione d'analisi della somiglianza chimica in drug design è una tecnica comunemente usata e utile. Esistono numerosi metodi topologici (2D) e di sovrapposizione (3D) per la misura della somiglianza chimica. I metodi che funzionano in tre dimensioni sono tradizionalmente molto più lenti rispetto ai metodi 2D. ROCS14 è progettato per eseguire ricerche nelle banche dati su scala 3D di grandi dimensioni, utilizzando un metodo di sovrapposizione che trova i composti simili. Si tratta, però, di una procedura non intuitiva; quindi, essendo questo un parametro di notevole importanza nel processo di scoperta di nuovi farmaci, sarà fondamentale la componente umana nello svolgimento della ricerca.

ROCS è un metodo di sovrapposizione shape-based tramite il quale le molecole vengono allineate con un processo di ottimizzazione che massimizza il volume di sovrapposizione tra di loro.

ROCS utilizza solo gli atomi pesanti di un ligando, gli atomi di idrogeno vengono ignorati. Dal momento che la forma e il volume sono strettamente correlate tra di loro, una procedura di massimizzazione del volume è un ottimo metodo per ottenere intuizioni riguardanti forme simili tra molecole differenti. Sebbene ROCS è principalmente un metodo shape-based, nel processo di analisi di sovrapposizione è possibile inserire manualmente dei criteri di ricerca strutturali (come la presenza di un determinato gruppo funzionale) che facilita l'individuazione di quei composti che sono simili per forma e per chimica15.

FLAP

I farmacofori, cioè l’insieme di gruppi funzionali disposti opportunamente nello spazio comuni a tutte le molecole attive su un determinato target, sono ampiamente utilizzati nella ricerca in database per la progettazione 3D automatizzata. La loro applicazione è stata ampliata grazie al concetto delle "impronte

40 digitali", che rappresentano una visione sistematica delle potenziali proprietà farmacoforiche che una molecola è in grado di esibire. Strumento avanzato per la progettazione di librerie così come per il virtual screening, lo studio farmacoforico può avvenire utilizzando come descrittori 3D la proprietà elettrostatica, o caratteristiche come accettori/donatori di legami a idrogeno, gruppi carichi positivamente e negativamente, e zone idrofobiche ed aromatiche. La rappresentazione 3D di queste caratteristiche sono un elemento chiave per il riconoscimento molecolare, di forte impatto nel processo di scoperta di nuovi farmaci. L'utilizzo di descrittori farmacoforici derivati da siti di legame delle proteine consente un quadro comune di riferimento da utilizzare sia nella ricerca di ligandi che di recettori. Così, generando i punti farmacoforici caratteristici complementari per un sito di legame, si produce un'immagine che rappresenta il ligando.

FLAP16 (Fingerprints for Ligands And Proteins) rappresenta una nuova procedura avanzata che comprende diverse funzionalità aggiuntive, come lo studio sulla selettività delle proteine e di similarità delle proteine, oltre che la rapida generazione di un reticolo di descrittori per l’analisi struttura-proprietà. FLAP consente l'identificazione automatizzata delle caratteristiche farmacoforiche di un potenziale ligando per un legame nel sito proteico, prendendo in considerazione oltre agli effetti su più residui amminoacidici presenti nel sito, la flessibilità delle catene laterali in risposta al probe utilizzato.

FLAP è un software concepito come algoritmo per virtual screening, con lo scopo di descrivere ligandi e proteine in termini di 4 punti farmacoforici. E’ stato sviluppato per sfruttare le informazioni derivanti dalle strutture cristallografiche, dalle molecole di screening virtuali e/o dai loro complessi. Il metodo comprende la quantificazione delle impronte digitali delle (macro) molecole che consentono l'applicazione di strategie razionali per generare strutture virtuali o per confrontare proteine, senza alcun pregiudizio dovuto alla conoscenza precedente. Molte applicazioni sono state rese possibili utilizzando questo nuovo metodo, come descritto in Figura 2.4.

41 Figura 2.4: Esempi di diverse applicazioni di FLAP.

FLAP utilizza i campi di interazione molecolare (molecular interaction fields: MIFs) calcolati attraverso il programma GRID per associare tipi atomici specifici alle proprietà chimiche di un ligando: questi atomi selezionati vengono usati all’interno di FLAP per costruire tutte le possibili combinazioni di 4 punti farmacoforici della molecola in studio. Il programma GRID, il più utilizzato per esplorare le strutture cristallografiche, calcola l’interazione di probe con forma e carica propria, con un legame ad idrogeno predefinito, all’interno di una griglia. Questi probe sono stati accuratamente parametrizzati valutando le loro

Documenti correlati