• Non ci sono risultati.

Progettazione di inibitori innovativi per la Farnesil Pirofosfato sintasi

N/A
N/A
Protected

Academic year: 2021

Condividi "Progettazione di inibitori innovativi per la Farnesil Pirofosfato sintasi"

Copied!
103
0
0

Testo completo

(1)

1

UNIVERSITÀ DI PISA

Facoltà di Farmacia

CORSO DI LAUREA IN CHIMICA E TECNOLOGIA FARMACEUTICHE

TESI DI LAUREA

PROGETTAZIONE

DI

I

NIBITORI

I

NNOVATIVI PER LA

FARNESIL PIROFOSFATO SINTETASI

RELATORI:

Prof. Adriano Martinelli

Dott.ssa Gabriella Ortore

CANDIDATO:

(2)

2

Sommario

CAPITOLO 1 ... 4 INTRODUZIONE ... 4 PrenilTransferasi ... 4 FarnesilPirofosfatoSintetasi ... 8 Bifosfonati ... 12 Derivati dell'IPA ... 14 Introduzione al progetto ... 15 Bibliografia ... 17 CAPITOLO 2 ... 18 METODI ... 18 Docking ... 18 Virtual screening ... 20 PROGRAMMI UTILIZZATI ... 20 Chimera ... 20 Maestro ... 21 Gold ... 22

ANALISI DEI RISULTATI DI DOCKING ... 31

AUTODOCK ... 31 Rocs ... 39 FLAP ... 39 Bibliografia ... 47 CAPITOLO 3 ... 49 PARTE SPERIMENTALE ... 49

PREPARAZIONE DELLE PROTEINE E DEI LIGANDI ... 49

DOCKING ... 51

DOCKING DI MOLECOLE NOTE... 57

VIRTUAL SCREENING ... 58

Virtual Screening work-flow: ... 64

BIBLIOGRAFIA ... 65

CAPITOLO 4 ... 66

DISCUSSIONE DEI RISULTATI ... 66

Analisi grafica dei cristalli ... 66

Analisi del docking ... 70

(3)

3 CAPITOLO 5 ... 102 CONCLUSIONI ... 102

(4)

4

CAPITOLO 1

INTRODUZIONE

L'enzima Farnesildifosfatosintetasi o Farnesilpirofosfatosintetasi (FPPS), appartenente alla famiglia delle preniltranferasi, è stato identificato nell’ultimo decennio come target interessante sia per farmaci antitumorali che antinfettivi. Come tutte le preniltransferasi, catalizza l’aggiunta di una unità isoprenilpirofosfato (IPP) a una catena preesistente di isoprenoide, nel caso specifico, la FPPS permette l’attacco di una molecola di IPP sul geranilpirofosfato producendo farnesilpirofosfato.

Dal punto di vista farmaceutico, la FPPS ha guadagnato notevole importanza nel trattamento di malattie ossee maligne e nell’inibizione dell'eccessivo riassorbimento osseo correlato a certe patologie. Inoltre gli inibitori della FPPS hanno mostrato durante la ricerca preclinica una attività antitumorale in diversi tipi di tumori umani. Per il suo ruolo nella biosintesi dell'ergosterolo, l’enzima FPPS è risultato interessante come bersaglio per la ricerca di nuovi farmaci per la malattia di Chagas, la leshmaniosi e per diverse malattie tropicali che influenzano circa 10 milioni di individui.1

Essendo coinvolto in svariate funzioni, le cui conseguenze fisiologiche non sono ancora del tutto chiare, la FPPS ha stimolato gli studiosi alla ricerca di nuovi analoghi del suo substrato come strumenti per verificare identità, struttura, meccanismo e funzione dell’enzima.

PrenilTransferasi

Le preniltransferasi sono una famiglia di enzimi in grado di trasferire gruppi allilici a molecole accettrici.

Sono note ad oggi tre classi di enzimi preniltransferasi: isoprenilpirofosfatosintasi, preniltransferasi proteiche e terpene ciclasi. I prodotti di questi enzimi sono ampiamente distribuiti in natura e hanno diverse funzioni biologiche.

Le isoprenilpirofosfatosintasi catalizzano l'estensione di unità di isoprene, portando alla formazione di polimeri isoprenoidi lineari con lunghezza della catena ben definita. Questi polimeri possono servire come trasportatori lipidici o essere utilizzati per la biosintesi della parete cellulare, ma per molti di questi polimeri la funzione biologica è ancora sconosciuta.

(5)

5 Le preniltransferasi proteiche catalizzano il trasferimento di un isopreniledifosfato ad una proteina o ad un peptide. Questi prodotti sono coinvolti in specifiche vie di trasduzione del segnale, alcune implicate anche nella oncogenesi.

Pur avendo due funzioni ben distinte, entrambe queste classi di enzimi si basano sulla biosintesi dell’isopentiledifosfato (IPP) e del dimetilallildifosfato (DMAPP), prodotte dal ciclo di biosintesi del mevalonato.

L’acido mevalonico ha un ruolo importante nella sintesi del colesterolo, dei carotenoidi, degli steroidi e di altri ormoni.

Figura 1.1 : struttura acido mevalonico

La sintesi del mevalonato ha inizio con due molecole di acetil-CoA che vengono condensate a formare acetoacetil-CoA , che a sua volta viene fatto condensare con una terza molecola di acetil-CoA a dare l'intermedio a sei atomi di carbonio β−idrossil−β−metilglutaril−CoA in sigla HMG-CoA.

Figura 1.2 : reazione di formazione HMG-CoA

Questi primi due passaggi sono catalizzati rispettivamente dall’enzima tiolasi e HMG-CoAsintetasi.

La terza reazione è la riduzione di HMG-CoA a mevalonato in cui due molecole di NADPH donano due elettroni; questa tappa è definita di “comando”, in quanto determina la velocità di reazione. L'enzima HMG-CoA reduttasi è una proteina integrale di membrana del reticolo endoplasmatico liscio ed un importante sito di controllo della sintesi del colesterolo2.

(6)

6 Figura 1.3 : riduzione a Mevalonato

Successivamente il mevalonato viene convertito in 3-isopentenil pirofosfato mediante tre reazione consecutive, che richiedono ATP. In questa tappa tre gruppi fosfato vengono trasferiti da tre molecole di ATP al mevalonato. Il gruppo fosfato legato al gruppo ossidrilico sul C-3 del mevalonato nell'intermedio 3-fosfo-5-pirofosfomevalonato è un buon gruppo uscente; infatti nella tappa successiva, questo gruppo fosfato e il gruppo carbossilico vicino vengono liberati, portando alla formazione di un doppio legame nel prodotto a cinque atomi di carbonio: il Δ3-isopentenil pirofosfato.

(7)

7 Questa è la prima unità isoprenica attivata, necessaria per la sintesi del colesterolo. La seconda unità isoprenica attivata si ottiene tramite isomerizzazione del Δ3-isopentenil- pirofosfato a dimetilallil-pirofosfato.

Figura 1.5: ciclo del mevalonato

Preniltransferasi di classe I: isoprenilpirofosfatosintasi.

Catalizzano l'allungamento di substrati allilici difosfati come il DMAPP tramite reazioni di condensazione consecutive con IPP, che possono procedere verso un trans- o un cis- allungamento della catena.

Nel primo caso la reazione ha inizio con l’eliminazione dello ione pirofosfato dal difosfato allilico, generando un catione allilico. L'aggiunta di IPP avviene tramite la rimozione stereospecifica di un protone per generare un nuovo legame C-C. La ripetizione di questa reazione di condensazione porta a catene preniliche di varia lunghezza.

Nel caso della cis- elongazione il meccanismo di reazione non è ancora stato ben compreso.

Fanno parte di questa classe di preniltransferasi 4 sottoclassi basate sulla lunghezza e sulla sterochimica dell'isoprenoide, sui requisiti catalitici dell'enzima e sulla sua struttura.

(8)

8 La prima sottoclasse contiene enzimi che catalizzano la sintesi di composti a catena corta come la farnesildifosfato (FPP), oggetto di questa Tesi, e la geranilgeranildifosfato (GGPP). Il solo requisito per la funzione catalitica di questi enzimi è la presenza di un ione metallico bivalente come il Mg+2 o il Mn+2. La seconda e terza sottoclasse sintetizzano catene di media e lunga dimensione in configurazione trans. La quarta sotto classe catalizza allungamenti in configurazione cis.

Preniltransferasi di classe II: preniltransferasi proteiche

Questi enzimi catalizzano l'attaccamento post translazionale di FPP o GGPP al residuo carbossi terminale di una cisteina mediante un legame tioestereo. Ciò consente di localizzare le proteine di membrana coinvolte nella trasduzione del segnale. Alcune preniltransferasi riconoscono il residuo C-terminale cisteinico localizzato in una sequenza -CAAX e altre invece lo riconoscono nelle sequenze -CXC, -CXXC o -CC.

Le reazioni catalizzate da questa classe di preniltransferasi sono di notevole studio perchè hanno implicazioni sia in oncogenesi che in infezioni parassitarie.

Preniltransferasi di classe III: Terpene ciclasi

A questa categoria appartengono enzimi in grado di promuovere la ciclizzazione di isoprenoidi via carbocatione intermedio, senza quindi l’intervento di IPP. Ne è un esempio lo squaleneciclasi , responsabile della sintesi del colesterolo a partire da due molecole di FPP.

FarnesilPirofosfatoSintetasi

La FPPS è un enzima omodimerico con subunità di 41 KDa3 identificato oltre che nei mammiferi, anche nei funghi, nelle piante e nei protozoi, che svolge un ruolo chiave nella via biogenetica del mevalonato.

Quest'ultimo è un importante intermedio del metabolismo, sia animale che vegetale, di tutti gli eucarioti superiori e di molti batteri, che porta alla sintesi di colesterolo, carotenoidi, steroidi, terpeni ed altre sostanze con ruoli fisiologici4. La sintesi del mevalonato è un importante target per il trattamento del cancro e di malattie cardiovascolari

La FPPS fu scoperta nel 19595, e grazie a ciò la conoscenza della prenilazione delle proteine negli osteoclasti è progredita in modo significativo, fornendo una parziale comprensione sia della loro cinetica di reazione, che dei meccanismi catalitici6.

(9)

9 I primi studi biochimici hanno dimostrato che le reazioni catalizzate dalla FPPS sono Mg+2 o Mn+2 dipendenti, e che seguono un meccanismo complesso di terzo ordine nel quale il substrato allilico si lega prima all'enzima, portando alla formazione di un carbocatione allilico che successivamente determina la formazione dell'omologo substrato allilico a catena più lunga con rilascio di pirofosfato (PPi). Per comprendere meglio questo meccanismo sono state utilizzate diverse forme di FPPS rispetto a quella umana, ma ognuna di esse con una certa sequenza identica rispetto alla hFPPS: in particolare sono state usate le strutture cristallizzate di FPPSaviaria (42 kDa, 69% di sequenza identica all'enzima umano), e le strutture di FPPS da E. coli (32 kDa, 25% della sequenza uguale a hFPPS) e S. aureus (32 kDa, con 27% identico a hFPPS).

Grazie a queste strutture cristallizzate di FPPS si sono potute analizzare le diverse conformazioni dell'enzima, il numero di siti metallici e il tipo di legame con il substrato allilico.

Le strutture cristallografiche ad oggi risolte e presenti sul Protein Data Bank sono 56, di cui ben 33 umane complessate con bifosfonati e ammino-bifosfonati, o con acidi carbossilici ad attività allosterica.

Le diverse conformazioni dell' hFPPS

I primi studi effettuati sull'enzima umano hanno evidenziato la presenza di tre eliche corte, denominate α-1, α-2 e α-3, inserite tra l'elica H e I (Fig.2). Inoltre è stato dimostrato che FPPS umana si dispone in tre diversi conformazioni a differenza degli altri omologhi enzimi.

Figura 1.6: struttura del sito attivo di FPPS sia in conformazione aperta (verde) che in conformazione completamente chiusa (blue). E’ possibile vedere la posizione del zoledronato e dell'IPP nel sito attivo, colorati rispettivamente di arancione e giallo.

Infatti l'hFPPS si può evidenziare nella conformazione aperta (simile a quella dell'aviaria FPPS), nella conformazione parzialmente chiusa ed in quella totalmente chiusa (simile alla struttura di FPPS di E.coli). Entrando nello specifico di queste tre conformazioni si è notato che ognuna svolge un una particolare funzione nella sintesi del mevalonato ed in particolare :

(10)

10

La conformazione aperta facilita il rilascio del prodotto e supporta l'allungamento della catena consentendo il trasloco del GPP al sito allilico, in modo da poter avere un legame con una nuova molecola di IPP per la sintesi della FPP .

La conformazione parzialmente chiusa, causata invece dall'occupazione del sito di legame allilico,

conferisce al sito di legame dell'IPP la forma adeguata per il suo ingresso. Questo controlla l’ordine di accesso dell’IPP e del DMAPP.

La conformazione completamente chiusa è determinata dall'occupazione del sito di legame dell' IPP, ed

è la forma attiva, in quanto sia IPP che DMAPP sono orientati correttamente per la reazione. Inoltre la conformazione chiusa protegge l'intermedio di reazione dall'acqua.

Figura 1.7: rappresentazione della superficie durante il ciclo catalitico della FPPS. a) conformazione aperta; b) conformazione parzialmente chiusa; c) conformazione completamente chiusa, in quest'ultima è possibile intravedere una porzione di IPP.

Il rilascio del pirofosfato dal substrato allilico induce la destabilizzazione della conformazione chiusa con passaggio alla conformazione aperta e quindi alla ripresa di un nuovo ciclo metabolico.

Meccanismo enzimatico della farnesilpirofosfatosintetasi

L'enzima FPPS catalizza l'allungamento della catena a partire da una molecole di isopentenil-pirofosfato (IPP) e da una di dimetilallil-pirofosfato (DMAPP) per portare alla formazione del geranil-difosfato (GPP). Questo rappresenta il primo di tre step del meccanismo che porterà alla formazione del farnesil-pirofosfato.

(11)

11 Il meccanismo chimico per l'accrescimento della catena sembra essere una alchilazione elettrofila con meccanismo dissociativo. Durante la reazione il legame ossigeno-C1 del DMAPP si rompe per generare un catione allilico, stabilizzato per risonanza, che interagisce con il doppio legame dell'IPP per produrre un carbocatione terziario. Successivamente viene eliminato un idrogeno dal C2 del isopentenil-difosfato per dare un nuovo difosfatoallilico che non è nient'altro che il substrato di partenza allungato di una unità isoprenica. Il secondo step vede la formazione del farnesil-pirofosfato a partire da geranil-pirofosfato e IPP, con un meccanismo identico al precedente7.

Figura 1.9: secondo step che porta alla formazione della FPP. È lo stadio lento che determina la velocità di reazione.

Il Farnesil-difosfato, cosi ottenuto può essere utilizzato per la sintesi dello squalene e cosi successivamente del colesterolo, oppure può dar origine a proteine farnesilate o ancora tramite l’enzima

geranilgeranil-difosfatosintetasi portare alla formazione del GGPP.

Il GGPP può essere prodotto anche tramite l'ultimo step della reazione catalizzata dall’enzima FPPS, che vede un ulteriore allungamento della catena, utilizzando come substrato allilico il FPP che va a reagire con il doppio legame del IPP con conseguente formazione del geranilgeranil-pirofosfato8.

(12)

12

Bifosfonati

Scoperti alla fine degli anni ‘60, sono analoghi sintetici e non idrolizzabili dell’IPP. Essendo capaci di legare ioni metallici bivalenti come il Ca++, i bifosfonati (BPs) sono rapidamente rimossi dal circolo e legano in vivo la superficie delle ossa in siti di rimodellamento attivo, in particolare nelle aree di riassorbimento della matrice ossea da parte degli osteoclasti. Il rilascio localizzato durante il riassorbimento della matrice ossea e l'efficace assorbimento negli osteoclasti per endocitosi spiegano l'effetto altamente selettivo dei BPs sugli osteoclasti, dove agiscono inibendo l'azione di osteolisi, senza escludere la possibilità che piccole quantità di questi farmaci siano internalizzati da cellule vicine, come osteoblasti o cellule tumorali, soprattutto in terapie prolungate.

Figura 1.11 : Schema illustrativo sul normale turnover osseo (A) e sul turnover indotto da patologie (B)

Questa classe di farmaci, come l’Etidronato, sono utilizzati per il trattamento dell'osteoporosi, della malattia ossea di Paget e per l'ipercalcemia maligna. Il meccanismo principale con cui i BPs sembrano inibire il riassorbimento della matrice ossea è l'induzione di apoptosi negli osteoclasti dovuta alla trasformazione dei BPs in metaboliti tossici dell'ATP.

(13)

13 Figura 1.12: alcuni esempi di BPs.

La seconda generazione di bifosfonati è invece rappresentata da bifosfonati contenenti azoto (N-BPs), come il pamidronato, alendronato e risedronato, molto più attivi dei semplici BPs, non metabolizzati ad analoghi tossici dell'ATP e attivi per inibizione dell'enzima FPPS.

Figura 1.13: alcuni esempi di N-BPs.

La differenza di meccanismo d’azione fu ipotizzata grazie all’evidenza che piccole modifiche alla struttura e alla conformazione della catena laterale che erano note influenzare la potenza dei N-BPs come inibitori del riassorbimento, avevano mostrato la capacità di influenzare anche l'inibizione della FPPS9.

(14)

14 Figura 1.14: meccanismo di inibizione della FPPS ad opera dei BPs.

Da sottolineare la notevole differenza di potenza fra BPs e N-BPs, di diversi ordini di grandezza. L’inibizione della FPPS avviene a concentrazioni nanomolari o addirittura picomolari, come nel caso del zoledronato.

Studi preclinici rivelano, oltre alla loro azione sul riassorbimento osseo, una azione antiangiogenica dei N-BPs. Purtroppo negli ultimi anni, grazie anche alla segnalazione spontanea, sono emersi alcuni problemi rari, ma potenzialmente gravi, legati all'uso di questi farmaci. Fra questi vi sono i problemi d'osteonecrosi della mascella, i rischi oculari, l'insufficienza renale acuta e le gravi ipocalcemie. I bifosfonati inibiscono, infatti, il riassorbimento osseo mediato dagli osteoclasti, riducendo così la concentrazione del calcio a livello serico. L'iperparatiroidismo compensatorio secondario solitamente evita l'instaurarsi di una significativa ipocalcemia aumentando il riassorbimento renale di calcio, la produzione di vitamina D, e il riassorbimento osseo da parte degli osteoclasti. Tuttavia in alcuni casi questo meccanismo di compensazione può essere bloccato e il risultato possono essere gravi ipocalcemie.

Derivati dell'IPA

Una recente ricerca condotta dall’Università di Salerno in collaborazione con il nostro Dipartimento ha evidenziato la possibile inibizione della FPPS da parte della N6-isopenteniladenosina (IPA) e dei suoi derivati, che sono risultati efficaci nel trattamento e nel blocco della crescita di cellule tumorali a livello tiroideo10.

(15)

15 Figura 1.15: N6-isopenteniladenosina

N6-isopenteniladenosina fa parte della famiglia delle citochinine che regolano sia la crescita che la differenziazione cellulare. Sono presenti nelle cellule di mammifero sia in forma libera che legate al t-RNA11. L' IPA arresta la proliferazione delle cellule tumorali arrestando il ciclo cellulare nella fase G0-G1, presumibilmente mediante l'inibizione della FPPS e delle proteine di prenilazione, mentre una aggiunta di farnesolo promuove la crescita delle cellule tumorali.

Questi effetti di IPA non sono mediati dai recettori per l'adenosina ma sono dovuti ad una diretta modulazione dell'attività enzimatica della FPPS, conseguente all’assorbimento della citochinina all'interno delle cellule, e quindi una inibizione della prenilazione delle proteine adibite alla proliferazione cellulare. Il meccanismo d’azione però resta tutt’oggi non completamente chiaro.

Lo studio farmacologico è stato effettuato in vivo su dei nude mouse, dove erano state impiantate a livello sottocutaneo delle cellule KiMol (cellule tiroidee di ratto modificate in vitro con un agente oncogeno). Dopo il trattamento con IPA i topi mostravano una drastica riduzione della massa tumorale.

La mancanza di dati sperimentali definitivi e univoci sul legame fra IPA e FPPS impedisce al momento una chiara definizione del meccanismo di azione dei derivati adenosinici, ma gli studi preliminari lasciano presumere una possibile sovrapposizione di target fra N-BPs e IPA. Nasce così il progetto di questa Tesi, finalizzata a sondare dal punto di vista teorico la possibile interazione di IPA con FPPS, sia come inibitore diretto che allosterico. Il progetto è volto a stabilire se, in particolare, la porzione ribosidica possa sostituire quella bifosfonica nel legame con l’enzima e a disegnare nuovi possibili inibitori privi di effetto sequestrante del calcio.

Introduzione al progetto

Il progetto ha come scopo lo studio di nuovi potenziali inibitori della FPPS, in particolare focalizzando la ricerca su analoghi della IPA. Essendo uno studio pionieristico, la prima fase è volta allo studio delle possibili interazioni fra la IPA e l’enzima, ipotizzando il binding mode sulla base dei dati cristallografici presenti in

(16)

16 letteratura. La procedura di calcolo utilizzata viene validata tramite la previsione dei dati biologici relativi a inibitori noti. Successivamente si passa alla fase di drug design razionale, in cui le informazioni evinte dal docking vengono utilizzate per ideare nuove strutture, bifosfonati e non, che presentino le caratteristiche chimiche e morfologiche adeguate all’interazione con la FPPS. Questa fase è condotta in modo automatico, utilizzando tecniche di virtual screening di database commerciali. Parallelamente, si opera una ottimizzazione delle strutture note inserendo nuovi sostituenti e/o variando gli scaffold preesistenti, al fine di proporre nuove molecole da sintetizzare e testare come inibitori della FPPS.

Possiamo quindi suddividere il progetto di Tesi come segue:

fase esplorativa, in cui è stata effettuata l’analisi delle strutture tridimensionali dell’enzima in complesso con inibitori allosterici e non, valutando la possibilità che la IPA potesse realmente interagire con gli stessi siti di legame presenti nei cristalli. Particolare attenzione è stata rivolta al ruolo degli atomi di metallo presenti e alla loro coordinazione. Il supporto informatico in questa fase è stato essenzialmente il programma Chimera.

fase sperimentale, in cui è stata messa a punto e validata la procedura di calcolo per il docking e la strategia ligand based per lo screening di database molecolari. Sono stati utilizzati i programmi Gold, Autodock, Maestro, ROCS e FLAP.

fase di elaborazione dei risultati, in cui dal confronto fra i binding mode dei ligandi noti e dei derivati dell’IPA sono state ipotizzate le interazioni chiave per l’attività biologica e individuate nuove molecole da sottoporre a test enzimatici.

(17)

17

Bibliografia

1. Lindert S., Zhu W., McCammon J.A.,Farnesyl diphosphate synthase inhibitors from in silico screening., Chem. Biol. Drug Des., 2013, 81, 742-748.

2. Nelson D. L., Cox M. M., I principi di biochimica di Lehninger, quinta edizione, 840-848.

3. Rondeau J. M., Bitsch F.,Bourgier E., et al.,Structural Basis for the Exceptional in vivo Efficacy of Bisphosphate Drugs, Chem. Med. Chem., 2006, 1, 267-273.

4. Sacchettini J. C., Poulter C. D.,Creating isoprenoid diversity, Science, 1997, 277, 1788-9.

5. Lynen F., Agranoff B. W., Eggerer H., et al., Gamma-gamma-dimethyl-allyl-pyrophophate and geranyl-pyrophophate, biological preliminary stages of squalene. Angew Chem. Int., 1959, 71, 657-63.

6. Liangh P.H., Reaction Kinetics, catalytic mechanisms, conformational change, and inhibitor design for prenyl transferases, Biochemistry, 2009, 48, 6562-70.

7. Poulter C. D.,Farnesyl diphosfate synthase. A paradigm for understanding structure and function relationship in E-polyprenyl diphosphate synthase. Phytochemistry Rewiews, 2006, 5, 17-26.

8. Ohno K., Mori K., Orita M. and Takeuchi M., Computational Insights into Binding of Bisphosphates to Farnesyl Pyrophosphate Synthase, Current Medicinal Chemistry, 2011, 18, 220-233.

9. Ebetino F. H., Rozè C. N. etc.,Molecular interactions of

nitrogen-containingbisphosphonateswithinfarnesyldisphosphatesynthase, J.of Org. metallic Chem., 2005, 690, 2679-2687.

10. Laezza C.,Minutolo F., Macchia M., etc., N6-isopentenyladenosine arrest tumor cell proliferation by inhibiting farnesyl diphoshate synthase and protein prenylation, FASEB J., 2006, vol. 20, 412-418.

11. Colombo F, Falvella F. S., etc.,Pharmaco genomics and analogues of the antitumor agent N6-isopenteniladenosina, Int. J. Cancer, 2009, 124, 2179-2185.

(18)

18

CAPITOLO 2

METODI

Docking

Il docking molecolare è una tecnica computazionale che consente di predire l'orientamento di una molecola (proteina) verso una seconda (proteina o ligando), quando queste si legano tra loro per formare un complesso stabile.

Generalmente viene usato per predire l'orientamento di una molecola farmacologicamente attiva nella sua proteina bersaglio, così da poter prevedere l'affinità e l'attività della stessa.

Si deduce, perciò, che il docking è un metodo che gioca un ruolo importante:  Nella progettazione razionale di nuovi farmaci;

 Nel miglioramento di ligandi già noti ma dei quali non è noto il meccanismo d’ interazione;  Nello studio dell'interazione tra proteine.

La maggiore difficoltà di questa metodica di investigazione chimica consiste nella variazione strutturale reciprocamente indotta dall’interazione tra le molecole.

In ogni schema di docking devono essere bilanciati due aspetti conflittuali: avere una procedura accurata e mantenere la richiesta computazionale a livelli ragionevoli. La procedura ideale dovrebbe trovare il minimo globale nelle energie di interazione tra il substrato e la proteina target, esplorando tutti i gradi di libertà possibili per il sistema.

A differenza del docking manuale in cui la valutazione dell’energia è piuttosto sofisticata e l’esplorazione delle varie configurazioni è limitata, nel docking automatico si ha una vasta esplorazione delle varie configurazioni al costo di metodi abbastanza semplici per la valutazione dell’energia.

Il successo di un processo di docking dipende, sostanzialmente, da due principali fattori: l’algoritmo di ricerca e la funzione di score. L’algoritmo di ricerca permette di attuare la simulazione delle conformazioni all’interno del sito di legame con la proteina, mentre la funzione di score si occupa di attribuirne un punteggio attraverso un complesso sistema di variabili.

Quando più strutture cristallografiche sono disponibili, sono possibili due differenti modalità di docking: il self-docking, cioè lo studio dell’interazione di un ligando cristallizzato all’interno del proprio sito di legame, ed il cross-docking che comporta il calcolo delle orientazioni di ogni ligando cristallizzato all’interno di tutte le proteine cristallizzate. La prima tipologia consente di selezionare la procedura di calcolo più consona, cioè la scelta delle scoring function e dei parametri di conto che consentono di riprodurre l’orientazione dei composti

(19)

19 cristallizzati. La seconda permette di identificare anche la struttura cristallografica più adeguata fra tutte quelle disponibili per eseguire i docking di diverse tipologie di ligandi.

.

Rispetto al self-docking, il cross-docking può essere di supporto nella verifica di quanto gli studi di docking possano appoggiare efficientemente l’identificazione dei lead oppure gli studi per arrivare alla SAR (Relazione Struttura Attività), dove informazioni sulla struttura dei ligandi d’interesse non sono sperimentalmente disponibili. In questo caso il ligando di interesse viene analizzato all’interno di una proteina che normalmente è complessata con una molecola differente1.

A livello pratico tale procedura è spiegabile attraverso esempi come quello riportato nella figura successiva:

Figura 2.1: Schema illustrativo della simulazione di un cross-docking.

Prendendo in esame un’ipotetica serie di quattro complessi, effettuare il cross-docking significa simulare una situazione in cui ogni proteina “ospiti” non solo il calcolo di docking per il ligando con cui è stata cristallizzata, ma a turno anche gli altri ligandi. Questo, naturalmente deve avvenire per tutte le proteine, per cui la situazione riportata nello schema andrà porterà ad un numero reale delle simulazioni, con relativi valori di rmsd, pari al quadrato del totale di complessi posseduti.

Tra i programmi maggiormente utilizzati per effettuare il docking si annovera Gold, che conta un vario set di funzioni di score, con la possibilità di personalizzarle o addizionarle. Un altro programma è AutoDock; questo mette a disposizione più algoritmi di ricerca, di effettuando il calcolo dello score tramite la valutazione delle interazioni del ligando con una griglia precalcolata.

(20)

20

Virtual screening

Il Virtual Screening (VS) è una tecnica di calcolo che viene sempre più frequentemente utilizzata nella ricerca di nuovi candidati farmaci. Si tratta di una rapida valutazione in silico di grandi librerie di composti al fine di individuare quelle strutture chimiche che hanno più probabilità di legarsi ad un preciso target molecolare, tipicamente un recettore o un enzima. Il VS è ormai diventato parte integrante del processo di scoperta di molecole promettenti, in quanto è in grado di rispondere alle richieste di molti ricercatori, che hanno l’esigenza di ridurre i costi, filtrando database di migliaia di composti, per riuscire ad ottenere un numero gestibile di molecole da sintetizzare, acquistare ed testare2.

Quando si è in possesso di uno o più ligandi attivi e di un database 3D di composti, è possibile procedere con la ricerca delle corrispondenze tra l’ipotesi alla base dell’attività e le molecole che si vogliono analizzare.

Esistono principalmente due tipi di approcci per il VS:

1. “ligand-based”, che usa una procedura di screening basata su criteri di somiglianza con molecole conosciute che si legano alla proteina target.

2. “receptor-based”, che fornisce potenziali composti attivi sulla base della struttura 3D della proteina. Spesso, come nel corso di questo lavoro, viene utilizzata nella prima fase una procedura ligand-based, più veloce e adeguata a filtrare un numero ingente di molecole, mentre nella seconda fase si opta per un approccio

receptor-based, più accurato, per raffinare i risultati.

Le fasi principali, che costituiscono tre “filtri” consecutivi, sono:

1. selezione per similarità di struttura rispetto alle molecole più attive; 2. Docking delle molecole “filtrate” nella FPPS;

3. selezione qualitativa delle molecole che formano interazioni con i residui chiave del sito di legame.3

PROGRAMMI UTILIZZATI

Chimera

UCSF Chimera4 è un programma altamente versatile per la visualizzazione interattiva e l’analisi di strutture molecolari e dei relativi dati. Esso ci permette di esaminare graficamente le strutture tridimensionali di macromolecole quali recettori, enzimi, acidi nucleici, ed eventuali ligandi loro complessati. Chimera consente inoltre di allineare sequenze proteiche simili, di visionare i risultati di docking, di elaborare e mettere in evidenza anche singoli dettagli di una precisa struttura molecolare, e di ricavare immagini e animazioni di alta

(21)

21 qualità. Chimera include una completa documentazione e diversi tutorial, e può essere scaricato gratuitamente per accademici, governativi, senza scopo di lucro, e per l'uso personale.

Nell’ambito di questa tesi il programma ha ricoperto un ruolo di base fondamentale, in quanto non solo ha permesso la visualizzazione dei ligandi all’interno del complesso con la proteina, ma ha fornito i mezzi necessari, in combinazione con Maestro5 (vedi Capitolo 2.2), per la preparazione dei file di input per la valutazione della miglior procedura di docking. Questo è stato possibile mediante una corretta pulizia dei file PDB ottenuti dalla banca dati RCSB6, che contiene informazioni sui raggi X della maggior parte delle macromolecole note in letteratura. Una volta aperto il file del complesso ligando-proteina di nostro interesse le operazioni che sono state rese necessarie riguardano la selezione di quelle parti che non devono essere presenti negli input finali che dobbiamo creare. Nel nostro caso specifico si tratta di eliminare gli ioni complessati (generalmente SO4--), oppure semplicemente di rimuovere le molecole d’acqua.

Fatto questo, i complessi possono essere elaborati in maniera tale da mettere in mostra le parti che ci interessano, ad esempio evidenziando la struttura secondaria della proteina, lo scheletro atomico di ligando e\o proteina oppure semplicemente il colore o un’etichetta con informazioni su residui o altro. Chimera, inoltre, consente di allineare tra di loro le proteine secondo la comune sequenza di aminoacidi, prendendo come riferimento una struttura a nostra scelta e sovrapponendo le altre per similitudine. Per avere una visuale ristretta di una sola parte della struttura, per esempio sul sito di legame, è possibile utilizzare il comando (Select >

Zone) per selezionare soltanto gli elementi che stanno oltre una certa distanza, al di fuori del range d’interesse,

ed ometterli graficamente.

Chimera, infine, si è rivelato molto utile per la visualizzazione rapida dei risultati provenienti dal docking e per la valutazione delle interazioni (legame ad idrogeno) con la proteina di riferimento. Tutti questi dati o modifiche apportate sono memorizzabili e rivisitabili all’interno di opportune sessioni oppure è possibile estrarre le singole strutture e salvarle nel formato desiderato.

Maestro

Maestro 9.0 è l'interfaccia utente grafica (GUI) per tutti i programmi di calcolo della suite Schrödinger.Esso contiene strumenti per la creazione, la visualizzazione e la manipolazione di strutture chimiche, permettendo l'organizzazione e la memorizzazione di queste e dei dati associati. L'interfaccia di Maestro utilizza gli strumenti di grafica OpenGL, può sfruttare le funzionalità dell’hardware grafico, comprese le capacità di visualizzazione stereo, ed è in grado di girare sulle piattaforme Linux e Windows. Maestro è un programma gratuito, facile da usare e completo di ambiente di elaborazione molecolare che, se accoppiato con software

(22)

22 Schrödinger come Glide, Prime o Phase può diventare un potente strumento per interpretare, gestire e condividere i risultati degli esperimenti computazionali.

Gold

Gold7 (Genetic Optimisation for Ligand Docking) è un programma di calcolo di docking prodotto dalla collaborazione tra l’Università di Sheffield, la GlaxoSmithKline plc e il CDCC (Centro Dati di Cristallografia di Cambridge). Gold è stato testato e completamente validato attraverso 305 diversi modelli, altamente verificati, contenenti complessi tra proteina e ligando estratti dal database della CCDC. Da quest’analisi è emerso che nel 70-80% dei casi il programma riesce a fornire come migliori soluzioni delle ipotesi che, se confrontate con i dati sperimentali, risultano essere precise ed accurate. Come tutti i principali programmi di docking il successo della procedura dipende da due principali fattori:

L’algoritmo di ricerca. La funzione di score.

Gold sfrutta come metodo di ricerca l’Algoritmo Genetico, grazie al quale è possibile analizzare le possibili interazioni variando le conformazioni in maniera del tutto analoga a come in natura avvengono le modificazioni dei geni. Il concetto è quello delle mutazioni puntiformi casuali che portano alla formazione di nuove popolazioni, che corrispondono praticamente al cambiamento dei torsionali. Per quanto riguarda invece le funzioni di score, esse ci servono per attribuire un punteggio ai risultati, e si basano sulla valutazione delle forze di interazione dei legami non covalenti. Gold, in questo caso, conta un vario set di funzioni di score, tra cui Goldscore, Chemscore, ASP, PLP, ed inoltre offre la possibilità di modificare quest’ultime o di inserire ex-novo funzioni personalizzate.

Tutti questi parametri possono essere definiti attraverso l’apposita finestra che compare all’apertura del programma (Figura 2.2).

(23)

23 Figura 2.2: Menù di Gold 3.1.

Il menù è composto principalmente da 4 pannelli, ognuno dei quali racchiude tutta una serie di impostazioni fondamentali per il lancio del calcolo di docking. I diversi pannelli sono:

a. Control

b. Input Parameters and Files c. Fitness Function Settings d. Genetic Algorithm Parameters

(24)

24 All’interno di tale pannello sono presenti una serie di pulsanti:

Run inizia un calcolo di docking.

Settings offre una scelta dei parametri da impostare per l’algoritmo genetico.

Save&Exit salva i parametri correnti del file per un futuro utilizzo e chiude il frontale.

Submit&Exit inizia un processo in background e chiude l’interfaccia grafica del programma. Exit chiude il programma senza salvare i parametri impostati.

Configuration File legge e carica i parametri del file di configurazione. Il nome del file viene indicato nel box.

Help apre il documento di aiuto per l’utente.

b. Input Parameters and Files

Presenta una sequenza di pulsanti tra cui:

Protein permette di specificare il file di input della proteina.

Edit Ligand File List permette di selezionare i files di input del ligando.

Waters specifica le molecole di acqua. GOLD infatti permette di considerare anche la presenza di eventuali molecole di acqua.

Metals permette di specificare la geometria di coordinazione di eventuali metalli.

Set atom types controlla che i vari tipi di atomi possano essere impostati nel file di input o riconosciuti automaticamente dal programma, sia per quanto riguarda la proteina che per i ligandi.

Allow early termination se attivo, GOLD termina il docking del ligando secondo i criteri specificati. Define active site from permette di specificare la posizione del centro dei sito di legame.

Active site radius permette di specificare l’area del sito di legame espressa in Å.

Detect Cavity permette di rilevare la presenza di una o più cavità vicine al sito di legame.

Covalent permette di specificare l’eventuale presenza di legami covalenti tra la proteina ed il ligando. Output impone il controllo del formato e della struttura della directory di output.

(25)

25 c. Fitness Function Settings

Consiste di alcuni pulsanti tra cui:

GoldScore, ChemScore, User Defined Score permette di definire la fitness function da utilizzare. Fitness & Search Options utilizzato per impostare i criteri di flessibilità del ligando definendo, per

esempio, la possibilità di ruotare legami ammidici.

Edit Constraints permette di impostare delle costrizioni tra il ligando e la proteina stabilendo distanze, legami ad idrogeno, regioni idrofobiche e analogie nel modo di stabilire legami.

Constraints mostra il numero di constrizioni stabilite.

Number of Ligand Bumps consente al programma di permettere dei brevi contatti proteina-ligando, quando specificato dall’utente. Non può essere utilizzato se è impostata la scoring function ChemScore. Van der Waals permette di specificare le interazioni di van der Waals. Valido solamente se è

selezionata la funzione GoldScore.

Hydrogen Bonding permette di specificare i legami ad idrogeno. Valido solamente se è selezionata la funzione GoldScore.

d. Genetic Algorithm Parameters

Contiene i seguenti pulsanti:

Select GA Presets and Automatic Settings permette di specificare la velocità e l’accuratezza del processo di docking.

Number of Operations permette di specificare il numero totale di operazioni da eseguire in ogni calcolo di docking.

Migrate/Mutate/Crossover controlla la frequenza con cui avvengono queste tre tipi di operazioni. E’ raccomandato l’uso dei parametri di default offerti dal programma.

(26)

26 Il primo pannello riguarda principalmente i comandi basilari, come l’impostazione del nome del file di configurazione, le opzioni di salvataggio, di uscita, mentre gli altri tre servono al settaggio dei file di input, dell’algoritmo di ricerca e della scoring function che intendiamo utilizzare. Tramite il pannello dei parametri di input siamo in grado di selezionare la proteina (Protein dal menù), il ligando originale (che serve ad individuare la cavità del sito di legame) e il ligando dopo analisi conformazionale (Edit Ligand File List). Per quanto riguarda quest’ultimo, o quest’ultimi nel caso volessimo avviare un cross-docking, è necessario inserire il numero di simulazioni che s’intende far svolgere all’Algoritmo Genetico.

Successivamente si arriva alla scelta della funzione di score, come Chemscore, Goldscore, etc. ma è importante anche imporre delle restrizioni che riguardano la flessibilità del ligando tramite il comando:

Fitness and Search Options.

Scoring functions

Le scoring functions sono dei metodi matematici approssimati che vengono usati per predire l’interazione tra due molecole organiche, e sono suddivisibili generalmente in 3 tipologie: campi di forza (force-field), funzioni empiriche e le knowledge, funzioni basate su osservazioni statistiche.

Nei campi di forza le affinità sono stimate sommando le forze intermolecolari di Van der Waals e le interazioni elettrostatiche di tutti gli atomi delle due molecole nel complesso. Le funzioni empiriche, invece, si basano sul conteggio di vari tipi di interazione tra le due molecole, come il numero dei legami ad idrogeno, il numero dei contatti idrofobici (favorevoli e non) e il numero dei legami ruotabili immobilizzati nella formazione del complesso. In ultima analisi vi sono le funzioni basate sulla conoscenza e l’osservazione statistica delle interazioni intermolecolari ravvicinate in grandi database tridimensionali. Questo metodo è basato sull’assunzione che vi siano interazioni preferenziali tra certi tipi di gruppi funzionali o atomi.

Gold offre una buona scelta di funzioni di score, tra cui GoldScore, ChemScore, ASP (Potenziale Statistico Astex), PLP (Potenziali Lineare a tratti), nonché la possibilità per gli utenti più esperti di modificare una funzione esistente o implementare la propria.

(27)

27 Goldscore

Goldscore è una funzione che è stata ottimizzata per la predizione della posizione del ligando nel legame, piuttosto che per la predizione delle affinità di legame, ed è basata su quattro componenti:

L’energia dei legami ad idrogeno intermolecolari tra ligando e proteina. Le forze di Van der Waals intermolecolari.

Le forze di Van der Waals intra-molecolari del ligando. L’energie di tensione dei torsionali del ligando.

A queste è possibile aggiungere una quinta componente, rappresentata dalla considerazione eventuale dell’energia dei legami ad idrogeno intramolecolari.

Di default, il file di output conterrà un singolo termine di energia interna (Sint) dato dalla somma del valore di

internal torsion e di internal vdw.

Lo score assegnato da questa funzione è dato dalla somma delle componenti in termini di energia, però cambiata di segno (negativo); quindi valori più grandi indicano risultati migliori.

Il termine vdw external viene moltiplicato per il fattore 1,375 quando è terminato il calcolo di fitness score. Questa è una correzione empirica per favorire le interazioni idrofobiche tra la proteina ed il ligando.

GoldScore utilizza la funzione di Lennard-Jones per i contributi sia dell’energia di van der Waals tra la proteina

ed il ligando che di quella interna dello stesso:

6 12 ij ij ij ij vdw

r

B

r

A

E

dove Evdw = rappresenta l’energia dovuta alle interazioni di van der Waals tra atomi non legati (potenziale di

Lennard-Jones)8.

(28)

28 Chemscore

Chemscore7-8 è una funzione che è stata derivata empiricamente da un set di 82 complessi proteina-ligando dei quali erano state misurate e rese note le affinità di legame. A differenza di Goldscore, la funzione Chemscore è ottenuta attraverso calcoli di regressione rispetto ai valori di affinità misurata, non ci sono però indicazioni chiare su quale delle due funzioni sia la migliore nel predire le affinità.

Chemscore riesce a stimare le variazione di energia libera totale che incorre durante l’interazione secondo la formula:

ΔGbinding = ΔG0 + ΔGhbond + ΔGmetal + ΔGlipo + ΔGrot

Dove ΔG0 è il valore di partenza dell’energia libera del sistema, ΔGhbond è il contributo del legame ad idrogeno, ΔGmetal + ΔGlipo sono rispettivamente i contributi dati dal legame con ioni metallici e dall’interazione idrofobica, ed infine ΔGrot è il contributo di energia che si perde con il ‘congelamento’ di alcuni torsionali dovuto all’immobilizzazione della conformazione che si lega al recettore.

Chemscore utilizza delle block function per descrivere i termini di contatto di vario tipo; una block function ha la seguente forma: max max max max 0 0 . 1 1 ) , , ( x x if x x x if x x x x x x if x x x B ideal ideal ideal ideal ideal

Il termine relativo ai legami ad idrogeno viene calcolato come somma di tutte le possibili coppie donatore-accettore (D-A), indipendentemente che un atomo appartenga alla proteina e l’altro al ligando. Ogni termine della somma è il prodotto di tre block functions. Lo scopo delle block function è ridurre il contributo di un legame ad idrogeno in base a quanto la sua geometria devia dalla distanza ideale H…A, dall’angolo ideale D-H e dall’orientazione ideale rispetto all’atomo accettore. Il massimo contributo, all’interno della somma, di una data coppia A-D è 1; è il valore che si ottiene se il legame ad idrogeno ha la geometria ideale. Il contributo dei legami ad idrogeno viene calcolato secondo l’equazione seguente:

pairs acceptor donor all ideal ideal r ideal hbond B r r r B B

(29)

29 dove:

∆r, ∆rideal, ∆rmax e σγ sono i parametri della distanza D-H…A e formano la prima block function;

∆α, ∆αideal, ∆αmax e σα sono i parametri relativi all’angolo D-H…A e formano la seconda block function;

∆β, ∆βideal, ∆βmax e σβ indicano l’angolo D-H…A-X centrato su A, dove X è un atomo leggero legato

all’accettore. Questi ultimi parametri formano la terza block function che rappresenta la somma di tutti i possibili valori per una dato legame ad idrogeno.

Il coefficiente di regressione associato ai legami ad idrogeno (υ1) ha un valore di default di -3,34.

Il termine relativo al legame di un metallo viene calcolato come somma di tutte le possibili coppie ione-metallico…accettore (M…A). metals protein All metal ideal aM acceptor ligand All metal B r R R P ( , , max, )

Ogni termine dell’equazione è una block function che serve per ridurre il contributo dell’interazione M…A se la geometria non è quella ideale.

Il coefficiente di regressione associato (υ2) ha un valore, di default, di - 6,03. Anche il termine lipofilo è definito in maniera analoga:

atoms lipophilic ligand All atoms lipophilic protein All lipo ideal ll lipo B r R R P ( , , max, )

Gli atomi lipofili sono atomi non accettori di zolfo, atomi di carbonio non polari (atomi di carbonio polari sono quelli attaccati a due o più atomi polari), atomi di cloro, bromo, iodio non ionici. Il termine lipofilo ha un coefficiente di regressione (υ3) che di default ha un valore di - 0,117.

Quando un legame singolo, aciclico nel ligando diventa non-ruotabile, si ha una perdita entropica prot (Rotable-Bond Freezing term) che viene calcolata con la seguente formula:

r nl nl rot rot r P r P N p 2 )) ( ' ) ( ( ) 1 1 ( 1

Nrot è il numero di legami ruotabili “congelati” del ligando (un legame è considerato “congelato” se uno più

atomi o entrambi i lati del legame ruotabile è a contatto con la proteina). L’espressione è zero se non sono presenti legami ruotabili nel ligando. Pnl(r) e P’nl(r) sono le percentuali di atomi, diversi dall’idrogeno, non

(30)

30 I contatti (clash) tra la proteina e gli atomi del ligando e la tensione torsionale interna del ligando vengono aggiustati con delle penalità; queste penalità vengono incluse per prevenire geometrie poco significative nel docking.

Quando si forma un legame covalente la funzione Chemscore viene modificata riducendo il clash term in modo che non venga registrato nessun clash per contatti 1-2 e 1-3 intorno agli atomi di legame nella proteina e nel ligando; inoltre il termine torsionale viene aumentato per le parti ruotabili del legame.

ASP e Kinase Scoring Function

ASP9 è una funzione che calcola l’energia potenziale degli atomi derivando i contributi da un database di complessi proteina-ligando. Le funzioni di score tradizionali sono basate sui force-field, dove i parametri derivano da dati sperimentali su strutture e affinità di legame. ASP invece utilizza un approccio diverso, in quanto le informazioni sulla frequenza d’interazione tra ligando e proteina sono raccolte dall’analisi di complessi già esistenti e sono usate per generare una statistica sulle energie potenziali. Quindi, a seconda della tipologia della proteina è possibile creare un parametro ASP che sia personalizzato per quella famiglia specifica.

Potenziale Lineare a tratti (PLP)

PLP è una funzione di tipo empirico ottimizzata per la predizione delle poses corrette. Il Potenziale Lineare a tratti (fPLP) è usato per modellare la complementarità sterica tra proteina e ligando.

Il punteggio interno del ligando è calcolato considerando l’energia potenziale determinata dagli scontri tra gli atomi più pesanti (flig-clash) e, così come in Chemscore, esaminando il contributo dell’energia potenziale dei torsionali (flig-tors). Attraverso i contributi fchem-cov , fcons e fchem-prot questa funzione ha la possibilità di esaminare rispettivamente legami covalenti nel docking, di comprendere costrizioni nel calcolo come nel caso della presenza di molecole d’acqua ed infine di considerare le catene laterali di alcuni residui come flessibili.

(31)

31

ANALISI DEI RISULTATI DI DOCKING

La suite di Gold fornisce anche alcuni programmi per l’analisi dei risultati ottenuti dal docking, in particolare tramite il calcolo dello scarto quadratico medio (root mean square deviation: RMSD) fra la geometria risultante dal calcolo e quella sperimentale.

Questo valore è definito in Statistica come scarto quadratico medio e, per proprietà matematica risulta essere un valore sempre positivo. Data l’elevazione a potenza della differenza di valore tra coordinate iniziali e finali del ligando, più c’è corrispondenza più avremo dei contributi bassi, il che rende il valore ultimo, posto sotto radice, prossimo allo zero. Lo zero, infatti, a livello teorico si ottiene quando le coordinate iniziali e finali coincidono. smart_rms calcola la deviazione rms tra due conformazioni della stessa struttura. Il comando da utilizzare da shell per eseguire questa analisi è:

$GOLD_DIR/utilities/smart_rms –hv file1.mol2 file2.mol2

rms_analysis compie un gruppo di analisi su un set di soluzioni del docking. In particolare, calcola la matrice della differenza di rms per un set di strutture (come MOL2 file) e compie un gruppo di analisi gerarchiche. Il grafico dell’algoritmo dell’isomorfismo è utilizzato per determinare il valore ottimale di rms. Il comando da utilizzare da shell per eseguire questa analisi è:

$GOLD_DIR/utilities/rms_analysis -method simple file1.mol2 file2.mol2

AUTODOCK

AutoDock11 è un programma sviluppato al fine di ottenere una procedura automatizzata per predire le interazioni di ligandi flessibili con targets macromolecolari statici.

La procedura originale prevedeva una tecnica di Monte Carlo simulated annealing (metodo Metropolis) per la ricerca conformazionale e una valutazione rapida dell’energia mediante potenziali d’affinità molecolare basati su una griglia, precalcolando i potenziali di affinità atomici per ogni atomo del substrato nella maniera descritta da Goodford10.

Il primo step della procedura di docking concerne la costruzione della griglia nella macromolecola. A tale scopo è presente il programma Autogrid che costruisce una griglia tridimensionale sulla macromolecola con un atomo

(32)

32

probe in ogni suo punto; l’energia d’interazione di questo singolo atomo con la proteina è assegnata a ciascun

punto della griglia. Il programma calcola un grid per ogni tipo di atomo del substrato: carbonio, ( alifatico e aromatico ), ossigeno, azoto, zolfo e idrogeno.

L’energia di una particolare configurazione del substrato viene poi ricavata da un’interpolazione tri-lineare dei valori d’affinità degli otto punti della griglia che circondano ogni atomo del substrato. Il tempo per il calcolo dell’energia dipende esclusivamente dal numero di atomi del substrato e non della proteina.

La simulazione del docking attualmente può essere eseguita con diversi metodi di ricerca:

1. Monte Carlo simulated annealing (SA) in cui in ogni ciclo di annealing a temperatura costante vengono

variati casualmente la posizione, l’orientamento e la conformazione del ligando flessibile a partire dal suo stato iniziale. Il nuovo stato viene poi paragonato al precedente: se ha un’energia minore esso è immediatamente accettato, se ha un’energia maggiore viene accettato o rifiutato secondo il fattore di probabilità P(∆E)= e-(∆E) / KBT (KB è la costante di Boltzmann) che dipende dalla temperatura e

dall’energia del ciclo; a temperature maggiori in genere vengono accettate più conformazioni.

2. Genetic algorithm (GA) e hybrid genetic algorithm-local search (LGA); entrambe iniziano con una

popolazione di conformazioni con orientazione e traslazione casuali che sono descritte nelle variabili di stato codificate da un numero variabile di geni che formano il genoma. Il metodo GA impone un utilizzo esclusivamente binario mentre il metodo LGA è un metodo ibrido tra il GA e l’SW e consiste di un ottimizzatore globale adattabile e un ricercatore locale; esso infatti ha 2 punti di incrocio e mutazione casuale per il ricercatore globale, mentre il ricercatore locale modificando il fenotipo può aggiornare il genotipo.

3. Evolutionary programming (EP) si ottiene imponendo la velocità dell’incrocio genetico del GA uguale a

zero.

4. Pure local search (SW) utilizza delle varianze fisse che inizialmente sono uguali ad 1, per determinare

probabilisticamente i cambiamenti di una certa variabile di stato. Queste varianze vengono poi raddoppiate o dimezzate durante la ricerca secondo il numero di movenze consecutive che provocano una diminuzione dell’energia.

La procedura per avviare i calcoli di docking prevede varie operazioni: La preparazione dei file di input attraverso AutoDockTools.

Creazione della griglia delle affinità atomiche attraverso AutoGrid. Docking di ligandi attraverso AutoDock.

(33)

33 Preparazione dei File di Input

Il primo passo è la preparazione dei file di input specifici per AutoDock, ma a differenza di Gold serve la conversione dei file molecolari (.pdb o .mol2) nel nuovo formato PDBQT. Questa tipologia di file, oltre alle coordinate degli atomi di proteina o ligando, raccoglie dati sulla tipologia di atomi presenti nella struttura, le cariche parziali, gli atomi di idrogeno non polari e la flessibilità della molecola, tutte informazioni necessarie al corretto funzionamento di AutoGrid e AutoDock. Una volta aperto il file del composto mediante l’opzione Ligand > Input > Open il programma verifica in automatico la composizione atomica del ligando, e ne riporta in un messaggio successivo tutti i dati. Per il riconoscimento è necessario che il composto presenti tutti gli idrogeni della struttura, sia quelli polari che quelli non polari, in maniera tale da permettere ad AutoDock il calcolo delle cariche di Gasteiger12. Il programma, infatti, necessita che il ligando abbia cariche atomiche parziali definite e che gli atomi siano riconosciuti secondo la classificazione interna del programma. Oltre a ciò AutoDock adotta l’idea che la molecola possa essere considerata come un ‘albero’ nel quale il nucleo rigido della molecola è la ‘radice’ e le parti flessibili, ossia i torsionali della molecola, sono i ‘rami’. Attraverso il comando TorsionTree > DetectRoot il programma valuta e sceglie in autonomia quale parte considerare come ‘radice’ e ci mostra il risultato rimarcando questa con una sfera verde.

A livello teorico la scelta viene concettualmente operata guardando quale sia l’atomo del ligando con la più piccola sequenza ivi connessa. Nel caso alcuni atomi competano tra loro viene scelto quello che possegga ulteriori caratteristiche che denotino una maggior rigidità, come l’appartenenza ad un ciclo.

Un altro parametro usato da AutoDock è il Torsdof, che riguarda il numero dei legami ruotabili della molecola, ossia i torsionali, e quindi in generale i gradi di libertà del ligando. Da questo conteggio sono esclusi i legami presenti in un anello, i legami degli atomi terminali, i legami ammidici, etc. Torsdof è usato per calcolare il cambio dell’energia libera causata dalla perdita dei gradi di libertà dei torsionali durante il legame con la proteina.

Terminate queste fasi preliminari sarà opportuno salvare il file nel nuovo formato pdbqt, passando quindi all’analisi della proteina. Tutto questo considerando che attraverso l’opportuno settaggio è possibile impostare:

Il docking considerando il ligando completamente rigido. (tramite il comando Ligand > Input > OpenAsRigid).

La selezione manuale dell’atomo da considerare come ‘radice’. (tramite il comando TorsionTree > ChooseRoot).

(34)

34 L’impostazione di quanti e quali siano i Torsionali, compresi quei legami che sono potenzialmente ruotabili ma bloccati come il legame ammidico (tramite i comandi TorsionTree > ChooseTorsions / Set Number Of Torsions).

La preparazione dei ligandi, con la relativa conversione da un formato all’altro, può essere svolta anche attraverso un comando da tastiera, che permette di ovviare a tutta questa procedura manuale. Molto spesso il numero di ligandi da ottimizzare risulta essere molto alto per cui è importante poter sfruttare la procedura automatica, riportata qui sotto:

prepare_ligand4.py -l nomefile.pdb -o nomefile.pdbqt dove:

–l : nome dell’input in formato PDB. –o : nome dell’output in formato PDBQT.

Per quanto riguarda la proteina il discorso è analogo: si procede, infatti, col selezionare la macromolecola attraverso il comando Grid > Macromolecule > Open lasciando che il programma analizzi automaticamente la struttura, assegni le cariche e classifichi gli atomi secondo la sua dicitura. Nel caso di proteine rigide la selezione procede col salvataggio diretto del file PDBQT, altrimenti, nei casi in cui specifiche catene laterali della proteina sono trattate come flessibili, verrà creato un file PDBQT separato con le specifiche coordinate della catena laterale.

Nel caso in cui il file .pdb importato sia senza idrogeni non polari, si aggiungono le cariche parziali tramite l’opzione Add Kollmann charges del menu Edit, dopodichè si aggiungono i parametri del solvente con l’opzione Add solvent parameters del menu Macromolecule e quindi è possibile salvare il file in formato .pdbqs13.

Creazione della griglia con AutoGrid

Il secondo passaggio prima del calcolo di docking consiste nell’avviare la creazione della griglia che è richiesta per questo genere di programma. AutoDock, infatti, sfrutta come metodo di valutazione della predizione un sistema basato sulla scomposizione del sito di legame in una griglia di valutazione energetica rapida, ottenendo così informazioni sull’energia potenziale e quindi l’affinità per ogni tipo di atomo che il ligando possiede. Ad occuparsi della creazione di questa mappa, è l’applicazione AutoGrid, che incorpora una parte della proteina in una griglia tridimensionale e pone in ogni punto della stessa un atomo sonda, detto probe. Il volume di questo

(35)

35 reticolo viene stabilito tramite selezione manuale e per ogni punto di essa vengono posti in sequenza dei probes in maniera tale da avere dei dati sull’energia d’interazione tra questo singolo atomo e la proteina.

Tipicamente AutoGrid misura le affinità calcolando le griglie per ogni tipo di atomo del ligando, come carbonio, ossigeno, azoto e idrogeno, ma tiene presenti anche i potenziali elettrostatici e il contributo di de-solvatazione. Questi valori andranno a comporre tutta una serie di ‘mappe’ che durante il calcolo con AutoDock serviranno a valutare particolari configurazioni del ligando. AutoGrid inoltre genera altri due file, con le estensioni .fld e .xyz, dove il primo è un file di campo che riassume le mappe della rete, e il secondo descrive l'estensione territoriale delle griglie nello spazio cartesiano.

Attuato questo passaggio, dovremo avviare la creazione del file di configurazione della griglia stessa, che è necessario ad AutoGrid per procedere tanto quanto lo sono i file di input da noi ottimizzati. La creazione può avvenire tramite l’interfaccia grafica di AutoDock, ma è disponibile anche un pratico comando da tastiera da poter utilizzare anche all’interno di vari script:

prepare_gpf4.py –l ligand.pdbqt –r prot.pdbqt dove:

–l : nome e indirizzo del ligando originale in formato PDBQT; –r : nome e indirizzo della proteina in formato PDBQT.

Anche per l’avvio della creazione della mappatura della griglia è possibile utilizzare un pratico comando da tastiera :

autogrid4 -p macro.gpf [-l macro.glg] dove:

–p : file coi i parametri del calcolo, in formato GPF.

–l : file di output con i risultati del conteggio, ove possiamo controllare le energie minime e massime di ogni griglia, in formato GLG.

Docking e script con AutoDock

Il successo di un programma di docking, come precedentemente detto per Gold, dipende fondamentalmente da due fattori: l’algoritmo di ricerca e la funzione di score. Nel caso di AutoDock la procedura prevede la

(36)

36 creazione dei file PDBQT di input, l’utilizzo come metodo di ricerca di uno dei diversi algoritmi integrati nel programma, mentre per la valutazione finale la funzione di punteggio viene sostituita dalla griglia. Così come in Gold, il set dei metodi di ricerca di AutoDock comprende l’Algoritmo Genetico, ma sono disponibili anche il MonteCarlo Simulated Annealing e l’algoritmo genetico Lamarck (LGA, ritenuto dagli autori come il metodo più efficiente). Attraverso questi vengono esplorati gli stati conformazionali dei ligandi flessibili, che saranno poi affiancati e valutati usando le mappe costruite che permettono di valutare l’interazione ligando-proteina in ogni punto della simulazione di docking.

Figura 2.3: Percorso ideale per il lancio dei calcoli con AutoDock.

I calcoli di docking, così come in Gold e negli altri programmi, sono avviabili con l’interfaccia grafica di AutoDock, ma sfruttare gli script è un passaggio consigliato. La comodità sta nel fatto che si possono lanciare in sequenza, in caso di necessità, una grande quantità di docking. Gli script possono essere implementati da altri script in grado di regolare i nomi da attribuire ai file DPF (o GPF nel caso si debba avviare AutoGrid) nelle stringhe, rendendo pratico e veloce un percorso altrimenti molto lungo.

Per quanto riguarda il docking vero e proprio, avviene una situazione simile a quella già intravista con AutoGrid, infatti è necessario attuare prima la creazione dei file di configurazione :

prepare_dpf4.py –l cs_ligand.pdbqt –r prot.pdbqt –p ga_run num –o name.dpf dove:

–l : nome e indirizzo del ligando dopo analisi conformazionale in formato PDBQT; –r : nome e indirizzo della proteina in formato PDBQT;

(37)

37

–p : numero di simulazioni che s’intendono far svolgere all’Algoritmo Genetico; –o : nome del file di output in formato DPF.

e poi avviare il calcolo di docking attraverso la relativa istruzione: autodock4 -p macro.dpf [-l macro.dlg]

dove:

–p : file con i parametri del calcolo, in formato DPF;

–l : file di output con i risultati del docking, in formato DLG ma facilmente convertibili in PDBQT o PDB.

Prendendo in esame gli opportuni script utilizzati per avviare i calcoli i comandi per la preparazione dei file di configurazione e per l’avvio sia di AutoGrid e AutoDock sono quasi sempre associati all’istruzione foreach file che consente di estrarre il codice numerico del ligando, memorizzarlo fino al termine del ciclo, e di riportarlo automaticamente ove si desidera, citando la dicitura $code all’interno dell’oggetto che si intende creare. In questa maniera basterà introdurre i ligandi all’interno della cartella (es. lig_2xpb.pdbqt) che lo script riconoscerà automaticamente tutti i composti e riuscirà ad utilizzare il codice per le fasi successive.

(38)

38 Il primo passaggio di questo primo script parte dalla creazione, tramite il comando prepare_gpf4.py del file di configurazione della griglia, cui è accompagnata la generazione delle relative mappature. Come output finale avremo i file di configurazione con l’estensione GPF, ognuno dei quali contenente il codice di riferimento. Per quanto riguarda la creazione della griglia vera e propria con AutoGrid non viene svolta automaticamente ma ne viene addizionata l’istruzione per lo script successivo. Il tutto è reso possibile tramite il comando echo, che è in grado di trascrivere una riga di testo a nostro piacimento (l’oggetto compreso tra parentesi) all’interno di un file qualsiasi a nostra scelta (dicitura >> nome_del_file) :

echo 'autogrid4 -p prot_'$code'.gpf -l prot_'$code'.glg' >> script_adt

Questa sequenza di passaggi, che vedono prima la creazione dei file di configurazione, è stata ideata con lo scopo di suddividere la parte preparatoria da quella di calcolo vero e proprio. Questo ci consente di verificare la buona riuscita di ogni passaggio, privilegiando e valorizzando l’azione che stiamo compiendo piuttosto che l’analisi di un complesso alla volta.

Per quanto riguarda il calcolo di docking, la strutturazione degli script è la medesima. Nella parte successiva dello script visto in precedenza, dopo l’impostazione per AutoGrid, viene implementata la creazione del file con tutti i parametri per la preparazione del calcolo di docking:

seguito dall’istruzione per consentire l’estrazione dell’rmsd dal file di calcolo.

La parte finale dello script termina analogamente alla precedente, con l’implementazione, sempre attraverso l’istruzione echo, delle operazioni successive:

Figura

Figura 1.5: ciclo del mevalonato
Figura 1.8: primo step veloce, porta alla formazione del GPP
Figura 1.9: secondo step che porta alla formazione della FPP. È lo stadio lento che determina la velocità di reazione
Figura 1.11 : Schema illustrativo sul normale turnover osseo (A) e sul turnover indotto da patologie (B)
+7

Riferimenti

Documenti correlati

Nella prima fase del lavoro sono stati sintetizzati liquidi ionici a base di imidazolio e pirrolo contenenti più funzioni carbossiliche, aventi più costanti di

Di recente, una categoria di composti recanti uno spezzone β-dichetoacido (I) è stata indipendentemente individuata da ricercatori della Shionogi e della Merck come una nuova

Each state-owned business group has connections extending to various types of entities including other state-controlled business groups, state-controlled

aspects. However, it should be noted that this conclusion is only true in relative terms. In absolute terms, energy political and technological aspects are the most

Date de ratification par le Liban 1977 Convention sur le travail forcé 1930 1977 Convention des quarante heures 1935 1962 Convention des travaux souterrains femmes 1935 1962

In una revisione della FDA (Food and Drug Administration) sulla presenza di glifosato negli alimenti negli Stati Uniti si è evidenziato che oltre il 60% del mais e di campioni

Gli effetti inde- siderati più comuni sono quelli attesi in relazione al loro meccanismo d’azione che induce una glicosuria protratta, e quindi: infezioni del tratto

Isolata e indipendente dall’edificato circostante, si sviluppa prevalentemente su un piano, con una parte superiore di dimensioni contenute che definisce la testata della scuola