• Non ci sono risultati.

STUDI COMPUTAZIONALI PER L'IDENTIFICAZIONE DI MOLECOLE CAPACI DI INTERAGIRE CON LA PROTEINA NONO

N/A
N/A
Protected

Academic year: 2021

Condividi "STUDI COMPUTAZIONALI PER L'IDENTIFICAZIONE DI MOLECOLE CAPACI DI INTERAGIRE CON LA PROTEINA NONO"

Copied!
129
0
0

Testo completo

(1)

UNIVERSITÀ DI PISA

DIPARTIMENTO DI FARMACIA

Corso di Laurea Magistrale in Chimica e Tecnologia Farmaceutiche

Tesi di laurea:

STUDI COMPUTAZIONALI PER L’IDENTIFICAZIONE DI MOLECOLE

CAPACI DI INTERAGIRE CON LA PROTEINA NONO

Relatore: Prof. Tiziano Tuccinardi

Relatore: Dott.ssa Margherita Lapillo

Candidato: Natalia Martelli

(Mat. N° 441859)

Settore Scientifico Disciplinare: CHIM-08

ANNO ACCADEMICO 2016-2017

(2)

Indice

CAPITOLO I INTRODUZIONE ………1

1.1 Pelle: generalità ………1

1.2 Cenni di Anatomia ………..2

1.3 Patologie della pelle: il melanoma. Epidemiologia, cause e terapie note ………3

1.3.1 Epidemiologia ……….4

1.3.2 Terapie note ……….4

1.3.3 Cause ………..5

1.4 Il ciclo cellulare ………6

1.4.1 Fasi del ciclo cellulare ……….6

1.4.2 Punti di controllo e regolazione del ciclo cellulare ………8

1.5 Danno al DNA ………..…9

1.5.1 Struttura del DNA ……….10

1.5.2 Alterazioni del DNA e vie di riparazione ………..10

1.5.2.1 Complesso Ku70/80 (Ku) ………13

1.5.2.2 DNA-PK ………..14

1.5.3 NONO in NHEJ ………16

1.6 Coinvolgimento di NONO nella regolazione del checkpoint intra-S ………..18

1.7 Famiglia delle proteine DBHS ………..19

1.7.1 Struttura di NONO ………20

1.7.2 Altre applicazioni terapeutiche di NONO ……….22

CAPITOLO II METODI 2.1 Programmi per la visualizzazione ………..23

(3)

2.2 Programmi per lo screening virtuale ………..24

2.2.1 FLAP ……….24

2.2.1.1 Uso dell’interfaccia grafica ………..25

2.3 Programmi per il docking ………..28

2.3.1 Definizione di docking ………..28

2.3.2 AutoDock ………..28

2.3.2.1 Generazione della griglia AutoGrid ……….29

2.3.2.2 AutoDock da shell ………30

2.2.2 VINA ………..………..33

2.3.3.1 Preparazione dei file di input ………..33

2.3.3.2 Preparazione della griglia ………34

2.3.4 Dock6 ………38

2.3.4.1 Preparazione dei file di input ………..38

2.3.4.2 Generazione delle sfere e della griglia di scoring ………40

2.3.4.3 Inizio del calcolo di docking ………42

2.3.5 FRED ………46

2.3.6 GLIDE ………..52

2.3.7 GOLD ………53

2.3.8 PLANTS ………61

2.3.9 GLAMDOCK ………62

2.4 Programmi per la dinamica molecolare ……….64

2.4.1 Introduzione ad AMBER ………..64

2.4.2 Preparazione dei file di input ………66

2.4.3 Preparazione dei file per tLEAP ………67

2.4.4 tLEAP ………68

2.4.5 SANDER ………..69

(4)

2.4.6 PMEMD ………71

2.5 Valutazione della dinamica molecolare ………..72

2.5.1 UCSF CHIMERA ……….72

2.5.2 Analisi RMSD ………..73

2.5.3 Analisi MM-PBSA ………76

2.5.4 Analisi di nuovi legami ad idrogeno ……….79

2.6 Creazione di un file Average per ulteriori studi computazionali ………80

CAPITOLO III Parte sperimentale 3.1 Introduzione ………..….81

3.2 Analisi del cristallo 3SDE ………..82

3.3 Procedura di self-docking ………..85

3.3.1 Confronto con il ligando cristallografico ………..87

3.4 Screening del database ENAMINE ………88

3.4.1 Database Enamine ……….89

3.4.2 Scelta delle molecole ………89

3.5 Pre-filtro Receptor -Based con il programma FLAP ……….89

3.6 Docking con il programma VINA ……….91

3.7 Studi di Dinamica Molecolare ………..93

3.7.1 Simulazioni di Dinamica Molecolare ………..93

3.7.2 Analisi dei risultati ………94

CAPITOLO IV Conclusioni ………..107

(5)
(6)

Capitolo I: Introduzione

1.1 Pelle: generalità

La pelle è l’organo più esteso del corpo umano ed è composta approssimativamente dal 70% di acqua, 25% di proteine, 2% di grassi, 0,5% di minerali ed il restante 2,5% da altre sostanze.

Le funzioni principali, vista l’eterogeneità della struttura, sono molteplici tra cui:

• funzione di protezione meccanica, soprattutto grazie alle caratteristiche di elasticità e di estensibilità proprie della cute, a cui si aggiunge il sostegno offerto dalle fibre del collagene;

• funzione di barriera agli agenti fisici, e in primo luogo ai raggi ultravioletti, operata dal filtro melaninico;

• funzioni di barriera agli agenti microbiologici, che quotidianamente entrano in contatto con la cute;

• funzione di barriera agli agenti chimici,

• funzione di termoregolazione, il calore corporeo in eccesso può essere eliminato attraverso la cute grazie ai meccanismi di irradiazione, convenzione, ed evaporazione ( quest’ultima in particolare è controllata dalla sudorazione della cute e rappresenta il mezzo più efficiente in condizioni di massima necessità ). Qualora, invece, sia necessario risparmiare calore, il flusso sanguigno della cute si riduce drasticamente ed il sangue viene dirottato verso i tessuti più profondi;

• funzione sensoriale, nella cute sono presenti le strutture nervose predisposte alla ricezione degli stimoli tattili, termici e dolorifici;

• funzioni escretorie, attraverso il sudore viene esercitata anche un’azione di eliminazione dalla cute nei confronti di molti prodotti metabolici, fra cui i composti azotati;

• funzione di deposito, il tessuto adiposo posizionato subito sotto la cute costituisce una riserva energetica che può essere assai cospicua e rivelarsi fondamentale in caso di digiuno protratto;

(7)

• funzione immunologica, per la presenza di cellule immunocompetenti la cute è da considerarsi un organo di primaria importanza immunologica sia dal punto di vista fisiologico che patologico.

Il manto protettivo della pelle è costituito soprattutto da sebo, il suo pH, acido, varia tra 4,2 e 5,6 e svolge diverse funzioni come antiossidante per proteggere la pelle dall’ossidazione,

idrorepellente perché lo strato lipidico limita l’assorbimento di agenti esterni idrosolubili

proteggendo la pelle da eventuali sostanze, antibatterico perché il pH acido inibisce la proliferazione di agenti micobatterici come funghi e batteri in genere, protezione della

cheratina in quanto quest’ultima necessita di pH bassi per la sua omeostasi.

1.2 Cenni di anatomia

La pelle è formata da diversi strati tra cui l’epidermide, che costituisce lo strato più superficiale, il derma separato dall’epidermide dalla membrana basale e l’ipoderma o tessuto adiposo che si trova immediatamente al di sotto del derma.

L’epidermide è un tessuto di rivestimento ed è formata da vari tipi di cellule, principalmente i cheratinociti; questi vengono prodotti nello stato basale (la parte più profonda) e risalgono in circa 28 giorni verso la superficie. L’epidermide è priva di circolazione arteriosa e/o venosa, tranne lo strato basale, il quale riceve il nutrimento del derma.

Il derma si trova subito sotto l’epidermide, al di sotto della giunzione dermi-epidermica. Lo spessore varia tra 0,3 a 3 mm, a seconda delle zone del corpo, e rappresenta lo strato connettivo della cute. Dal derma dipendono l’elasticità, lo spessore e la capacità di sostegno della cute stessa.

Il derma è composto da una fitta trama di fibre e da una grande quantità di cellule immerse in una sostanza sotto forma di gel, detta sostanza fondamentale. Questa trama è composta da due tipi di fibre principali:

• il collagene: si tratta di una glicoproteina fibrosa, prodotta dai fibroblasti, le principali cellule del derma. Le fibre del collagene si organizzano in fasci disposti tra loro secondo un fitto intreccio, molto resistente alla trazione;

(8)

• l’elastina: anch’essa è una glicoproteina fibrosa prodotta dai fibroblasti e dotata, a differenza del collagene, di notevoli proprietà elastiche. Le fibre elastiche sono molto meno numerose e più sottili delle fibre di collagene, non si organizzano in fasci, ma si ramificano e si riuniscono formando un reticolo. Le fibre dell’elastina si intrecciano con quelle del collagene conferendo elasticità all’intera struttura della cute.

Questo tipo di organizzazione strutturale dona al tessuto connettivo eccellenti proprietà di robustezza, resistenza ed elasticità.

L’ipoderma o tessuto connettivo sottocutaneo è lo strato più profondo e spesso della cute. Si trova al di sotto della pelle e in particolare sotto il derma, da cui non è possibile differenziarlo in maniera netta. La distribuzione e lo spessore sono molto variabili: quest’ultimo oscilla tra i 0,5 e 2 cm, risultando minore laddove la pelle è a contatto diretto con ossa e cartilagine e maggiore in altre sedi. Mette in rapporto il derma con i tessuti sottostanti permettendo anche un reciproco scorrimento consentendo quindi di sollevare la pelle in pieghe.

L’ipoderma è costituito da uno scheletro di tessuto connettivo fibroso, di collagene ed elastina, che delimita delle concatenazioni (o lobi) piene di cellule adipose (adipociti). L’ipoderma svolge varie funzioni tra cui:

• riserva energetica alla quale l’organismo attinge in condizioni di necessità;

• isolamento dal freddo i tessuti sottostanti, tramite una piccola ma continua produzione di calore sprigionata durante la trasformazione dei trigliceridi in acidi grassi;

• efficace protezione meccanica ai tessuti ed agli organi sottostanti.

1.3 Patologie della pelle: il melanoma. Epidemiologia, cause e terapie note

Il melanoma cutaneo [1] è un tumore che deriva dalla trasformazione tumorale dei

melanociti, alcune delle cellule che formano la pelle. Quest’ultima è formata da diversi

strati, come già detto precedentemente ed è costituta dall’epidermide, dal derma e dal tessuto sottocutaneo o grasso. I melanociti fanno parte, insieme ai cheratinociti, dell’epidermide ed hanno il compito di produrre la melanina, il pigmento che protegge la pelle dagli effetti dannosi dei raggi solari.

(9)

1.3.1 Epidemiologia

Il melanoma cutaneo è piuttosto raro nei bambini e colpisce soprattutto uomini e donne attorno ai 45-50 anni, anche se l’età media della diagnosi si è drasticamente abbassata negli ultimi decenni.

In Italia i dati AIRTUM (Associazione Italiana registri tumori) parlano di circa 13 casi ogni 100000 persone, con una stima che si aggira attorno a 3150 nuovi casi ogni anno tra gli uomini e 2850 tra le donne. Inoltre l’incidenza è in continua crescita ed è quasi raddoppiata negli ultimi dieci anni. E’ importante ricordare che il melanoma cutaneo rappresenta solo una piccola parte (circa il 15%) di tutti i tumori che colpiscono la pelle.

I melanomi cutanei originano su una cute integra o da nevi preesistenti, che sono presenti dalla nascita o dalla prima infanzia (congeniti) o compaiono durante il corso della vita (acquisiti).

Dal punto di vista clinico si distinguono quattro diverse tipologie di melanoma:

• melanoma a diffusione superficiale, il più comune e rappresenta circa il 70% di tutti i

melanomi cutanei;

• lentigo maligna melanoma; • melanoma lentigginoso acrale;

• melanoma nodulare, il più aggressivo e rappresenta il 10-15% dei melanomi cutanei.

I melanomi cutanei sono in genere classificati in quattro stadi (da I a IV) definiti sulla base del sistema TNM; lo stadio 0 indica il melanoma in situ, il quale interessa solo lo strato superiore della pelle. Questo sistema tiene conto delle caratteristiche del tumore come lo spessore, la velocità di replicazione delle cellule tumorali, la presenza di ulcerazioni (T), il coinvolgimento di linfonodi (N) e la presenza di eventuali metastasi (M).

1.3.2 Terapie note

Oggi sono disponibili diverse opzioni di trattamento del melanoma cutaneo:

• la chirurgia è in genere la prima scelta in quanto spesso è in grado di curare

(10)

• la radioterapia usata in genere per trattare il melanoma che si ripresenta dopo un altro

trattamento o come terapia coadiuvante dopo la chirurgia per eliminare le cellule tumorali non rimosse con la chirurgia;

• la chemioterapia che in genere non è molto efficace, ma può aiutare ad alleviare i

sintomi nelle fasi avanzate. I farmaci chemioterapici possono essere usati da soli, in combinazione tra di loro, oppure insieme a farmaci immunoterapici che stimolano il sistema immunitario ad agire contro il tumore (un esempio è dato dal farmaco Ipilimumab).

Tra le terapie ancora in fase di studio ci sono anche diversi vaccini e terapie mirate: i primi sfruttano parti delle cellule di melanoma per scatenare l’azione del sistema immunitario contro la malattia, le seconde invece sono farmaci diretti contro mutazioni specifiche nel DNA delle cellule tumorali.

1.3.3 Cause

Il principale fattore di rischio per il melanoma cutaneo è l’eccessiva esposizione alla luce ultravioletta la quale è principalmente rappresentata dai raggi del sole. La troppa esposizione al sole rappresenta un potenziale pericolo perché può danneggiare il DNA delle cellule della pelle ed innescare così la trasformazione tumorale [2].

I raggi ultravioletti includono radiazioni a lunghezza d’onda diverse comprese tra 100 e 400 nm, suddivisibili in tre diverse tipologie: UVC (lunghezze d’onda minori a 280 nm), UVB (lunghezze d’onda comprese tra 280 e 320 nm) e UVA (comprese tra 320 e 400 nm) [3,4].

Nonostante l’esposizione ai raggi ultravioletti sia benefica ed incrementi i livelli di vitamina D [4], è anche uno dei maggiori fattori di rischio del melanoma maligno [5,6,7]. L’effettiva zona spettrale [8] che causa seri danni al DNA umano è la zona degli UVC, in particolare la radiazione a lunghezza d’onda di 265 nm.

Questa esposizione produce due principali tipi di fotolesioni del DNA: il dimero di ciclobutano pirimidina (CPD, i quali sono i più abbonanti nelle lesione indotte da UVC) e

(11)

6-4 fotoprodotti di pirimidina/pirimidone (6-4PP); inoltre si ha un danno ossidativo di base del DNA come la 8-oxo-deoxiguanina (8-oxo-dG) [5].

Altri fattori di rischio noti sono l’insufficienza del sistema immunitario (dovuta ad esempio a precedenti chemioterapie o a trapianti), ed alcune malattie ereditarie (per esempio lo xeroderma pigmentoso, nel quale il DNA non riesce a riparare i danni causati delle radiazioni) [1].

1.4 Il ciclo cellulare

Il ciclo cellulare rappresenta una serie di eventi ordinati che avviene nelle cellule eucariote e che portano alla crescita ed alla duplicazione cellulare.

Il periodo di tempo che va da una divisione cellulare all’altra è chiamata interfase. In questo periodo la cellula cresce accumulando sostanze nutritive e preparandosi a replicare il proprio DNA per potersi dividere nuovamente. L’interfase viene suddivisa in tre fasi distinte, chiamate G1, S e G2.

La quarta fase del ciclo è la mitosi, ovvero la divisione cellulare. Durante la mitosi i cromosomi si separano e migrano ai poli opposti del citoplasma, che si separano generando due cellule figlie.

Dopo la divisione cellulare, ciascuna delle due cellule figlie sopra citate, ricomincia l’interfase di un nuovo ciclo. Sebbene di solito durante questa fase non sono distinguibili differenze morfologiche della cellula, ogni fase del ciclo cellulare presenta un set distino di processi biochimici specializzati che preparano la cellula per l’inizio della divisione cellulare.

Molti tipi di tumore, tra cui il melanoma, sono dovuti a mutazioni dei geni responsabili del controllo e della regolazione del ciclo cellulare, provocando una crescita abnorme e potenzialmente invasiva del tessuto interessato.

1.4.1 Fasi del ciclo cellulare

Guardiamo in linea generale cosa avviene durante le diverse fasi:

(12)

• Fase G1: la fase G1 (dall’inglese Gap-intervallo) è il primo stadio dell’interfase.

Durante questo periodo la cellula cresce di dimensioni e sintetizza i componenti del citoplasma e degli organelli, così come gli mRNA, i nucleotidi, gli istoni e le proteine necessarie alla duplicazione del DNA. Il metabolismo cellulare, che nella precedente fase mitotica era rallentato, riprende ad un ritmo elevato. In questa fase i centrioli si trovano ancora singoli e separati. Nelle cellule somatiche umane, il cui ciclo cellulare dura 18-20 ore, la fase G1 rappresenta circa un terzo della durata totale del ciclo;

• Fase S: durante questa fase (dall’inglese Synthesis- sintesi) l’evento predominante è la

sintesi del DNA. La replicazione ha luogo in molteplici zone del genoma e porta alla sintesi di ciascun cromatidio fratello identico al cromatidio di partenza, ricostituendo i cromosomi. Il materiale genetico presente nel nucleo cellulare viene quindi raddoppiato. Questa fase può durare anche la metà dell’intero ciclo cellulare ed è una delle fasi più importanti e delicate, in quanto eventuali errori durante la replicazione del DNA possono portare alla comparsa di mutazioni, disfunzioni genetiche, tumori e morte cellulare. Durante la fase S, nelle cellule animali i due centrioli separati durante la divisione cellulare vengono duplicati per ricostituire i centrosomi;

(13)

• Fase G2: In questa fase la cellula svolge i compiti preliminari per prepararsi alla

successiva divisione. Vengono sintetizzati gli mRNA e le proteine necessarie alla mitosi e cominciano a manifestarsi modificazioni strutturali visibili al microscopio. Se parte di un tessuto, la cellula perde i contatti con le cellule vicine e assume una forma più tondeggiante, allargandosi man mano grazie ad un’aumentata assunzione di liquidi. La fase G2 dura circa 3-4 ore e si conclude quando la cromatina comincia a condensarsi per prepararsi alla mitosi;

• Fase M: La fase M (dalla parola Mitosi) porta alla divisione della cellula progenitrice in

due cellule figlie identiche. Questa può essere suddivisa in due diversi processi: la mitosi, ovvero la segregazione dei cromosomi, i quali in parti uguali vengono trascinati dal fuso mitotico ai due poli opposti della cellula, e la citochinesi (o citodieresi), ovvero la divisione del citoplasma, del nucleo e degli organelli cellulari. La divisione cellulare ha luogo in un tempo relativamente breve, circa 30 minuti;

• Fase G0: Non tutte le cellule continuano a dividersi indefinitamente, ma in alcune

condizioni la progressione del ciclo cellulare si interrompe, entrando nella cosiddetta fase G0. Molte cellule degli eucarioti pluricellulari sono infatti non proliferative e, una volta raggiunto il differenziamento cellulare, entrano in uno stato di riposo chiamato

quiescenza. In questo stato possono rimanere per un tempo programmato o

indeterminato, come ad esempio il caso dei neuroni e delle cellule del muscolo striato. In altri casi, dopo successive divisioni le cellule possono andare incontro ad un progressivo invecchiamento e deterioramento del DNA, perdendo la capacità di proliferare ed entrando in uno stato detto di senescenza. Le cellule in questo stato vanno spesso incontro alla morte per fagocitosi da parte dei macrofagi.

1.4.2. Punti di controllo e regolazione del ciclo cellulare

Il passaggio da una fase all’altra del ciclo cellulare viene regolato attraverso dei punti di controllo (o checkpoint), i quali impediscono l’avanzamento del ciclo fintanto che i requisiti necessari non vengono soddisfatti. Vi sono tre punti di checkpoint principali: il primo regola il trasferimento tra le fasi G1/S. In questo checkpoint la cellula si assicura di

(14)

avere abbastanza risorse ed energia per poter duplicare interamente il proprio genoma. Una cellula mal nutrita o che presenta danni al proprio DNA verrà bloccata dal checkpoint in fase G1 senza passare alla fase S. L’attivazione di questo checkpoint è dovuta al riconoscimento dei danni da parte di proteine sensori (ATM e ATR, vedi in seguito) che a loro volta comunicano il segnale alle proteine effettrici. Quest’ultime sono direttamente responsabili delle risposte al danno. In questo lavoro di tesi, questo checkpoint assume un ruolo fondamentale come vedremo più avanti.

Il secondo punto di controllo è tra le fasi G2/M e verifica che la cellula abbia raggiunto dimensioni idonee e che vi siano fosfolipidi e citoplasma sufficienti per potersi dividere. Inoltre questo checkpoint controlla se sia il momento giusto per attivare la divisione cellulare. In alcuni casi, infatti, le cellule adiacenti devono duplicarsi contemporaneamente in un dato momento, come ad esempio nei primi stadi della crescita embrionale.

Il terzo checkpoint si trova all’interno della fase M, durante la stadio della mitosi chiamato

metafase. A questo punto la cellula sta avviando la fase di divisone e viene controllato il

corretto allineamento dei cromosomi al fuso mitotico prima di procedere con la separazione dei cromotatidi (anafase).

La regolazione dei punti di controllo e del ciclo cellulare avviene principalmente ad opera di una classe di proteine chiamate cicline. Queste proteine vengono espresse in momenti diversi del ciclo cellulare a seconda dello stato in cui si trova la cellula.

L’azione delle cicline si attua attivando un altro gruppo di proteine chiamate CDK (acronimo di Cyclin-Dependent kinases ovvero chinasi ciclina-dipendenti), le quali a loro volta con una serie di reazioni a cascata sono in grado di modulare diverse molecole bersaglio coinvolte nella trascrizione e nell’elaborazione dell’mRNA, coordinando il passaggio da una fase all’ altra del ciclo modificando l’espressione genica.

1.5. Danno al DNA

Come già detto precedentemente, il melanoma può essere trattato mediante l’uso di farmaci contro i danni subiti dal DNA in seguito all’esposizione ai raggi UVC che rappresentano lesioni di tipo esogeno, ovvero provenienti da agenti esterni.

(15)

1.5.1 Struttura del DNA

Il DNA è un acido nucleico che contiene le informazioni genetiche necessarie alla biosintesi di RNA e proteine, molecole indispensabili per lo sviluppo ed il corretto funzionamento degli organismi viventi.

Dal punto di vista chimico, il DNA è un polimero organico costituito da monomeri chiamati nucleotidi. Tutti i nucleotidi sono formati da tre componenti fondamentali: un gruppo fosfato, il desossiribosio (zucchero pentoso) ed una base azotata che si lega al desossiribosio con un legame N-glicosidico. Il DNA può essere correttamente definito come una doppia catena polinucleotidica antiparallela. L’ordine nello disposizione sequenziale dei nucleotidi costituisce l’informazione genetica, la quale è tradotta con il codice genetico negli aminoacidi corrispondenti. La sequenza amminoacidi prodotta, detta polipeptide, forma le proteine. Il processo di traduzione genetica (conosciuta come sintesi proteica) è possibile solo in presenza di una molecola intermedia di RNA, che sono generate per complementarietà con le quattro basi nucleotidiche del DNA in un processo noto come trascrizione. Tale processo non genera solo filamenti di RNA destinati alla traduzione, ma anche frammenti già in grado di svolgere svariate funzioni biologiche. L’informazione genetica è duplicata prima della divisione cellulare, attraverso un processo noto come replicazione del DNA, che evita la perdita di informazione nel passaggio tra diverse generazioni cellulari.

Negli eucarioti, il DNA si complessa all’interno del nucleo in strutture chiamate cromosomi. All’interno di quest’ultimi, le proteina della cromatina, come gli istoni, le coesine e le condensine, organizzano il DNA e lo avvolgono in strutture ordinate. Queste strutture guidano l’interazione tra il codice genetico e le proteine responsabili della trascrizione, contribuendo al controllo della trascrizione genica.

1.5.2 Alterazioni del DNA e vie di riparazione

Nonostante il genoma sia sempre controllato in tutta la sua struttura, esistono meccanismi atti a garantire che le zone di maggiore rilevanza siano corrette quanto prima. La priorità assoluta, ad esempio, è data dalla correzione delle sequenze che trascrivono per proteine che sono attivamente espresse dalla cellula. Ciò avviene perché le RNA polimerasi sono capaci di bloccarsi nei siti coinvolti da una lesione, dirigendo il sistema di riparazione

(16)

verso queste zone. Questo porta ad una riparazione del DNA altamente specifica ed efficiente, che garantisce di riparare prima i danni più gravi e solo in una seconda fase procedere a riparazioni dei danni verso zone non significative della cellula e che quindi non ne compromettono la vitalità.

Si trovano due diversi tipi di danno in relazione al fatto che sia coinvolto un solo filamento oppure entrambi.

Quando solo uno dei due filamenti di un cromosoma presenta un difetto, l’altro filamento può essere usato come stampo per guidare la correzione del filamento danneggiato. Al fine di riparare il danno di una delle due eliche di DNA, ci sono numerosi meccanismi attraverso cui si può provvedere alla riparazione. Tra questi ritroviamo:

• reversione diretta del danno mediante vari meccanismi specializzati;

• meccanismi di riparazione per escissione, che rimuovono il nucleotide danneggiato

sostituendolo con un altro nucleotide complementare non danneggiato presente nel filamento di DNA integro. Questi comprendono a loro volta la Riparazione per

escissione di base, Riparazione per escissione di nucleotidi o NER e Miss Match Repair.

Un tipo particolarmente pericoloso di danno al DNA per le cellule in divisione è la rottura di entrambi i filamenti della doppia elica (DNA DSB). Questo danno è un processo multistrato [9], che inizia con il rilevamento e la segnalazione del danno al DNA, successivo reclutamento di proteine di riparazione e finale riparazione [10].

Il primo step prevede l’utilizzo di PARP (Poly-ADP-ribose polymerase-1), un’abbondante proteina nucleare, la quale usa NAD+ per sintetizzare un polimero carico negativamente chiamato PAR (poli-ADP-ribosio) su una varietà diversa di proteine bersaglio, come istoni, fattori di riparazione DSB e sullo stesso PARP-1. Questa modifica della proteina post-traduzionale ha impatto su diversi processi cellulari come la trascrizione [11], la morte cellulare [12] ed in particolare la riparazione del DNA [13].

PARP-1 agisce come un forte sensore del danno al DNA e produce rapidamente PAR al DNA DSB di nuova generazione, provocando così un rilassamento locale della cromatina

(17)

dovuto alla sua carica negativa [11] e facilitando il reclutamento di fattori di riparazione come MRE11 [10,14].

Per la riparazione successiva si sono evoluti due percorsi: essi sono generalmente conosciuti come riparazione per ricombinazione (HR) e saldatura delle estremità non

omologhe (NHEJ) [15].

La riparazione per ricombinazione (HR) richiede la presenza di una sequenza identica che possa essere usata come stampo per la riparazione di una rottura. Questo sistema è usato in maniera predominante durante le fasi del ciclo cellulare in cui il DNA si sta replicando o ha completato la duplicazione. Ciò permette ad un cromosoma danneggiato di essere riparato con l’impiego, come stampo, di un cromatide fratello neosintetizzato, come una copia identica che è, per di più, ordinatamente appaiata alla regione danneggiata. Molti geni del genoma umano sono presenti in copie multiple fornendo diverse possibili sequenze identiche. HR è considerato come privo di errori e limitato alla fase S/G2 [14]. Al contrario invece il percorso NHEJ, non richiede un cromatidio fratello come stampo e quindi il suo meccanismo è attivo in tutte le fasi del ciclo cellulare.

NHEJ [16] è un percorso incredibilmente versatile che può selezionare enzimi specifici che si legano, processano e infine mediano la rilegatura diretta di un'ampia gamma di DSB compresi quelli complessi, che presentano estremità incompatibili o contengono danni di base [17,18] . Il meccanismo generale di NHEJ comprende diversi passaggi:

• Riconoscimento della rottura del doppio filamento del DNA da parte dell’eterodimero Ku70 /80 (Ku);

• Assemblaggio e stabilizzazione del complesso NHEJ presso il sito di danno del DNA;

• Riempimento dell’estremità del DNA per promuoverne la stabilità finale;

• Attivazione dell'attività della chinasi della subunità catalitica della proteina chinasi del

DNA (DNA-PKcs);

• Elaborazione del DNA, se necessario;

• Legatura delle estremità rotte del DNA attraverso la DNA ligasi IV, XLF e XRCC4; • Dissoluzione del complesso NHEJ e completamento del processo di riparazione.

(18)

1.5.2.1 Complesso Ku70/80 (Ku)

Il meccanismo di riparazione NHEJ è attivato dal rilevamento e dal legame del DSB con l'eterodimero Ku, a sua volta costituito da due subunità: Ku70 e Ku80 [19, 20].

Ku è un’abbondante proteina che presenta un'affinità estremamente elevata per le estremità del dsDNA con cui forma un complesso proteico a forma di anello, che scivola sulle estremità della molecola di DNA spezzata in una sequenza indipendente [21,22]. Il complesso Ku si lega alla spina dorsale di zucchero del DNA e non alle basi, il che spiega

(19)

la sua capacità di legarsi al DNA in una sequenza indipendente [23]. Dopo l'induzione un DSB, Ku70 /80 si lega al sito di danno del DNA entro pochi secondi dalla sua creazione e lo fa in tutte le fasi del ciclo cellulare [19,24,25]. Una volta legato al DSB, Ku esplica la sua funzione primaria in NHEJ, ovvero servire come impalcatura per reclutare tutto il complesso proteico sulla lesione del DNA. L'eterodimero del Ku interagisce direttamente con ciascun fattore NHEJ, DNA-PKcs [20], XRCC4 [19,26,27], DNA Ligase IV [26] e XLF [14], nonché con la maggior parte dei fattori di elaborazione del DNA [17].

Una funzione secondaria che il complesso Ku svolge ai DSB è un ruolo generale nel legare e mantenere la stabilità delle estremità della molecola di DNA spezzata in tutte le fasi del ciclo cellulare [12]. È probabile che il ruolo di Ku nel mantenimento e nella stabilizzazione dei fini del DSB li protegga dall'elaborazione non specifica. Il blocco dell'elaborazione non specifica di un DSB è importante perché protegge contro le aberrazioni cromosomiche e l'instabilità genomica. Ciò è supportato dal fatto che le cellule con deficienza di Ku hanno grave instabilità cromosomica dopo l'induzione di DSB nelle cellule di fase S, suggerendo che Ku ha una funzione generale nella protezione del genoma anche quando la HR è la via di riparazione DSB preferita [28]. Sebbene Ku svolga un ruolo nel mantenimento dei fini del DSB in tutte le fasi del ciclo cellulare, è opportuno notare che l'unione della struttura mediata da Ku può anche essere dannosa per la sopravvivenza delle cellule, in particolare l'end-join dei DSB alle forche di replicazione. Ad esempio, Ku è richiesto per l'uccisione cellulare di cellule dopo trattamento combinato con camptotecina e inibizione della proteina atassia-telangiectasia mutata (ATM) [11], trattamento delle cellule carenti di HR con poli (ADP-ribosio) polimerasi (PARP) inibitori [29] e nelle cellule carenti di anemia di Fanconi (FA) [30].

1.5.2.2 DNA-PK

Successivamente alla localizzazione della lesione, Ku recluta rapidamente DNA-PKcs nel sito della rottura del DNA. L'interazione tra Ku e DNA-PKcs richiede la presenza di dsDNA, ed il complesso risultante da questa interazione prende il nome di "DNA-PK" [31].

(20)

Il DNA-PKcs fa parte della famiglia delle chinasi fosfatidilinositolo-3 (PI-3) chinasi-like (PIKK), che comprende anche le due proteine responsive al danno del DNA, ovvero ATM e la proteina correlata a Rad3 (ATR) [32,33].

Il DNA-PKcs presenta sia un’estremità N-terminale che C-terminale, dove la prima è costituita da HEAT (Huntington-elongation-A-subunit-TOR) che si ripete e che, probabilmente, ha il compito di permettere l’interazione proteina-proteina; la seconda invece contiene il dominio chinasico PI3. Quest’ultimo risulta essere fiancheggiato da un lato dal dominio FAT (FRAP, ATM, TRRAP), mentre dall’altro dal dominio FATC [34,35]. E’ stato dimostrato che il dominio N-terminale durante la fase di riparazione, si ripiega andando a descrivere una struttura a tenaglia, la quale va a formare un canale centrale: quest’ultimo è probabilmente responsabile del legame con il dsDNA. Il dominio C-terminale invece, si posiziona al di sopra della tenaglia, andando a costituire una struttura che ricorda la parte sagomata di una corona [36,37].

Il legame di DNA-PKcs con il complesso DNA-Ku porta alla traslocazione dell'eterodimero Ku all'interno del dsDNA con la conseguente attivazione dell'attività della chinasi DNA-PKcs [38,39].

Lo scopo finale è quello di ottenere un complesso simpatico in grado di tenere vicine le due estremità del DNA spezzato [16,14].

Come precedentemente affermato, il reclutamento di DNA-PKcs sul DSB determina la traslocazione dell'eterodimero Ku all'interno del dsDNA consentendogli quindi di interagire direttamente con il DSB, con finale attivazione dell'attività catalitica dell'enzima [38,39].

Il DNA-PKcs non possiede attività chinasica in assenza di Ku70/80 e DNA, rendendolo quindi una chinasi proteica dipendente da quest'ultimo [40, 41].

Recenti studi, hanno evidenziato che probabilmente il legame tra DNA-PKcs con il complesso Ku-DNA induce un cambiamento conformazionale nei domini FAT e FATC determinando l'alterazione dei gruppi catalitici e/o della tasca di legame di DNA-PKcs, con finale attivazione dell’attività chinasica [42,43,44].

(21)

1.5.3 NONO in NHEJ

Nel corso degli ultimi anni, è stata rivolta particolare attenzione alle proteine con duplice ruolo sia nella biologia dell'RNA che nella riparazione del DNA DSB [9]. L'esempio include la proteina Ku, che è cruciale per il percorso NHEJ, ma importante anche per il controllo dell'espressione dell'mRNA [45,46], il complesso TFHII che agisce nella riparazione dell'escissione nucleotidica e nell'iniziazione trascrizionale mediata dall'RNA polimerasi II [47].

Circa venti anni fa il gruppo di Harris Busch purificò e caratterizzò un eterodimero costituito da due subunità, una di 54 kDa e l’altra di 100 kDa, dove la prima sicuramente corrispondente a quella che oggi è conosciuta come la proteina legante l'RNA nucleare da 54 kDa (p54nrb / NONO) e la seconda al fattore di splicing di polimiridina associato alle proteine (PSF / SFPQ) (vedi paragrafo 1.7).

NONO e SFPQ mostrano un'identità di sequenza del 71% e, insieme al componente paraspeckle 1 (PSPC1), appartengono a una sottofamiglia di proteine di riconoscimento dell’RNA (RRM) definite da motivi RRM in tandem, fiancheggiate da un'ulteriore regione di similarità di sequenza prevista per favorire la formazione di complessi eteromerici tra ciascuna delle proteine [48]. NONO e SFPQ sono implicati nella ritenzione nucleare dell'RNA modificato [49], formazione di pre-mRNA all’estremità 3’ [50], ciclizzazione del cAMP [51] e attivazione della trascrizione [52,53]. È interessante notare che, a parte le loro funzioni nella biogenesi dell'RNA, è stato riscontrato che NONO e SFPQ interagiscono con il DNA in vitro, il che porta a un'indagine sulla loro funzione nel contesto della riparazione del DNA (vedi paragrafo 1.5).

Inoltre, è stato dimostrato che l'attenuazione dell'espressione di proteina NONO, indipendente dalla sua proteina partner SFPQ, porta ad un accumulo di aberrazioni cromosomiche dopo irradiazione ionizzante [54].

Recentemente, è stato scoperto che NONO/SFPQ rientrano nelle proteine leganti PAR e che queste stimolano il meccanismo di riparazione NHEJ [55,56], portando all’ipotesi che PARP è in grado di regolare l’attività di NONO.

NONO è direttamente implicato in NHEJ e, il suo reclutamento nei siti di danno al DNA, è strettamente dipendente dal PARP-1 attivato, promuovendo la sopravvivenza delle cellule in seguito ad irradiazione.

(22)

A causa del suo possibile ruolo nella biogenesi dell'RNA, è stato interessante vedere come NONO sia principalmente associato alla cromatina. Inoltre, NONO è localizzato in prossimità di un DSB circa alla stessa distanza della proteina Ku80 correlata a NHEJ, suggerendo un'implicazione diretta per il NONO nella riparazione del DNA DSB.

Coerentemente a queste considerazioni NONO è stato rilevato nel complesso proteico composto da Ku70, Ku80 e Ligase IV [57], quindi la sua down-regulation determina un aumento delle aberrazioni cromosomiche a seguito dell'esposizione alle radiazioni [54].

Come già discusso, PARP-1 è un'abbondante proteina associata alla cromatina nucleare, caratterizzata per la sua elevata capacità di rilevamento del danno al DNA. Una volta incontrate le estremità libere del DNA, PARP-1 viene attivato cataliticamente generando grandi quantità di PAR che serve come impalcatura per il reclutamento di una varietà di proteine di riparazione del DNA. NONO lega l’RNA con un’alta affinità attraverso il suo RRM1. Il reclutamento di NONO sulla lesione del DNA è strettamente dipendente dalla presenza di PAR. È stato ipotizzato che il PAR legato compete con le proprietà di legame all'RNA, attraverso la modulazione dell'attività di splicing delle proteine. L'idea di una competizione diretta tra PAR e RNA per lo stesso sito all'interno di una proteina potrebbe anche essere applicabile alle proteine leganti l'RNA nel contesto della riparazione del DNA. Poiché è di importanza fisiologica che una cellula fermi l'attività trascrizionale [58] e inizi la riparazione in risposta a un eccessivo danno al DNA, il PAR, che è ampiamente generato nei siti di danno del DNA, potrebbe servire come interruttore molecolare per dirigere le proteine dalla biogenesi dell'RNA verso la riparazione del DNA.

In conclusione, NONO è presente nelle prime fasi della riparazione dopo l'attivazione di PARP, promuovendo il pathway di NHEJ soggetto a errori rispetto ad HR esente da errori.

Recentemente è stato dimostrato che NONO è implicato nello sviluppo e nella progressione del melanoma maligno [59], quindi per evitare la progressione di questa neoplasia è fondamentale trovare dei ligandi i quali legandosi a NONO determineranno il blocco del ciclo cellulare con conseguente inibizione della progressione tumorale.

(23)

1.6 Coinvolgimento di NONO nella regolazione del checkpoint intra-S

La risposta al danno del DNA indotto dai raggi UV [60] è generata dal checkpoint intra-S, le cui funzioni sono quelle di prevenire la replicazione delle forche anomale, ritardandone la sua origine, e stabilizzando i siti fragili [61].

Le cellule che si trovano nella fase S del ciclo cellulare [5], rispondono al danno del DNA in seguito a radiazione UVC, attivando il checkpoint intra-S. Questa attivazione è sia ATR-dipendente che Chk1- ATR-dipendente [62].

In collaborazione con le vie di riparazione del DNA, queste risposte riducono la probabilità di replicare il DNA danneggiato, che porta conseguentemente a mutazioni geniche ed aberrazioni cromosomiche [63, 64]. Da queste premesse ne consegue che l’attenuazione o l’inattivazione del checkpoint intra-S favorirebbero l’accumulo di mutazioni indotte da eventi recanti danno al DNA, come appunto l’esposizione alla luce solare, aumentando così il rischio di carcinogenesi cutanea.

(24)

Le cellule umane esprimono due vie di segnalazione del checkpoint intra-S che presentano diversi sensori del danno al DNA [65]. La risposta di questo checkpoint indotta dalle radiazioni IR viene attivato dal reclutamento e conseguente attivazione di ATM da parte del complesso MRE11-Rad50-NBS1 (MRN). ATM fosforila Chk1 e Chk2, che a loro volta fosforilano altri substrati come il Cdc25A, inibendo così sia l’inizio del replicone che l’allungamento della catena del DNA nei repliconi attivi. La risposta del checkpoint intra-S a UVC non richiede ATM né il complesso MRN [62], ma risponde allo stallo delle forcelle di replica a danno del modello indotto da UV con il reclutamento di ATR / ATRIP su rivestimento RPA DNA a singolo filamento [66]. L’ssDNA viene rapidamente rivestito dalla RPA (proteina di replicazione A) la quale evita la rottura e ricostruisce il complesso ATR-ATRIP sul sito danneggiato [66]. Il doppio filamento adiacente di DNA (dsDNA) ricostituisce il complesso RAD17-RFC, il quale nel suo ciclo scarica sulla cromatina il complesso RAD9-RAD1-HUS1 [67,68]. Tutti questi complessi mettono ATR in contatto con i suoi regolatori favorendo la sua attivazione.

La completa attivazione di ATR necessita di un’ulteriore proteina legante il DNA chiamata TOPBP1 (topoisomerasi 1), implicata sia nell’iniziazione del DNA che nell’attivazione del checkpoint stesso. Inoltre TOPBP1 è usato nei siti danneggiati dove stimola l’attività chinasica del complesso ATR-ATRIP facilitando la ricognizione di ATR sui suoi substrati [69,70]. Solo recentemente, è stato visto che TOPBP1 è in comunicazione con la proteina NONO, e che quindi una sua alterazione porta delle ripercussioni su NONO.

Riassumendo, in seguito alle affermazioni fatte fino adesso, possiamo dire che lo studio della proteina NONO è importante in quanto essa è coinvolta sia nel meccanismo di riparazione NHEJ del DNA, che nell’attivazione della cascata di segnalazione di ATR, dove qui NONO interagisce con TOPBP1, fondamentale per l’arresto del ciclo cellulare nell’ intra-S checkpoint.

1.7 Famiglia delle proteine DBHS

Il controllo dell’espressione [71] genica implica l'interazione dinamica tra proteine e acidi nucleici. Per regolare e integrare numerosi componenti e percorsi attraverso la regolazione genica, la cellula ha bisogno di fattori che possano colmare il DNA, l'RNA e le proteine.

(25)

Uno di questi esempi di proteine a ponte è la famiglia "multifunzionale" della famiglia Drosophila / Human Splicing (DBHS), formata da diverse proteine.

Le proteine DBHS sono caratterizzate dalla presenza di motivi di riconoscimento in tandem dell’RNA altamente conservati (RRM), da un dominio NonA / paraspeckle (NOPS) e dall’ estremità C-terminale avvolta a spirale [72]. Al di fuori di questa regione conservata, i membri della famiglia differiscono in modo significativo, sia per la lunghezza che per la complessità della sequenza. Negli esseri umani, ritroviamo tre membri della famiglia: SFPQ (fattore di splicing prolina / glutammina), NONO (o p54nrb) e PSPC1 (componente 1 della proteina paraspeckle.

Le proteine DBHS sono fattori nucleari e presentano un segnale di localizzazione sull’estremità C-terminale; oltre al nucleo è possibile ritrovarle anche all’interno di corpi subnucleari (paraspeckle), o a livello della cromatina o in prossimità del danno al DNA [73,74].

Recenti studi hanno dimostrato che le proteina appartenenti a questa famiglia raramente funzionano da sole e possono essere considerate delle proteine dinamiche in grado di mediare le interazioni proteina-proteina e proteina-acido nucleico.

Tutti i membri di questa famiglia presentano un nucleo conservato di circa 300 aminoacidi definito come regione DBHS. Qui troviamo i due domini RRM (RRM1 e RRM2, ovvero le regioni di interazione tra proteina ed acido nucleico) in tandem separati attraverso un link flessibile di 7 aminoacidi, il dominio di interazione proteina-proteina (NOPS) ed il domino a spirale [75]. Il dominio RRM1 presenta residui aromatici e residui carichi esposti al solvente [75,76,77] mentre RRM2 risulta esserne privo ma, a differenza di RRM1 presenta un motivo di riconoscimento altamente conservato per il DNA e l’RNA [78].

E’ importante dire che queste proteine non lavorano da sole ma si comportano come dimeri. Grazie a questa caratteristica sono in gradi di riconoscere diverse tipologie di acidi nucleici [79,80].

1.7.1 Struttura di NONO

Come accennato, tutte le proteine appartenenti alla famiglia delle DBHS presentano una regione centrale costituita da circa 300 aminoacidi, ma presentano differenze sostanziali

(26)

per le altre regioni. In particolare NONO presenta una regione di lunghezza maggiore a 400 amminoacidi comprendente sia la regione N-terminale che quella C-terminale [81]. Possiede due motivi di riconoscimento per l’RNA in tandem dove l’RRM1 presenta quattro residui aromatici in posizioni conservate ed essenziali per il legame con l’acido nucleico [82], mentre RRM2 presente tre aminoacidi sostituiti con Thr, Lys e Ile. E’ presente anche una regione costituita da circa 52 aminoacidi e scoperta solo recentemente localizzata tra RRM2 e la regione a spirale della proteina (coiled-coil o CC) che prende il nome di NOPS (NONA/paraspeckle). I quattro domini precedentemente menzionati assumono un ruolo fondamentale in quanto rappresentano l’interfaccia d’interazione che è di tipo idrofobico.


Lavorando sotto forma di dimeri, non avremo quattro domini ma bensì otto: quindi assistiamo alla presenza di due domini RRM2; essi si dispongono in modo pseudosimmetrico per andare a circoscrivere un canale di 20Å il quale è a diretto contatto con il solvente. Gli altri due domini RRM1 si dispongono esternamente a questo canale.

!

(27)

Per quanto riguarda il dominio NOPS ha il ruolo di legarsi al dominio RRM2 andando a costituire circa il 65% della superficie totale della proteina. Questo legame induce anche un impatto sulla struttura dello stesso RRM2 in quanto determina la formazione di loop nei cappi 3 e 5 che presentano dei legami ad idrogeno. Il loop numero 3 è quello che si impegna nel legame con l’acido nucleico. I residui altamente conservati all’estremità C-terminale di NOPS sono implicati in complesse interazioni idrofobiche sia con lo stesso RRM2 che con il dominio CC (vedi Fig 4).

Inoltre è presente una sequenza formata da circa 40-50 aminoacidi che si avvolgono su di loro per ottenere una struttura a forma di spirale chiusa ai lati sia da RRM2 che da NOPS. Dagli studi effettuati questa struttura a spirale è antiparallela, destrorsa ed unica. Essa partecipa sia con diversi ruoli nella struttura proteica che nella funzione cellulare [84].

Come si può vedere dalla figura 4E, NONO è formate da due differenti catene con sequenza aminoacidica simile: la catena colorata in ciano rappresenta il dominio RRM1 coinvolto nel legame con l’RNA e rappresenta l’oggetto di studio di questo lavoro di tesi.

1.7.2 Altre applicazioni terapeutiche di NONO

NONO non è coinvolta solo nella progressione del melanoma maligno ma anche di altre patologie. Diversi studi trattano il coinvolgimento di NONO nel tumore al seno; hanno infatti rilevato che la perdita o l’alterazione di questa proteina in concomitanza con la perdita del recettore dell’estrogeno hERα, si traduce in tumori più aggressivi con un conseguente aumento sia delle dimensioni dello stesso che delle metastasi [85].

Inoltre, è stato riscontrato che delle mutazioni di NONO probabilmente portano allo sviluppo di una disabilità intellettuale clinicamente riconoscibile come un deficit sia cognitivo che affettivo [86]. L’ espressione di NONO è alterata anche nei tumori alla prostata [87], colon [88], mentre un’ inversione cromosomica che coinvolge questa proteina ed il fattore trascrizionale TFE3 è stata riscontrata nel carcinoma papillare [89,90]. Mutazioni puntiformi a carico di HLXB9, che hanno interessato NONO, sono state riscontrate nei tumori neuronendocrini [91].

(28)

Capitolo II: Metodi

2.1 Programmi per la visualizzazione

2.1.1 UCSF CHIMERA

Il software Chimera [92], sviluppato dalla University of California, San Francisco, è un programma multifunzionale usato principalmente per la visualizzazione grafica e l’analisi di piccole molecole, proteine ed acidi nucleici. Chimera può essere utilizzato ad esempio per visualizzare i risultati di docking, effettuare allineamenti di sequenze amminoacidiche, analizzare traiettorie ottenute da studi di dinamiche molecolari, o per calcolare legami ad idrogeno, interazioni idrofobiche e visualizzare superfici.

Una funzione molto utile di questo programma è ViewDock che consente l’analisi di multi-file nel formato MOL2, come quelli che si ottengono come risultati del docking molecolare. Per eseguire questa tipologia di analisi è necessario:

• Aprire il file della proteina di interesse o del complesso ligando-proteina dal menu File/

Open;

• Selezionare la funzione ViewDock dal menu Tools/Surface-Binding-Analysis/ViewDock ed aprire i risultati in formato MOL2;

• Dalla finestra di ViewDock così aperta sarà possibile visualizzare i ligandi uno alla volta nella tasca recettoriale;

• Le molecole, inizialmente segnate come tutte Viable (visibili), potranno poi essere nascoste attraverso l’opzione Purged o direttamente eliminate con l’opzione Deleted.

2.1.2 UCSF MAESTRO

Maestro è una piattaforma unificata per l’utilizzo degli strumenti della compagnia Schrodinger, e che permette quindi una grande varietà di utilizzi. Tra le funzionalità peculiari di Maestro troviamo: generazione di modelli e costruzione di molecole di ogni tipo; possibilità di visualizzare da piccole molecole fino a complessi biomolecolari, sia in 3D che in modelli 2D; analisi strutturale quantitativa. Maestro include inoltre strumenti per la misurazione precisa delle caratteristiche strutturali delle molecole, oltre alla possibilità

(29)

di super-imporre strutture per il confronto; gestione ed analisi di dati, calcolo di proprietà molecolari.

2.2 Programmi per lo screening virtuale

Lo screening virtuale (VS) è una tecnica computazionale utilizzata nella scoperta di farmaci per la ricerca di librerie di piccole molecole al fine di identificare quelle strutture che hanno maggiori probabilità di legarsi a un bersaglio, che tipicamente è un recettore o un enzima .

Esistono due grandi categorie di screening virtuale: quello basato sul recettore e quello basato sul ligando.

Il VS receptor-based permette di valutare contemporaneamente un gran numero di possibili molecole, diverse per struttura, ma che per dimensioni molecolari, conformazione sterica ed altri parametri sono in grado di interagire con lo stesso recettore.

Il secondo, ovvero il VS ligand-based, prende come riferimento un ligando noto in letteratura, che presenta una certa attività ed una determinata struttura. Sulla base di questo si effettua una ricerca di molecole che presentano una diversa struttura, ma che sono in grado di fornire le stesse interazioni con il recettore (o enzima) preso come riferimento.

In questo lavoro di tesi è stato usato come approccio lo screening virtuale basato sul recettore attraverso una piattaforma conosciuta come FLAP.

2.2.1 FLAP

FLAP (Fingerprints for Ligands And Proteins) [93] è una piattaforma che fornisce un quadro di riferimento comune per il confronto delle molecole. Le impronte digitali derivano dai Molecular Interaction Fields (MIF) e / o dai tipi di atomi GRID e sono caratterizzate come quadruple di caratteristiche farmacoforiche. Le MIF prodotte dal campo di forza GRID descrivono il tipo, la forza e la direzione delle interazioni che una molecola è in grado di produrre. Le impronte digitali possono essere utilizzate direttamente

(30)

per confrontare due molecole o possono essere utilizzate per sovrapporle, che a loro volta consentono di calcolare la somiglianza MIF più dettagliata.

Questo allineamento molecolare basato su GRID Molecular Interaction Fields è estremamente potente e le applicazioni includono screening virtuale basato su ligando, screening virtuale basato sulla struttura proteica, elucidazione del farmacoforo, docking, 3D-QSAR e confronto basato sulle tasche di legame presenti all’ interno del recettore. FLAP è in grado di tenere conto della flessibilità molecolare, della stereochimica, dello stato di protonazione, del tautomerismo e di tutti gli altri fattori importanti nella progettazione molecolare dei composti chimici.

FLAP è costituito da un'interfaccia grafica e da diversi programmi utilizzabili attraverso la riga di comando. Quest’ interfaccia è facile da usare e segue un approccio basato sul flusso di lavoro. Inizialmente, viene creato un file di sessione temporaneo e gli utenti possono utilizzare il menu 'Sessione' per memorizzare la sessione con un nome descrittivo. I risultati vengono archiviati in questo file e gli utenti possono condividere le sessioni per comunicare i risultati. Quando si riaccede al programma, viene ripristinata l’ultima sessione.

Le voci del menu principale mostrano le applicazioni chiave di FLAP, che sono basate sui ligandi (principalmente screening), sulla struttura (screening e docking), sul farmacoforo e 3D-QSAR. Quando si lavora con un numero elevato di strutture e si esegue uno screening virtuale, è possibile creare un database FLAP che memorizza i MIF e le impronte digitali GRID in modo da eseguire più calcoli di screening più efficientemente. In FLAP è presente una voce, il menu Pre-filtro, che consente di filtrare un numero molto elevato di molecole prendendo come riferimento i MIF e le impronte digitali di tipo atom FLAP Grid in quanto , queste, sono estremamente veloci da calcolare. Una volta terminato è possibile creare un database contente i risultati di questa operazione.

I risultati di qualsiasi operazione vengono quindi visualizzati in schede specifiche in modo che l'utente possa navigare rapidamente tra i dati.

2.2.1.1 Uso dell’interfaccia grafica

Gli utenti Linux possono avviare la GPU di FLAP attraverso il comando seguente:

(31)

La GPU FLAP è organizzata su un approccio basato su attività e consiste in una barra dei menù che permette di accedere alle varie attività e alle pagine delle schede che mostrano i vari risultati.

Come già accennato, tra le varie voci del menù si può trovare:

• menù sessione che contiene le opzioni relative al salvataggio, all'importazione e alla

cancellazione delle sessioni Flap. Il registro può anche essere salvato per registrare la cronologia del progetto;

• menù pre-filtro che consente di filtrare le strutture secondo l'approccio dell'impronta

digitale FLAP; è particolarmente utile quando si lavora su un database di grandi dimensioni per poter ottenere rapidamente un sottoinsieme di strutture che sono raggruppate per somiglianza farmacoforica con un modello preso come riferimento (basato su ligando o su struttura). La fase di pre-filtraggio è strutturata per essere veloce e per costruire un database FLAP per un'analisi più dettagliata;

• menù database che controlla la creazione di un database FLAP. Il database contiene i

MIF GRID, i fingerprint FLAP, le strutture, le conformazioni e tutti i dati associati. Il vantaggio di lavorare con il database FLAP è che questi dati sono calcolati una volta e possono essere riutilizzati, per risparmiare tempo di calcolo quando si eseguono più task virtuali di screening utilizzando le stesse strutture;

• menù basati su ligando e recettore correlati allo screening virtuale FLAP. Lo screening

può essere eseguito su un database aperto (LBVS e SBVS) o su file di strutture esterne (LBVS e SBVS esterni). Il menu basato sulla struttura contiene elementi aggiuntivi per importare e preparare un target di proteine e anche per eseguire il docking basato su frammenti per la previsione di pose;

• menù basato sul farmacoforo che consente la delucidazione della pseudomolecola

farmacoforica comune da un insieme di molecole attive. Il farmacoforo può essere

• utilizzato come modello per lo screening virtuale e può anche essere "ancorato" in una

tasca del recettore per aiutare a convalidare l'ipotesi.

• menù 3D-QSAR

I database FLAP sono tipicamente utilizzati sia per lo screening virtuale che per la modellazione 3D-QSAR e contengono piccole molecole, le loro conformazioni,

(32)

stereoisomeri, tautomeri e stati di protonazione, i MIF GRID, i fingerprint FLAP e tutti i metadati associati. Quando si lavora con più di 10.000 strutture, di solito si esegue un pre-filtro per selezionare un sottoinsieme di composti da aggiungere al database.

In particolare in questo progetto di tesi è stato effettuato uno screening virtuale basato sulla presenza di tasche recettoriali nella proteina di interesse. La ricerca di queste tasche viene utilizzata quando si esegue uno screening virtuale basato sulla struttura. La proteina viene quindi caricata (Structure-based- → Load protein) da un file .pdb. La successiva finestra di dialogo consente l'esecuzione della funzione fixpdb per pulire il pdb, nel caso in cui non sia già stato preparato. La struttura viene caricata nella scheda Tasche, in modo che il sito di interesse di binding possa essere localizzato o specificato. Operativamente la ricerca delle tasche di legame può essere effettuata principalmente in tre modi diversi:

• Importazione di un ligando attraverso la voce Import ligands: la tasca è ricercata prendendo come riferimento il raggio attorno al legando caricato;

• Ricerca della tasca per residuo attraverso la voce Search by residue; la tasca è definita utilizzando un'espansione attorno a questa posizione, vincolata dalla superficie della proteina.

Rilevamento della tasca attraverso la voce Search for pockets; l'algoritmo di rilevamento delle tasche è eseguito per individuare potenziali pocket nella proteina. Questo algoritmo è in grado di identificare sia delle grandi cavità che più tasche di dimensioni minori. • Quando si esegue uno screening virtuale basato sulla struttura, con FLAP è possibile

allineare una molecola di piccole dimensioni all’ interno delle cavità trovata per mezzo della voce Search Pockets.

Una procedura classica di virtual screening con FLAP prevede quindi, come primo passaggio il pre-filtro, che ci permette di ridurre notevolmente il numero di molecole scansionate. Successivamente si effettua la costruzione del database ed in base a questo si sceglie il tipo di screening ottimale per lo studio che deve essere svolto.

(33)

2.3 Programmi per il docking

2.3.1 Definizione di Docking

Il docking è un’operazione utilizzata per esplorare la conformazione di legame tra un complesso di due molecole. La procedura di docking viene usata come guida per identificare l’orientazione più probabile per un ligando con una macromolecola. Al ligando viene garantita la possibilità di subire piccoli cambiamenti conformazionali per evitare la repulsione dovuta ad eventuale ingombro sterico e produrre così interazione favorevoli con il recettore. In una procedura di docking automatizzato, data la struttura in 3D di una proteina, il programma è in grado di eseguire il docking, cioè di adattare in una cavità un ligando in una conformazione plausibile. Inizialmente si avrà un'orientazione approssimata, che sarà successivamente ottimizzata in modo tale da ottenere le massime interazioni favorevoli. Il calcolo termina quando si ottiene un minimo energetico per il complesso.

Le tipologie di programmi di docking automatizzato possono essere divisi in:

• Esaustivo: per ogni ligando viene generato un gran numero di conformeri, e tutti vengono valutati (ad esempio FRED );

• Stocastico: solo alcune soluzioni vengono valutate, i risultati così potrebbero non essere ripetibili.

2.3.2 AUTODOCK

Autodock [94] è una suite di strumenti per il docking automatizzato, e che comprende due programmi principali: Autodock 4 e Autodock Vina.

E’ presente un’interfaccia grafica ( AutodockTools o ADT ), ma è anche possibile richiamare i due programmi da shell.

L’algoritmo operativo di Autodock è di tipo genetico e prende il nome di Lamarckian

Genetic Algorithm. Allo stesso modo della teoria evoluzionistica del naturalista Lamarck,

ogni volta che viene generata una nuova popolazione sarà possibile ottimizzare le soluzioni considerando “l’intorno energetico”; in questo modo il “genotipo”, ovvero la stringa binaria a cui corrisponde ciascun ligando verrà influenzato da fattori esterni. Oltre

(34)

all’algoritmo genetico Lamarckiano (LGA) sono anche disponibili algoritmi genetici traduzionali e simulated annealing.

Il punto di partenza è una popolazione iniziale da cui l’algoritmo seleziona un insieme di soluzioni in base alla scoring function, che darà origine ad una nuova popolazione di soluzioni figlie, da cui avrà inizio un ulteriore ciclo di generazione. Le popolazioni di soluzioni sono ottenute tramite operatori genetici (mutazioni, crossover e migrazioni) che imitano quelli biologici. I gradi di libertà sono codificati in geni o stringhe binarie, ed a geni e cromosomi viene assegnato un valore basato sulla fitness della scoring function. Le operazioni di mutazione causano cambiamenti nel valore di un gene, mentre il crossover muove un set di geni da un cromosoma “genitore” ad un altro; la migrazione invece muove singoli geni da una sottopopolazione ad un’altra.

Autodock usa una scoring function ad energia libera per valutare le conformazioni durante il docking. Il force-field è semi-empirico, ed è stato parametrizzato con un gran numero di complessi proteina-inibitore per i quali sia la struttura sia la costante di inibizione sono noti. L’interazione tra ligando e proteina viene valutata in due fasi: la prima valuta la variazione di energia intramolecolare nel passaggio dalla conformazione libera del ligando a quella legata; la seconda fase, invece, prende in considerazione la variazione di energia intermolecolare del complesso proteina-ligando nella conformazione legata.

Per la preparazione dei file di input, la procedura è la stessa usata per il programma VINA (vedi paragrafo 2.3.3.1). Qui vediamo sola la procedura per la preparazione della griglia AutoGrid in quanto la procedura differisce da quella di VINA.

2.3.2.1 Generazione della griglia AutoGrid;

Una rapida valutazione energetica è ottenuta pre-calcolando il potenziale di affinità atomica per ogni atomo type della molecola da dockare. In questa procedura una proteina viene messa all’ interno di una griglia tridimensionale ed un atomo sonda è situato in ogni punto della griglia, per cui viene assegnato un valore che tiene conto dell’ energia d’interazione di ognuno di questi atomi con la proteina. I file contenenti i parametri della griglia specificano le coordinate circostanti al recettore dove devono essere calcolati il potenziale, il tipo di mappe, la dimensione e la posizione di tali mappe. In generale quindi

(35)

viene calcolata la mappa per ogni tipo di atomo nel ligando, una per il potenziale elettrostatico ed una per la desolvatazione. 


Sempre da interfaccia grafica, per la definizione dei parametri necessari alla creazione della griglia è stata usata la seguente procedura:

• Importare i file PDBQT, generati in precedenza, della proteina e del ligando complessato;

• Dalla barra dei menu scegliere Grid/Set Map Types/Directly. In tal modo si apre il widget AutoGPF Ligand che rende possibile la modifica delle mappe da calcolare. Cliccare su Accept per chiudere il widget.

• Selezionando dal menù Grid/GridBox si apre la finestra di GridOptions. Questa possiede dei bottoni in alto: File, Center, View e Help. Il tasto File consente di chiudere la finestra salvando o meno le modifiche; il tasto Center serve per centrare il box della griglia; il tasto View è utile per modificare la visibilità del box. Nella finestra di dialogo sono inoltre mostrati i Current Total Grid Points delle mappe che definiscono le dimensioni di ognuna. E’ possibile variare le dimensioni delle mappe, le distanze tra i punti della griglia e la posizione del centro di essa. Una volta modificata la griglia come desiderato cliccare su File/CloseSavingCurrent;

• Selezionare dal menù Grid/Output/SaveGPF.

Per la creazione della griglia ho seguito la seguente procedura:

• Cliccare su Run/RunAutoGrid; nella stessa finestra specificare il computer su cui si desidera lavorare cliccando Run/HostPreferences. Specificare il percorso della cartella dei file eseguibile e dei file contenenti i parametri, e il nome che verrà dato ai file di output nell’ apposito spazio.

• Una volta impostate tutte le preferenze cliccare dal menù il tasto Launch per lanciare il calcolo.

2.3.2.2 Autodock da shell:

Autodock, come gli altri programmi usati, oltre all’uso da interfaccia grafica, ne prevede anche uno da shell, più diretto, veloce e comodo. Gli step da seguire sono sempre i soliti:

(36)

• Pythonsh/usr/local/MGLTools1.5.6rc3/MGLToolsPckgs/AutodockTools/utilities24/ prepare_ligand4.py -l lig.mol2 >> log

Preparazione dei file di input della proteina:

• Prepare_receptor4.py -r prot.pdb -o prot.pdbqt

Generazione delle coordinate del box e degli atomi type da inserire nella griglia:

• #! /bin/csh -f ./pdbbox_15lig.pdbqt > log

Pythonsh/usr/local/MGLTools1.5.6rc3/MGLToolsPckgs/AutoDockTools/Utilities24/ prepare.gpf4.py -l lig.pdbqt -r prot-pdbqt -p ligand_types= A C F HD N NA OA S P SA Br Cl I / ‘ > TEMP

cat TEMP | sed ‘10i\map prot.I.map\’ | sed’ 10i \ map

prot.Cl.map\’ | sed’ 10i \ map prot.Br.map\’ | sed’ 10i \ map prot.SA.map\’ | sed’ 10i \ map prot.P.map\’ | sed’ 10i \ map prot.S.map\’ | sed’ 10i \ map prot.IOAmap\’ | sed’ 10i \ map prot.NA.map\’ | sed’ 10i \ map prot.N.map\’ | sed’ 10i \ map prot.HD.map\’ | sed’ 10i \ map prot.F.map\’ | sed’ 10i \ map prot.C.map\’ > prot.gpf

setenv var `grep “gridcenter” log`

set gct= `echo $var|sed`s /#xyz-coordinates or “auto” //`|sed`s/ REMARK gridcenter //'`

set c1 = `echo $gct | awk ‘{print $1}'' set c1 = `echo $gct | awk ‘{print $2}'' set c1 = `echo $gct | awk ‘{print $3}''

cat prot.gpf | sed`s / gridautocenter auto/gridcenter `$c1 `$c2 `$c3/` > pro

cat pro | sed `s| ,/ ./g` > prot.gpf

(37)

set gct1=`echo $var1|sed `s /#num.gridpoints in xyz//`\sed`s/ REMARK npts //‘`

set d1=`echo $gct1| awk ‘{print $1}'' set d2=`echo $gct1| awk ‘{print $2}'' set d3=`echo $gct1| awk ‘{print $3}''

set 1d prot.gpf > int

sed` 1i |npts ' $d1' $d2' $d3’ \ ' int > pro1

mvpro1 prot.gpf

rm. int

rm pro

rm log

./pdbbox15= assicurarsi di avere il programma PDBBOX15 all’ interno della cartella dove si lancia lo script, poiché è quello che genera il box in base alla posizione del ligando. Pythonsh…= serve per creare le mappe degli atomi della proteina e trasferirle nel file di output prot.gpf, creando prima un file TEMP dal quale poi, attraverso la funzione di cat, i dati vengono inseriti nel file pro.gpf. set= servono per scrivere le coordinate e le dimensioni della griglia nel file prot.gpf.

Una volta creato il file prot.gpf si può mandare il calcolo della griglia attraverso il comando:

• Autogrid4 -p prot.gpf -l prot.glg

Riferimenti

Documenti correlati

PREDICTED: similar to transmembrane 9 superfamily protein member 4 [Nasonia vitripennis]. PREDICTED: similar to trophinin isoform 2

The study focuses on the period between 1989 and 2010, two decades that include symbolic events in terms of the regulation of religious diversity in both Quebec and France,

Se la retta ed r sono complanari, si scriva un’equazione cartesiana di un piano che le contiene, se la retta ed r sono sghembe, si scrivano equazioni cartesiane dei due piani

Organizzazione strutturale del gene codificante per la proteina zinc finger ZNF224.. nologie Industriali-Modulo Processi Ortologhi e paraloghi della proteina zinc finger

E dopo quel primo incontro, il passaggio da manoscritto a libro ebbe inizio. Leo Longanesi, rimasto colpito dal romanzo, l’indomani propose a Berto un contratto in cui si

Nell’ultima colonna della tabella viene riportato il numero di gestori di eccezione associati al metodo corrente, questa scelta è dovuta al fatto che nella versione attuale

Il Re, che aveva già guardato per dritto e per traverso il lavoro della fornaia e della tessitrice, aperse la noce del più piccino, e intanto i fratelli sghignazzavano?. Aperta la

Dalla distribuzione in Figura 6.2 si evince che all’ingresso del core lo schema Upwind calcola una ampia zona di diffusione tra i flussi provenienti dai 4 loops, questo