• Non ci sono risultati.

Simulazione di spettri eccitonici di Dicroismo Circolare di molecole biologiche

N/A
N/A
Protected

Academic year: 2021

Condividi "Simulazione di spettri eccitonici di Dicroismo Circolare di molecole biologiche"

Copied!
72
0
0

Testo completo

(1)

Indice

1 Introduzione 3

2 L'approccio computazionale 7

2.1 Teoria del Funzionale Densità: DFT . . . 8

2.1.1 Il metodo di Kohn e Sham . . . 9

2.2 TDDFT: una via per gli stati eccitati . . . 12

2.3 Trattazione dell'ambiente: metodi QM/Classico . . . 13

2.3.1 Il modello PCM . . . 14

2.3.2 Il modello MMPol . . . 18

2.4 Il modello QM-Eccitonico . . . 19

2.4.1 Calcolo della forza rotazionale . . . 22

3 Risultati e discussione 23 3.1 RNA 2KOC e DNA G quadruplex 143D . . . 23

3.1.1 Confronto delle strutture . . . 24

3.1.2 Spettri CD sperimentali . . . 24

3.2 La scelta del livello di calcolo . . . 26

3.3 Risultati RNA β-hairpin . . . 38

3.3.1 Strutture NMR . . . 39

3.3.2 Strutture MD . . . 40

3.3.3 Simulazione dello spettro CD in vuoto . . . 41

3.3.4 Simulazioni con descrizione dell'ambiente: il modello MMPol . . . 49

3.4 DNA G quadruplex . . . 53

4 Conclusioni 62

(2)
(3)

Capitolo

1

Introduzione

Gli ultimi anni sono stati caratterizzati da un signicativo sviluppo di nuove tecniche spettroscopiche capaci di descrivere i processi generati dall'intera-zione tra radiadall'intera-zione e materia a livello sempre più dettagliato raggiungendo scale temporali e spaziali dell'ordine dei processi molecolari. A questo aspetto si è aancata una sempre crescente capacità di calcolo che rende routina-ri studi computazionali no a pochi decenni fa dicilmente immaginabili. Grazie alla combinazione di questi due fattori il contributo della chimica computazionale nella simulazione di spettroscopie è cresciuto in modo signi-cativo come anche la sua attività di supporto a vari ambiti della chimica sperimentale come mezzo d'interpretazione avanzato. Un esempio di spettro-scopia molto diusa in ambito chimico è il Dicroismo Circolare (CD)[1] nelle sue varianti elettroniche (ECD) e vibrazionali (VCD). Questa spettroscopia sfrutta l'assorbimento dierenziato della luce circolarmente polarizzata che è caratteristico delle specie chirali, rappresentando uno dei principali mezzi d'indagine strutturale e per la determinazione di congurazioni assolute di molecole otticamente attive.

Questo lavoro di tesi ha lo scopo di orire un approccio computazionale utile a razionalizzare spettri di dicroismo circolare elettronico in sistemi multicro-moforici complessi. Verrà data particolare enfasi all'inclusione degli eetti d'ambiente e di interazione col solvente, non trascurabili in sistemi in fase condensata.

I sistemi studiati sono rappresentati da due macromolecole biologiche, in par-ticolare due oligonucleotidi caratteristici per la loro struttura secondaria. Il primo consiste di una sequenza di RNA composta da 14 nucleotidi (Figu-ra 1.1); il lamento curvandosi forma una β hairpin g(Figu-razie all'instau(Figu-razione di legami ad idrogeno, analogamente a quanto avviene tra le coppie di basi azotate nella doppia elica di DNA, ed alle interazioni dispersive π-stacking.

(4)

Questa struttura è tipica anche di sequenze polipeptidiche e nel caso del-l'RNA ha un ruolo nel silenziamento dell'espressione genica [2]. L'hairpin in esame (Figura 1.1) è particolarmente nota e studiata sia spettroscopica-mente sia con simulazioni di Dinamica Molecolare grazie alla sua particolare stabilità dovuta al tetraloop che costituisce la porzione in cui il lamento si ripiega ed in cui quattro basi azotate formano una rete di legami ad idrogeno, interagendo anche con gli zuccheri della backbone.

La seconda molecola è una sequenza di DNA costituita da 22 nucleotidi, particolarmente ricco in guanine. Grazie a queste il lamento si ripiega a formare un G quadruplex intramolecolare (Figura 1.2) fortemente caratte-rizzato dalla costituzione di tre piani formati da quartetti di guanine che interagiscono, anche in questo caso, con la formazione di legami ad idrogeno ed interazioni di tipo π-stacking. Queste sequenze telomeriche si ritrovano in generale nelle porzioni terminali dei cromosomi e quello in esame in par-ticolare nel genoma umano [3]. Come la β hairpin anche il G quadruplex è stato largamente studiato all'NMR e ai raggi-X. Si riteneva fossero porzioni di DNA non codicante ma sono stati proposti diversi modelli per interpre-tarne le funzioni biologiche tra cui il collegamento all'attività di regolazione dell'espressione genica [4]. Risulta in questa ottica di profondo interesse nel-la medicina oncologica come agente capace di bloccare nel-la riproduzione delle cellule cancerose [5].

Entrambe le sequenze oligonucleotidiche mostrano attività chirottica indotta dalla stessa struttura supramolecolare e non dovuta alla presenza di centri chirali. Infatti le porzioni dei nucleotidi che interagiscono con la luce sono le basi azotate, che di per sè non mostrano segnali di dicroismo circolare. Per descrivere l'eccitazione e la conseguente risposta spettroscopica di questi sistemi in cui sono presenti diversi cromofori tra loro vicini ed interagenti, si è impiegato il modello eccitonico calcolando tutte le proprietà necessa-rie per riprodurre il segnale CD dovuto alle coppie eccitoniche (EC) con metodi quantomeccanici di tipo ibrido. In tali metodi la descrizione quan-tomeccanica del sottositema di interesse viene combinata ad una descrizione classica per includere l'eetto dell'ambiente. Per quanto riguarda la par-te quantomeccanica del sispar-tema, il metodo di calcolo scelto è la par-teoria del funzionale di densità (Density Functional Theory, DFT) nella sua versione tempo-dipendente (TD) che rappresenta un buon compromesso tra costo di calcolo ed accuratezza per descrivere eccitazioni molecolari. Tutti i calcoli sono stati fatti utilizzando il pacchetto Gaussian 09 [6].

Ad una descrizione completamente statica del sistema è stata aancato lo studio dell'eetto delle uttuazioni ambientali e strutturali grazie all'accop-piamento dei modelli proposti con simulazioni di Dinamica Molecolare clas-sica in solvente esplicito. Gli spettri simulati sono stati poi confrontati con i

(5)

CAPITOLO 1. INTRODUZIONE 5 dati sperimentali disponibili.

Figura 1.1: RNA β hairpin: la sequenza che la identica in termini delle basi azotate in essa contenute è (GGCACUUCGGUGCC) di 14 nucleotidi; le quattro basi centrali (UUCG) formano il loop della struttura a forcina.

(6)

Figura 1.2: DNA G quadruplex: la sequenza che identica questo oligonu-cleotide ricco in guanine è [AG3(T2AG3)3]; i 22 nucleotidi si avvolgono nella caratteristica struttura telomerica dove le guanine formano dei quartetti che identicano 3 piani nella parte centrale della struttura.

(7)

Capitolo

2

L'approccio computazionale

La teoria fondamentale per la nostra conoscenza del mondo microscopico è quella della Meccanica Quantistica (QM). In particolare, l'applicazione di tale teoria a sistemi atomici e molecolari si basa sulla ben nota equazione di Schrödinger che, nella sua formulazione indipendente dal tempo, è scritta come

ˆ

H |Ψi = E |Ψi , (2.1)

dove ˆH è un operatore Hermitiano, l'Hamiltoniano del sistema, |Ψi la fun-zione d'onda che contiene tutte le informazioni sullo stato del sistema ed E l'energia. La struttura elettronica di un sistema molecolare e molteplici sue proprietà possono essere così calcolate almeno in linea di principio risolven-do tale equazione. Per un generico sistema polielettronico, l'operatore ˆH si può esprimere, nell'approssimazione di Born-Oppenheimer (BO) ed in unità atomiche, come: ˆ H =X i h(i) + 1 2 X ij 1 rij , (2.2) dove il termine 1

rij è il potenziale coulombiano tra le cariche degli elettroni a

distanza rij; con l'operatore monoelettronico h(i) denito come:

h(i) = −X i " 1 2∇(i) − X n Zn rin # , (2.3)

in cui Zn è la carica del nucleo n-esimo e Znsu rinl'interazione elettrostatica

tra questa e l'elettrone i-esimo. Di fatto l'equazione di Schrödinger è riso-lubile analiticamente solo per sistemi semplici, è quindi di grande interesse la formulazione di metodi approssimati. Due sono, principalmente, i metodi d'approssimazione usati nell'ambito della descrizione quantistica di sistemi

(8)

atomici e molecolari; uno di questi è il metodo variazionale mentre l'altro è noto come teoria perturbativa. In questa tesi, si è fatto uso di una versione del metodo variazionale che è nota come formulazione Kohn-Sham (KS) della Teoria del Funzionale di densità che qui riassumiamo brevemente.

2.1 Teoria del Funzionale Densità: DFT

Il metodo DFT è stato sviluppato nell'ambito della sica dello stato solido per trattare sistemi a molti elettroni, ma ha trovato larghissimo impiego nella Chimica Quantistica e Computazionale per lo studio di molecole con anche un numero notevole di atomi, grazie al suo approccio non basato sulla funzione d'onda, come il più classico Hartree-Fock od i suoi eredi, detti metodi post Hartree-Fock, quanto invece sulla densità elettronica. Immaginando di dover trattare un sistema costituito da N elettroni, con N molto grande, nello schema a funzione d'onda questo avrà una Ψ totale che dipenderà da 3N coordinate spaziali, più le N dovute allo spin. Nella DFT invece della funzione d'onda è il suo modulo quadro ad assumere un ruolo preminente, che integrato sulle coordinate elettroniche

ρ(r e ) = N Z d3r2... Z d3rN|Ψ(r e , r e 2, ...r e N)|2, (2.4)

fornisce la funzione densità elettronica, che dipende da tre sole coordinate al posto di 3N. Contrariamente alla funzione d'onda la densità elettronica è un'osservabile del sistema sperimentalmente misurabile; la funzione ρ(r

e ) rappresenta, nello stato descritto da Ψ, la probabilità di trovare un qualsiasi elettrone all'interno di un elemento di volume d3r attorno al punto r. É

intuitiva l'inclusione dello spin nella forma della funzione prima proposta, integrando su tutte le coordinate di spin, lasciando cioè arbitrario lo stato di spin, mentre il fattore N è dovuto all'indistinguibilità degli elettroni. La Teoria DFT si basa in gran parte sul lavoro di Hohenberg e Kohn (HK) [7] ed in particolare sui loro due teoremi, che esponiamo senza dimostrare: Teorema 2.1.1 (Primo teorema di HK). Il potenziale esterno Vext(r) è,

a meno di una costante, un funzionale unico di ρ(r e

); sin quando Vext(r)

determina l'operatore ˆH tutte le proprietà dello stato fondamentale di un sistema multielettronico sono anch'esse un funzionale unico di ρ(r

e ).

Teorema 2.1.2 (Secondo teorema di HK). Detto FHK[ρ] il funzionale che

fornisce l'energia dello stato fondamentale del sistema, questo restituisce la minima energia se e solo se la densità elettronica da cui dipende è quella vera dello stato fondamentale, ρ0.

(9)

CAPITOLO 2. L'APPROCCIO COMPUTAZIONALE 9 Il primo teorema di HK è la base teorica cercata che stabilisce come la ρ(r

e

) sia una grandezza suciente a conoscere lo stato del sistema, con la restrizione che questa sia collegata ad un potenziale esterno, mentre il secondo inserisce la DFT in uno schema pienamente variazionale, non esprimendo altro che il principio variazionale

E0 ≤ E[ρ] = T [ρ] + EN e[ρ] + Eee[ρ], (2.5)

dove l'energia è già scritta come somma dei contributi cinetico, d'interazione attrattiva nucleo-elettrone e repulsivo elettrone-elettrone, ciascuno funzio-nale della ρ(r

e

). In altre parole per ogni densità elettronica che soddis le condizioni al contorno tipiche (ρ(r) ≥ 0 , R ρ(r

e

)d3r = N), associata a

qual-che potenziale esterno Vext, l'energia ottenuta dal funzionale nell'equazione

2.5 rappresenta un limite superiore all'energia vera dello stato fondamentale, E0.

2.1.1 Il metodo di Kohn e Sham

Come già sottolineato il secondo teorema di Hohenberg e Kohn inserisce la DFT in uno schema variazionale, così anche qui ci si ritrova a dover risol-vere un problema di minimo quando si intende trovare, ad esempio, l'ener-gia di stato fondamentale di un sistema a molti corpi come funzionale della sola densità elettronica. Questo fu formulato da Kohn e Sham (KS) nel 1965 [8] introducendo un set di spin orbitali, detti orbitali di KS, da ottimiz-zarsi all'autoconsistenza. Sulla base dei teoremi di HK l'energia dello stato fondamentale di un sistema molecolare si può scrivere come:

E0 = min ρ→N  F[ρ] + Z ρ(r e )VNed3r  , (2.6)

dove F[ρ] è il funzionale universale che il primo teorema di HK ci assicu-ra esistere, non dicendo però che forma questo debba avere. In esso sono contenuti i contributi dell'energia cinetica, l'energia di scambio dovuta al-l'antisimmetria dei sistemi fermionici ed eetti di correlazione tra elettroni con spin parallelo ed antiparallelo, e l'interazione classica di tipo coulombia-na. Tra tutti questi contributi l'unico di cui la forma funzionale esatta è conosciuta è quest'ultimo J[ρ] = 1 2 Z Z ρ(r e 1)ρ(r e 2) r12 d3r1d3r2, (2.7)

Nel metodo KS si cerca di recuperare la maggior parte del contributo cinetico all'energia a partire da un sistema di riferimento ad elettroni non-interagenti.

(10)

Per sottolineare un'altra analogia con l'HF ricordiamo che in questo meto-do gli spin orbitali vengono usati per costruire la migliore approssimazione alla funzione d'onda a singolo determinante ΨSD del sistema reale, ma che

questa può anche essere vista come quella esatta di un sistema ideale ad N elettroni non-interagenti che si muovono nel potenziale eettivo del sistema. Ricordiamo che per un tale sistema (non-interagente) l'energia cinetica può essere scritta in modo esatto come

THF= − 1 2 N X i χi ∇2i χi , (2.8)

dato il set di spin orbitali { χi}che minimizza l'energia di Hartree-Fock EHF.

Tornando alla DFT é proprio a partire da questo fatto che KS si avvalgono per recuperare la maggior parte del contributo cinetico all'energia nel sistema reale. Ricordando che un determinante di Slater è la funzione d'onda esatta per un sistema a fermioni non interagenti, si può assumere un sistema di riferimento costituito da tali particelle e considerarne l'Hamiltoniano

ˆ H = −1 2 N X i ∇2 i + N X i ˆ Vs(r e i) (2.9)

dove si è aggiunto il potenziale eettivo e locale, nel senso che non dipende dai valori che assume in r0

e 6= r e , ˆVs(r e )

Gli spin orbitali, che indichiamo con |φi e diciamo di Kohn e Sham per distinguerli da quelli HF |χi, che costituiscono il determinante di Slater dello stato fondamentale sono determinati dall'equazione

ˆfKS

ii = i|φii, (2.10)

dove ˆfKS è l'operatore monoelettronico di KS denito come

ˆfKS = −1 2∇ 2 i + ˆVs(r e ). (2.11)

La connessione tra questo sistema modello e quello a cui si è realmente in-teressati sta nello scegliere il potenziale locale in modo che gli spin orbitali di KS restituiscano la vera densità elettronica dello stato fondamentale del sitema ad elettroni interagenti, cioè che

ρs(r e ) = N X i X s |φi(r e , s)|2 = ρ0 (2.12)

(11)

CAPITOLO 2. L'APPROCCIO COMPUTAZIONALE 11 ed è dunque necessario stabilire una via per trovare un tale ˆVS.

Risulta evidente come data TS= − 1 2 N X i φi ∇2i φi (2.13) l'energia cinetica esatta del sistema non interagente ottenuta a partire dal-la densità ρs = ρ0, sia vero che questa è in generale diversa, anzi minore,

dell'energia cinetica del sistema interagente T, che contrariamente a TS non

conosciamo esattamente. É a questo punto che KS introducono una nuova forma del funzionale

F[ρ(r e )] = TS[ρ(r e )] + J[ρ(r e )] + EXC[ρ(r e )], (2.14)

in cui l'energia di scambio e correlazione EXC è denita come:

EXC[ρ(r e )] = (T[ρ(r e )] − TS[ρ(r e )]) + (Eee[ρ(r e )] − J[ρ(r e )]) = TC[ρ(r e )] + Encl[ρ(r e )], (2.15) e basta aggiungere ENe[ρ(r e

)] alla 2.26 per ottenere la già nota espressione dell'energia del sistema interagente.

In questo modo tutto quanto non è conosciuto del sistema reale viene rac-colto nel contributo non classico all'energia, che ora non include solo termini dell'energia potenziale ma anche TC che è proprio la parte di energia

cine-tica non compresa in TS. Applicando ora il principio variazionale, con la

prescrizione che valga

hφi|φji = δij, (2.16)

si trova la condizione di minimo per l'energia, esattamente come nel metodo HF, risultandone che h −1 2∇ 2+ Z ρ(r e 2) r e 12 d3r2+ ˆVXC(r e 1)− N X A ZA r e 1A i |φii =  −1 2∇ 2+ ˆV eff(r e 1)  |φii = i|φii, (2.17) e combinando questo risultato con l'equazione 2.23 risulta chiaro che

ˆ VS(r e ) ≡ ˆVeff(r e ) = Z ρ(r e 2) r e 12 d3r2+ ˆVXC(r e 1) − N X A ZA r e 1A , (2.18)

da cui è evidente la caratteristica del metodo di essere Self Consistent visto che per trovare gli orbitali KS da cui ottenere la densità elettronica è neces-sario conoscere il potenziale eettivo, che però dipende dalla stessa densità.

(12)

É importante evidenziare come ˆVXC non sia noto ed in linea di principio

denito come la derivata funzionale dell'energia di scambio-correlazione ˆ

VXC ≡

∂EXC

∂ρ , (2.19)

e che se lo fosse il metodo di KS fornirebbe l'energia esatta per lo stato fondamentale del sistema reale. Contrariamente al metodo HF qui non si fanno altre approssimazioni se non quella della forma di questa porzione del funzionale, che costituisce l'argomento di massimo interesse nell'ambito di ricerca, anche moderno, della DFT. Alcuni esempi di approssimazione al funzionale scambio-correlazione verranno forniti in seguito.

2.2 TDDFT: una via per gli stati eccitati

La teoria DFT presentata nella precedente sezione può essere generalizzata a problemi coinvolgenti potenziali esterni dipendenti dal tempo. In particolare, essa può essere riformulata in modo da ottenere le energie di eccitazione dallo stato fondamentale come poli di una funzione di risposta lineare dipendente dalla frequenza della perturbazione. Questa riformulazione è nota come Time Dependent DFT (o TDDFT).

Se indichiamo con F(0)

qp la matrice Hamiltoniana di KS t-indipendende, dove

le lettere q e p rappresentano due orbitali qualsiasi, occupati o virtuali, e con P(0)ij la matrice densità dello stesso stato, nella base degli orbitali ortonormali dello stato fondamentale del sistema imperturbato, si ottiene

F(0)qp = δqpp (2.20)

e

P(0)ij = δij

P(0)ia = P(0)ai = P(0)ab = 0, (2.21) dove con i e j si intendono orbitali occupati e con a e b virtuali, mentre p è

l'energia orbitalica p. A questo punto accendiamo una perturbazione oscil-lante, dipendente dal tempo, che interagendo col sistema quantomeccanico lo perturba; nostro intento e descrivere la risposta al primo ordine, cioè linea-re, a tale perturbazione. Secondo la teoria perturbativa la matrice densità, in questo caso, è considerata come somma di quella imperturbata di stato fondamentale e della sua variazione al primo ordine:

Pqp= P0qp+ P 1

(13)

CAPITOLO 2. L'APPROCCIO COMPUTAZIONALE 13 Lo stesso avviene per l'Hamiltoniano di KS

Fqp= F0qp+ F 1

qp (2.23)

dove in questo caso la variazione al primo ordine comprende la perturba-zione esterna oscillante e il contributo dovuto alla variaperturba-zione della matrice densità. Sostituendo queste espressioni nella versione dipendente dal tempo dell'equazione di KS scritta in termini delle matrici densità:

X

q

{FqpPqr− PqpFqr} = i

∂Ppr

∂t (2.24)

e raccogliendo tutti i termini al prim'ordine si ottiene un'espressione della variazione al primo ordine della matrice densità del sistema, che può essere riscritta nella seguente forma matriciale:

A B B∗ A∗ X Y = ω 1 0 0 −1 X Y , (2.25)

in cui X ed Y contengono le variazioni della densità di transizione al primo ordine per ogni eccitazione con frequenza ω e le matrici A e B formano l'Hessiana dell'energia elettronica.

Nel corso di questo lavoro di tesi faremo largo uso di questo metodo per trovare gli stati eccitati dei sistemi in fase di studio, comprendendo anche una descrizione dell'ambiente classica, con modelli polarizzabili di solvatazione sia impliciti che espliciti.

2.3 Trattazione dell'ambiente:

metodi QM/Classico

In questa sezione presentiamo i modelli QM/MM polarizzabile (QM/MMPol) e QM/PCM (Polarizable Continuum Model), i quali verranno impiegati in questo lavoro di tesi per includere l'eetto dell'ambiente sulle proprietà spet-troscopiche dei sistemi molecolari studiati in uno schema Linear Response TDDFT. Entrambi appartengono alla stessa famiglia dei così detti focussed models. In in questi modelli la peculiarità del modello consiste nella suddivi-sione del sistema in due parti, o sottosistemi, descritti ciascuno ad un diverso livello di accuratezza. Il primo è il sottosistema target, cioè la porzione che più interessa studiare, e viene descritto a livello QM, nel nostro caso con la DFT. Tale sistema può consistere in una singola molecola, come per esempio un soluto isolato oppure assieme alle molecole di solvente nel suo primo gu-scio di solvatazione. Il secondo è tutto il resto, tipicamente il solvente, che

(14)

viene descritto a livello classico atomistico, come nel caso dell'MM, o conti-nuo con il PCM. In ciascuno di questi casi il formalismo del calcolo QM in vacuo viene mantenuto introducendo un Hamiltoniano ecace, Heff,

carat-terizzato dalla presenza di un termine esplicito che rappresenta l'interazione soluto-solvente. Nel caso dell'MM polarizzabile questo tiene anche conto del-l'energia della sola porzione MM. Nella consueta approssimazione di BO, la funzione d'onda elettronica del soluto soddisfa all'equazione

ˆ

Heff|Ψi = ˆH0+ ˆHenv



|Ψi (2.26)

dove ˆH0 è l'Hamiltoniano in gas phase del sottosistema target mentre ˆHenv

rappresenta l'accoppiamento tra la parte quantistica e quella classica. É in questo termine dell'Hamiltoniano che risiede la dierenza tra i model-li focamodel-lizzati. Presenteremo dunque la forma di questi operatori nei casi d'interesse.

2.3.1 Il modello PCM

Il 'Modello del Continuo Polarizzabile' [9] appartiene alla famiglia dei modelli di solvatazione in cui il solvente viene descritto come un continuo caratteriz-zato dalla propria costante dielettrica . Per includere l'eetto del solvente sul sistema possiamo scrivere l'Hamiltoniano del sistema soluto + solvente come ˆ HRF(f e , r e ) = ˆHF(f e ) + ˆHR(r e ) + ˆHint(f e , r e ) (2.27)

dove il primo termine è l'Hamiltoniano della molecola di soluto, di nostro particolare interesse e che costituisce il sott'insieme principale del sistema (F sta per focussed), il secondo termine quello della parte restante (R), in questo caso il solvente, mentre l'ultimo termine dell'equazione rappresenta l'Hamiltoniano d'interazione tra i due, e { f

e

} e { r e

} i rispettivi gradi di libertà. Possiamo allora descrivere l'Hamiltoniano di un modello continuo come un Hamiltoniano ecace

ˆ HRFeff(f e ) = ˆHF(f e ) + ˆVint(f e , Q[(r e , r0 e )]) (2.28) in cui Q[(r e , r0 e

)] è un'appropriata funzione di risposta del solvente all'intera-zione col soluto.

Nel nostro caso l'interazione studiata è quella elettrostatica tra le cariche del soluto in esame, la cui densità di carica indicheremo con ρM(r) e la

polarizzazione prodotta da tali cariche nel solvente: WMS= Z V ρM(r e )Φσ(r e ) dV (2.29)

(15)

CAPITOLO 2. L'APPROCCIO COMPUTAZIONALE 15 con Φσ(r

e

) potenziale elettrostatico generato dal dielettrico polarizzato. Il problema a causa della mutua polarizzazione tra solvente e soluto, che in que-sto modello è intrinseca, va risolto iterativamente no all'auto-consistenza. La polarizzazione del solvente viene modellizzata tramite l'introduzione del concetto di cavità molecolare, cioè una cavità vuota creata in modo da ospita-re al suo interno la molecola di soluto posta nel mezzo solvente che costituisce il dielettrico. Il potenziale elettrostatico generato dalla distribuzione di cari-ca molecolare induce la formazione di cari-cariche, dette apparenti, nel dielettrico che vengono trattate attraverso una distribuzione di densità di carica super-ciale σ(s). In tal modo si proietta sulla supercie della cavità l'interazione tra la molecola d'interesse ed il mezzo circostante. Il campo derivante dal potenziale d'interazione così ottenuto prende il nome di campo di reazione del solvente.

2.3.1.1 Il problema elettrostatico

Scriveremo ora le equazioni dell'elettrostatica indispensabili per ottenere la risposta del solvente alla distribuzione di carica del soluto, le cariche super-ciali apparenti ed i rispettivi potenziali elettrostatici.

In particolare troviamo due domini:

• Vin che è il volume compreso all'interno della cavità molecolare;

• Vout che rappresenta il volume esterno alla cavità.

Per questi valgolo rispettivamente:

- nella cavità il campo elettrico è dovuto alla distribuzione di carica mo-lecolare ρM(r

e

), che imponiamo trovarsi per intero qui, e dalla prima equazione di Maxwell ∇ e · E e in= 4π 0 ρM(r e ) (2.30) in cui E e in = −∇ e Φ(r e ) (2.31)

e ricaviamo così l'equazione di Poisson −∇ e [0∇ e Φ(r e )] = 4πρM(r e ); (2.32)

- fuori dalla cavità, in assenza di cariche esterne scriviamo l'equazione di Laplace −∇ e [r∇ e Φ(r e )] = 0 (2.33) con Φ(r e ) = ΦM[ρM(r e )] + ΦR(r e ) (2.34)

(16)

A questo punto, assumendo che all'interno della cavità la costante dielettrica sia quella del vuoto e che fuori sia quella del solvente di interesse, otteniamo le equazioni elettrostatiche da risolvere

( −∇ e 2Φ(r e ) = 4πρM(r e ) r e ∈ Vin −∇ e 2Φ(r e ) = 0 r e ∈ Vout (2.35) con le relative condizioni al contorno [18]

(

Φin = Φout

(∂Φ∂n)in= (∂Φ∂n)out su Γ

(2.36) che derivano dalla conservazione della componente del campo elettrico per-pendicolare alla supercie di separazione di due mezzi Γ ed in cui compaiono quindi le derivate direzionali dei potenziali elettrostatici fuori e dentro la ca-vità. Da ora in poi consideremo sempre vere le uguaglianze in = 1e out = 

Riportiamo ora le espressioni che consentono di calcolare le cariche appa-renti sull'interfaccia e quindi i potenziali elettrostatici nel processo di mutua polarizzazione soluto-solvente, ed in particolare

ΦR = Φσ(r e ) = Z Γ σ(s e ) (r e − s e )d 2 s (2.37) dove σ(s e

)nel nostro caso è dato da σ(s e ) =  − 1 4π ∂(ΦM+ Φσ)in ∂n (2.38)

espressione che mostra denitivamente come l'interazione soluto-solvente non sia lineare                WMS= R Vint ρM(r e )Φσ(r e ) dV Φσ(r e ) = R Γ σ(s e ) (r e −s e )d 2s σ(s e ) = −1 ∂(ΦM+Φσ)in ∂n (2.39)

Nel PCM per risolvere questo sistema si fa ricorso ad un approccio numerico noto come Boundary Elements Method (BEM), in cui la supercie della cavità viene suddivisa in tessere di dimensioni ∆Sk tali che si possa assumere

come costante la densità di carica su queste qk= ∆Skσ(s

e

(17)

CAPITOLO 2. L'APPROCCIO COMPUTAZIONALE 17 dove k è l'indice che corre sul numero di tessere e s

e

k il vettore che

deni-sce la posizione della k-esima tessera. Il problema viene così discretizzato esprimendo il potenziale elettrostatico sulla cavità come sommatoria delle cariche superciali apparenti della BEM e risolto iterativamente no a rag-giungere l'autoconsistenza. Delineiamo in ne l'approccio quantomeccanico al problema dell'inclusione dell'eetto solvente nella descrizione del sistema di interesse in fase condensata. Sottolineamo che per l'attuale applicazione si è scelto di inserire il PCM nello schema DFT di cui abbiamo precedente-mente discusso.

Per la risoluzione dell'equazione di Shrödinger relativa all'Hamiltoniano ˆHRF eff(f

e ) dell'equazione 2.28 si assume l'approssimazione di BO (nuclei ssi) e la densità di carica molecolare viene divisa nei due termini

ρM(r e ) = ρeM(q e ) + ρNM(Q e ) (2.41)

di cui il primo è relativo agli elettroni e dipende dal set di coordinate elettro-niche { q

e

} mentre il secondo dipende dal set { Q e

} e rappresenta la densità di carica nucleare. Quest'ultima viene considerata per intero localizzata sui nuclei e non viene modicata dalla procedura quantomeccanica.

A questo punto bisogna determinare la forma dell'operatore d'interazione ˆ

Vint. Innanzitutto ricordiamo che l'energia d'interazione ha la forma

Uint = Z V ρM(r e )Φσ(r e ) dV (2.42)

ed è pertanto decomponibile formalmente nei contributi d'interazione nucleo-nucleo, elettrone-nucleo ed elettrone-elettrone. Nell'operatore d'interazione

ˆ

Vint entreranno i corrispondenti termini espressi tramite l'opportuna densità

di carica ed il potenziale di reazione del solvente: ˆ

Vint = ˆVNe+ ˆVee (2.43)

che entra nel problema agli autovalori sin qui delineato ˆ

Heff|Ψi = ( ˆH0M+ ˆV

int) |Ψi (2.44)

Facciamo un accenno al metodo quantomeccanico che viene applicato. Quello che si fa è, come in molti casi, cercare di minimizzare un opportuno funzionale in uno schema variazionale, e questo nei modelli di solvatazione è il funzionale energia libera del sistema

G = D Ψ ˆ H0M+ 12Vˆσ Ψ E hΨ | Ψi . (2.45)

(18)

Diverse formulazioni del PCM sono state sviluppate ed implementate nu-mericamente. La versione che noi abbiamo impiegato è quella che fa uso del Formalismo dell'Equazioni Integrali (IEF) messa a punto da Cancès e Mennucci [10] e che rappresenta una generalizzazione del metodo PCM qui descritto. Questa procedura permette dalla conoscenza della funzione di Green per lo spazio esterno alla molecola di determinare un unico set di ca-riche di polarizzazione diuse sulla sola supercie della cavità molecolare. Non essendo l'obiettivo centrale del presente lavoro discutere nel dettaglio di questo formalismo e della sua applicazione riportiamo per completezza le matrici PCM così come sono implementate per questo modello

qx= −KVx x = el, nucl (2.46) K =  2π  + 1  − 1  Σ−1−D  S −1 2πΣ−1D (2.47) DIEFij = (s e i− s e j) · ˆnj |s e i− s e j|3 (2.48) Sij = 1 |s e i− s e j| (2.49)

Dove Σ−1 è la matrice diagonale delle aree delle tessere.

2.3.2 Il modello MMPol

Nel modello atomistico, detto MM polarizzabile (MMPol) [11], la porzione classica del sistema è descritta attraverso un campo di forze (force eld) pola-rizzabile in cui ad ogni sito è associata una carica ssa ed una polarizzabilità isotropa. In questa ipotesi l'Hamiltoniano di interazione diventa

ˆ

Henv = ˆHMM+ ˆHelQM/MM+ ˆH pol

QM/MM, (2.50)

dove il primo termine tiene conto dell'energia del sottosistema MM (ˆHMM)

e gli ultimi due invece rappresentano la vera e propria interazione soluto-solvente e sono scritti come

ˆ HMM = ˆHelMM+ ˆH pol MM = X m X n>m qmqn rmn − 1 2 X a µinda X m qm(r e a− r e m) |r e a− r e m|3 , (2.51) ˆ HelQM/MM =X m qmVˆQM(rm), (2.52)

(19)

CAPITOLO 2. L'APPROCCIO COMPUTAZIONALE 19 ˆ HpolQM/MM = −1 2 X a µinda EˆQMa (ra). (2.53) ˆ

VQM(rm) e ˆEQMa (ra) sono rispettivamente l'operatore potenziale

elettrostati-co e campo elettrielettrostati-co dovuto agli elettroni ed ai nuclei del sottosistema QM valutati sui siti MM, mentre gli indici m, n ed a corrono sulle cariche sse ed i momenti di dipolo indotto posizionati rispettivamente ad rm ed ra. Gli

operatori Hamiltoniani delle ultime due equazioni descrivono l'interazione tra il sottosistema QM e le cariche MM, e i dipoli elettrici indotti. Notiamo inoltre che mentre ˆHel

MM è un termine costante nell'Hamiltoniano totale, il

contributo di ˆHpol

MM entra nell'operatore di Fock del problema

quantomecca-nico per la dipendenza dei dipoli indotti dalla densità di carica elettronica del sottosistema QM. Questi si possono esprimere come

µinda = αa  E e QM a + E e MM a {q e ; µind}  (2.54)

dove per ogni sito ra si usa una polarizzabilità αa isotropa. Il termine E

e

MM a

contiene il contributo al campo elettrico generato nel sito a, sia delle cariche sse che dei dipoli indotti nel sottosistema MM. Questo campo, e dunque i dipoli che vi contribuiscono, dipende da tutti gli altri dipoli indotti e dun-que l'equazione deve essere risolta iterativamente oppure, se scritta in forma matriciale

µ = BE (2.55)

tramite inversione. La matrice B è quadrata di dimensioni 3N·3N dove N è il numero dei siti polarizzabili ed è determinata unicamente dalle posizioni dei momenti dipolari indotti e dalle polarizzabilità dei siti. Il vettore E invece contiene i contributi dei campi elettrici dovuti alla parte quantistica del sistema e alle cariche MM.

2.4 Il modello QM-Eccitonico

Per poter calcolare le proprietà di stato eccitato di sistemi di grandi dimen-sioni (centinaia di atomi) costituiti da più unità cromoforiche interagenti è necessario adottare una strategia che eviti un approccio diretto al pro-blema. Presentiamo dunque il modello eccitonico che verrà impiegato per calcolare le proprietà del sistema accoppiato e predire lo spettro CD [12]. In particolare, nel nostro caso, tutte le quantità necessarie per la costruzio-ne dell'Hamiltoniano eccitonico sono derivate da calcoli QM [13], parleremo quindi di metodo eccitonico quantomeccanico (QM-EC). Le interazioni tra le unità cromoforiche vengono descritte in termini di densità di transizione

(20)

e non nell'usuale approssimazione dipolare, inadatta per cromofori posti a distanze ridotte [14].

Nel caso più semplice di una coppia di cromofori degeneri interagenti, nello schema eccitonico questi generano due stati eccitonici non degeneri nel siste-ma accoppiato, come proposto da Kasha [15]. La separazione in energia dei due stati eccitonici dipende principalmente dall'intensità dell'accoppiamento (coupling) tra gli stati eccitati dei due cromofori. Nel CD tale transizione eccitonica (exciton coupled, EC) mostra un segnale bisegnato nella stessa regione spettrale d'assorbimento dei due cromofori. Essendo questo lega-to direttamente all'orientazione reciproca dei momenti di dipolo elettrico di transizione, lo spettro ECCD trova largo impiego nella determinazione della congurazione assoluta di specie molecolari.

Nel caso più generale di N cromofori interagenti, che siano molecole diverse o subunità di una molecola di grandi dimensioni, lo stato eccitato del sistema può essere descritto come uno stato eccitonico1

|ΨExcitoni = Nmol X m nstate X i Cmi|φmii (2.56)

dove |φmiiè un prodotto di stati elettronici localizzati sulle subunità

cromo-foriche, delle quali l'm-esima si trova nel proprio i-esimo stato eccitato mentre tutti gli altri cromofori sono nello stato fondamentale; in altre parole lo stato eccitato della molecola complessiva è descritto come combinazione di stati singolarmente eccitati delle sue sub-unità cromoforiche. Dal punto di vista sico questo corrisponde a considerare lo stato eccitato del sistema totale come delocalizzato o condiviso tra più cromofori. L'Hamiltoniano eccitoni-co può allora essere espresso sulla base degli stati elettronici delle subunità cromoforiche come ˆ Hex = Nmol X m nstate X i mi|φmiihφmi| + 1 2 Nmol X mn nstate X ij Vmn(ij)|φmiihφnj|, (2.57)

con i corrispondente alle energie di singola eccitazione dei cromofori,

cal-colati nell'ambito del metodo scelto, ed i termini Vmn(ij) rappresentano i

couplings tra le transizioni di questi. Questi ultimi, vengono calcolati come

1per questa parte ci rifacciamo al Volkhard May, Oliver Kühn, Charge and energy

(21)

CAPITOLO 2. L'APPROCCIO COMPUTAZIONALE 21 somma di più contributi [16]

Vmn(ij) = Z d3r Z d3r0ρT∗mi(r0 e ) 1 |r0 e − r e | + gxc(r 0 e , r e ) ! ρTnj(r e )+ −ωm/n Z d3r ρT∗mi(r e )ρTnj(r e ) (2.58) dei quali il più grande è solitamente il termine coulombiano. gxc è il

ker-nel del termine di scambio-correlazione usato ker-nel metodo quantomeccanico, DFT nel nostro caso e dipende dunque dal funzionale scelto, e l'ultimo ter-mine dell'equazione 2.58 è il terter-mine di overlap scalato per la frequenza di risonanza ωm/n dei due cromofori. Il problema agli autovalori per ottenere le

energie eccitoniche viene risolto diagonalizzando la matrice rappresentativa dell'Hamiltoniano appena descritto

Hex =    1 · · · Vij1N ... ... ... VjiN1 · · · N    (2.59)

che è per sua natura simmetrica.

Per includere l'eetto dell'ambiente possiamo considerare l'accoppiamento tra cromofori in una forma più completa come

V = Vs(ρTm, ρTn) + Vexplicit(ρTm, ρTn) (2.60)

in cui Vexplicit è il contributo esplicito dell'operatore ˆHenv che si aggiunge

all'Hamiltoniano del sistema come termine perturbativo e che rappresenta l'interazione del sistema QM con l'ambiente classico. Vexplicit è diverso in

relazione alla descrizione dell'ambiente che si sceglie e corrisponde a Vexplicit= − X k Z ρT∗m(r e ) 1 |r e − s e k|  q(sk, opt, ρTn) (2.61)

quando l'ambiente viene descritto a livello PCM. Con q indichiamo le ca-riche IEFPCM indotte dalla densità di transizione della subunità n e con sk le corrispondenti posizioni sulla supercie della cavità molecolare. Per la

descrizione atomistica QM/MM polarizzabile si ha invece Vexplicit = − X k Z ρT∗m (r e )(rek− re) |r e k− r e |3  µindk (ρTn) (2.62) in cui k corre su tutti i dipoli indotti posizionati ai rispettivi rk associati ai

siti MM polarizzabili. Questi termini perturbativi sono in generale negativi, risultando nella diminuizione del valore totale del coupling; essi rappresen-tano ciè un fattore di screening, schermando le interazioni elettrostatiche descritte, come eetto della presenza di un ambiente. [17]

(22)

2.4.1 Calcolo della forza rotazionale

Il calcolo della forza rotazionale (R) è necessario per determinare il segnale CD ed è fatto con una formula approssimata basata solo sui momenti di transizione di dipolo elettrico. Per denizione

Rk = Im[h0|ˆµ|ki · hk| ˆm|0i] (2.63) è la forza rotazionale associata alla transizione 0 → k e ˆµ e ˆm sono gli operatori momento di dipolo elettrico e magnetico. Questa espressione può essere semplicata in modo da tener conto del problema della dipendenza dall'origine del dipolo magnetico risultando nella dipendenza di R dal solo ˆµ e da fattori geometrici: Rk= π 2λk N X i,j=1 R e ij· h0| ˆµi× ˆµj|ki (2.64) dove R e

ij è il vettore distanza tra i cromofori i e j e λk è la lunghezza d'onda

della transizione eccitonica. Questa espressione può essere generalizzata per un sistema eccitonico come

Rk = π 2λk N X i,j=1 c(k)i c(k)j R e ij· µi e × µj e (2.65) in cui gli operatori dei momenti di dipolo elettrico di transizione sono stati sostituiti dai corrispondenti vettori ed i coecienti c(k) sono i coecienti

del-l'espansione sugli stati di singola eccitazione che si combinano a formare la funzione d'onda eccitonica 2.56. Per ottenere lo spettro ECCD nale l'ener-gie eccitoniche e le corrispondenti forze rotazionali sono combinate con una forma di riga che riproduca l'allargamento sperimentale dovuto a fenomeni che il calcolo teorico non considera, ad esempio la struttura roto-vibrazionale delle bande. Si è utilizzato per questo scopo una funzione Gaussiana norma-lizzata, la cui deviazione standard è stata determinata in modo da riprodurre la larghezza di banda sperimentale.

(23)

Capitolo

3

Risultati e discussione

In questo capitolo presenteremo i principali risultati del lavoro di tesi per riprodurre gli spettri CD delle due sequenze polinucleotidiche.

Inizialmente eettueremo una descrizione delle strutture e degli spettri CD sperimentali relativi ai due sistemi mettendone in luce similarità e dierenze. Successivamente presenteremo i risultati dello studio computazionale preli-minare volto ad identicare il livello di teoria più adatto per la descrizione quantomeccanica dei cromofori. Inne discuteremo i risultati ottenuti nel-la simunel-lazione degli spettri CD dei due sistemi di interesse. In particonel-lare, durante questa analisi verranno comparati gli spettri CD simulati attraver-so diversi approcci computazionali con i dati sperimentali. Una descrizione critica sarà rivolta anche all'eetto delle uttuazioni strutturali sullo spettro.

3.1 RNA 2KOC e DNA G quadruplex 143D

Le molecole biologiche prese in esame (Figure 1.1 e 1.2) si riferiscono a due sequenze oligonucleotidiche: la prima è una sequenza di RNA costituita da quattordici nucleotidi in una conformazione di tipo beta-hairpin; la seconda è una sequenza di DNA cositutita da ventuno nucleotidi in una conformazione di tipo G quadruplex. Le due strutture sono depositate nel Protein Data Bank (PDB)1 con i rispettivi codici identicativi 2KOC [19] e 143D [20], che

verranno utilizzati anche nel seguito del lavoro per identicare le due diverse strutture. Nelle successive sezioni descriveremo brevemente le caratteristiche strutturali dei due sistemi ed i loro spettri di dicroismo circolare.

1http://www.rcsb.org/pdb/home/home.do

(24)

3.1.1 Confronto delle strutture

La sequenza di RNA considerata presenta due lamenti adiacenti, antiparal-leli, ed un loop costituito da quattro residui (UUCG). Mentre il resto della catena forma una canonica doppia elica simile a quella del DNA, con le basi azotate che si accoppiano formando legami ad idrogeno e π-stacking tra cop-pie adiacenti, le basi del loop interagiscono in modo non convenzionale con una serie di legami ad idrogeno tra base azotata e lo zucchero della catena principale o tra la prima coppia del loop UG. Grazie a queste interazioni la struttura assume la caratteristica forma a forcina, resa particolarmente sta-bile dalla presenza del loop e dall'elevato numero di coppie CG. La sequenza di DNA risulta invece più complessa rispetto a quella della β-hairpin ed è costituita da quattro serie di AG3 (un'adenina seguita da tre guanine) che si ripiegano formando la caratteristica struttura G quadruplex in cui le guanine si aggregano in quartetti tenuti insieme da legami ad idrogeno all'interno di ogni piano e da interazioni dispersive di tipo π-stacking tra un piano e l'al-tro. In questo telomero intramolecolare i quartetti di guanine (Figura 3.1b) sono connessi da due loops laterali ed uno centrale diagonale, come illustrato in Figura 3.1. Questa disposizione genera quattro facce: due tra segmenti adiacenti di guanine che si aancano antiparallelamente, e due parallelamen-te (con verso rispettivamenparallelamen-te opposto e uguale di percorrenza della caparallelamen-tena). Questa disposizione dei lamenti denisce la topologia antiparallela del qua-druplesso. Delle prime due facce una è la più larga mentre l'altra è la più stretta, le seconde due facce sono entrambe di media larghezza. A questo, che è il core della struttura, si aggiungono quattro residui di adenina e sei di timina, caratterizzati da una maggiore libertà conformazionale dovuta ad una minore interazione con il resto del telomero.

In conclusione, le due molecole studiate appartengono alla stessa classe di polimeri naturali e le interazioni che li governano sono equivalenti, ma solo nella β-hairpin le basi formano le coppie canoniche CG e AT, mentre nel quadruplex le guanine formano tra loro dei quartetti tenuti insime da otto legami ad idrogeno.

3.1.2 Spettri CD sperimentali

La diversa struttura molecolare dei due sistemi biologici si riette nei loro spettri CD i quali presentano una forma nettamente diversa, come è possibile osservare dagli spettri sperimentali riportati in Figura 3.2. Le unità mono-meriche costituenti le strutture polinucleotidiche sopra descritte contengono al loro interno le basi (purine e pirimidine) le quali presentano uno spettro di assorbimento con bande intense che cadono nella regione dell'UV. Le singole

(25)

CAPITOLO 3. RISULTATI E DISCUSSIONE 25

(a) Schema del G quadruplex (b) Singolo quartetto di guanine

Figura 3.1: Riportiamo uno schema semplicato della struttura del quadru-plesso (a) e di uno dei tre piani di guanine che costituiscono la parte principale della sua struttura; ogni guanina forma due legami ad idrogeno con ognuna delle sue due vicine, così da essere tenute insieme complessivamente da otto legami ad idrogeno.

(26)

basi azotate, che di per sé sono dei buoni cromofori, non presentano però segnali dicroici in quanto non presentano centri chirali. La loro geometria di equilibrio planare permette inoltre di identicare un piano di simmetria molecolare. Il segnale di dicroismo circolare osservato per le due strutture non è quindi dovuto alla chiralità intrinseca dei singoli cromofori, ma alla chiralità indotta dalla struttura molecolare.

Lo spettro CD, registrato in solvente acquoso, della β-hairpin presenta due picchi positivi agli estremi dello spettro e due bande negative nella zona intermedia, in particolare troviamo:

- tra i 190 ed i 200 nm il picco più intenso, con R positivo, che risulta però non completamente denito in quanto si trova ad energie troppo elevate per permetterne la registrazione;

- a circa 210 nm il primo picco con R negativo;

- circa a 235 nm il secondo picco con R negativo, di intensità minore rispetto al precedente e forma più allargata;

- a circa 265 nm il secondo segnale positivo, costituito apparentemen-te da almeno due diversi contributi, come suggerito dalla sua forma asimmetrica che presenta una coda verso lunghezze d'onda maggiori; - inne, a circa 300 nm, si osserva un'ultima banda con intensità quasi

nulla e di segno negativo.

Nel caso del G quadruplex lo spettro riportato è quello tipico di un G qua-druplex antiparallelo, con i distintivi segnali negativo a 260 nm e positivo a 290 nm. In particolare, possiamo identicare tre segnali principali:

- intorno a 240 nm il primo picco positivo risolto; - a circa 260 nm il picco negativo più intenso;

- il secondo segnale positivo centrato all'incirca sui 290 nm, più largo del precedente.

3.2 La scelta del livello di calcolo

Al ne di descrivere nel modo più accurato possibile nell'ambito della DFT i sistemi molecolari studiati nel presente lavoro è stato esplorato l'impiego di

(27)

CAPITOLO 3. RISULTATI E DISCUSSIONE 27 -20 -10 0 10 20 30 40 50 60 70 200 220 240 260 280 300 320 340 ∆ε (u.a.) Lunghezza d’onda λ (nm) Spettro CD sperimentale RNA Beta hairpin vs G quadruplex

G-Quadruplex RNA β-hairpin

Figura 3.2: Spettri CD sperimentali della struttura 2KOC e 143D registrati in soluzione acquosa.

diversi funzionali sulle basi azotate nelle loro forme più comuni nei polinucleo-tidi come le catene di RNA o DNA. I risultati ottenuti sono stati comparati a quelli trovati in letteratura in studi che impiegano metodi di calcolo di tipo Equation-of-Motion (EOM) Coupled-Cluster che al momento rappresenta il golden standard per una descrizione dettagliata delle eccitazioni elettroni-che. Sulla base della correlazione tra le energie degli stati eccitati ottenuta dal confronto verrà proposto il funzionale per la successiva analisi. Questo passaggio è di fondamentale importanza: dato che le supramolecole biologi-che d'interesse in questo lavoro di tesi sono composte da catene di nucleotidi, in ciascuno dei quali la porzione costituita dalla base azotata rappresenta l'unità cromoforica, è indispensabile che la descrizione quantistica dei singoli cromofori sia di buon livello al ne di descrivere correttamente le proprietà del sistema complessivo. Per ciascuna base e ciascun funzionale sono stati presi in considerazione i primi 12 stati eccitati: tra questi sono presenti non solo stati bright o di valenza ma anche stati dark e Rydberg. É stato inda-gato anche un sistema dimerico di tipo hydrogen-bonded, quello costituito dalla Guanina e dalla Citosina che ricorrono più frequentemente nell'RNA beta hairpin studiato nel presente lavoro di tesi. Il riferimento per la pre-sente analisi è costituito dalla serie di tre articoli di Szalay et al. [21] [22], in cui viene utilizzato l'approccio EOM-CC nella versione che include sin-gole e doppie eccitazioni più correzioni perturbative per le triple eccitazioni

(28)

(CCSD(T)). Si sono comparati puntualmente i risultati CCSD(T) con quelli ottenuti dai vari schemi TDDFT, testando principalmente le variazioni tra quattro tipi di funzionali, due ibridi, PBE0 [23] e B3LYP [24], uno range-separated, CAM-B3LYP [25], e M062X [26] di tipo meta-GGA ibrido e più riccamente parametrizzato. A questi quattro si è aancato anche il metodo semiempirico ZINDO [27], per la notevole economicità di cui questo gode nel processo di calcolo.

Nei lavori di Szalay et al. sono state analizzate le energie di eccitazione e le forza dell'oscillatore per le basi azotate Adenina (A), Citosina (C), Gua-nina (G) e Timina (T). Tenendo conto del fatto che nell'RNA l'uracile (U) sostituisce la T, è stato necessario trovare un riferimento anche per U. Co-me benchmark per U ci si è rifatti al lavoro di Fleig et al. [28] in cui viene utilizzato il livello CC2, che è un'approssimazione del metodo CC. Comune caratteristica di entrambi i lavori è l'uso di basis sets di tipo Dunning molto estesi quali aug-cc-pVTZ nel primo caso e aug-cc-pVQZ nel secondo. Questi set di base sono del tipo correlation − consistent [29] ed includono funzio-ni di polarizzazione e diuse (augmented) (l'ultima porzione dell'acrofunzio-nimo indica il numero di funzioni di base per ogni orbitale atomico di valenza, tripla e quadrupla ζ nel caso corrente). Per la scelta della base dei calcoli TDDFT si è scelto di usare una base contenente funzioni di polarizzazione e funzioni diuse ma rimanendo nella famiglia di basis set proposta da Pople; in particolare, utilizzando anche lo studio presente nel benchmark di Szalay et al., si è scelta la base 6-311+G(d) che rappresnta un buon compromesso tra accuratezza e costo computazionale.

Anche per le geometrie di stato fondamentale di A, C e G si fa riferimento ad un lavoro precedente di Aquino et al. [30], utilizzando le loro stesse strutture ottimizzate a livello MP2. Invece per U l'ottimizzazione è stata ottenuta in questo lavoro di tesi utilizzando lo stesso livello di calcolo con basis set 6-311+G(d).

I risultati del confronto sono riportati dalla tabella 3.1 alla 3.6 insieme ai graci che riportano l'energia d'eccitazione calcolata a livello DFT per ogni base in funzione dell'energia CCSD(T) oltre che i dati relativi alle regressioni lineari raccolti nella tabella 3.6. Riportiamo inne i dati relativi allo sco-stamento dall'energia (Tabella 3.7) CC dei vari funzionali per ciascuna base, facendo la media dei valori assoluti dei ∆E relativi a ciascuna transizione.

Sia dai dati numerici delle tabelle del benchmark che dai graci di corre-lazione delle energie di stato eccitato è possibile osservare innanzitutto come mentre per A e U il comportamento dei quattro funzionali sia abbastanza omogeneo (con risultati generalmente buoni anche se presentano inversione tra i primi due stati eccitati di A), per C e sopratutto per G le cose cambiano notevolmente. Inoltre è da subito evidente che ZINDO è il metodo che ore

(29)

CAPITOLO 3. RISULTATI E DISCUSSIONE 29 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 Energia DFT (eV) Energia CCSD(T) (eV)

Correlazione tra E(DFT) ed E(CC): Adenina

Figura 3.3: Adenina: il CAM-B3LYP è rappresentato in turchese, l'M062X in nero, il PBE0 in rosso, in blu il B3LYP ed in grigio lo ZINDO.

4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 Energia DFT (eV) Energia CCSD(T) (eV)

Correlazione tra E(DFT) ed E(CC): Citosina

Figura 3.4: Citosina: il CAM-B3LYP è rappresentato in turchese, l'M062X in nero, il PBE0 in rosso, in blu il B3LYP ed in grigio lo ZINDO.

(30)

3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 Energia DFT (eV) Energia CCSD(T) (eV)

Correlazione tra E(DFT) ed E(CC): Guanina

3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 Energia DFT (eV) Energia CC2 (eV)

Correlazione tra E(DFT) ed E(CC): Uracile

Figura 3.5: Guanina ed Uracile. Il CAM-B3LYP è rappresentato in turchese, l'M062X in nero, il PBE0 in rosso, in blu il B3LYP ed in grigio lo ZINDO.

(31)

CAPITOLO 3. RISULTATI E DISCUSSIONE 31 CCSD CCSD(T) PBE0 B3L YP CAM-B3L YP M062X ZINDO E(e V) f E(e V) E(e V) f E(e V) f E (e V) f E(e V) f E(e V) f π-π ∗ 5.30 0.021 5. 04 5.13 0.231 5. 01 0.210 5.31 0.259 5.38 0.287 4.22 0.255 π-π ∗ 5.47 0.275 5. 23 5.35 0.021 5. 23 0.025 5.47 0.013 5.55 0.012 4.45 0.164 n-π ∗ 5.54 0.001 5. 28 5.04 0.031 4. 91 0.005 5.32 0.020 5.30 0.002 4.53 0.008 π-R 5.70 0.009 5.5 8 5.70 0.007 5. 43 0.006 5.89 0.004 5.76 0.005 -π-R 6.04 0.001 5.9 1 6.01 0.006 5. 74 0.006 6.25 0.004 6.10 0.003 - n-π ∗ 6.10 0.003 5. 84 5.67 0.002 5. 56 0.003 5.92 0.008 5.85 0.004 4.67 0.006 π-R 6.49 0.001 6.38 6.58 0.005 6. 33 0.001 6.82 0.002 6.59 0.064 - n-π ∗ 6.52 0.002 6. 27 6.02 0.002 5. 85 0.002 6.27 0.004 6.32 0.005 5.20 0.014 π-π ∗ 6.58 0.478 6. 36 6.37 0.204 6. 17 0.034 6.56 0.431 6.63 0.370 5.13 0.137 π-π ∗ 6.68 0.035 6. 53 6.39 0.147 6. 21 0.220 6.73 0.023 6.82 0.015 5.82 0.519 π-R 6.68 0.000 6.57 6.85 0.005 6. 63 0.001 6.98 0.015 6.70 0.017 -π-R 6.86 0.001 6.73 6.96 0.002 6. 70 0.024 7.19 0.005 7.03 0.007

-Tabella 3.1: Adenina. Comparazione delle energie di stato eccitato e for-za dell'oscillatore (f) tra CC ed i funzionali PBE0, B3LYP, CAM-B3LYP, M062X e col metodo ZINDO.

(32)

CCSD CCSD(T) PBE0 B3L YP CAM-B3L YP M062X ZINDO E(e V) f E(e V) E(e V) f E(e V) f E (e V) f E(e V) f E(e V) f π-π ∗ 4.96 0.066 4. 69 4.76 0.048 4. 64 0.040 4.95 0.069 4.98 0.073 4.26 0.131 π-π ∗ 5.44 0.003 5. 18 4.93 0.005 4. 77 0.006 5.22 0.004 5.20 0.004 3.95 0.001 n-π ∗ 5.73 0.004 5. 59 5.68 0.031 5. 39 0.007 5.84 0.006 5.74 0.004 -π-R 5.89 0.171 5.6 0 5.63 0.064 5. 49 0.076 5.94 0.111 6.00 0.120 5.53 0.040 π-R 6.06 0.000 5.8 2 5.34 0.003 5. 12 0.003 5.83 0.006 5.75 0.001 4.31 0.028 n-π ∗ 6.23 0.006 6. 10 6.30 0.007 6. 03 0.004 6.43 0.020 6.32 0.028 -π-R 6.35 0.007 6.18 6.61 0.008 6. 34 0.006 6.50 0.141 6.45 0.034 - n-π ∗ 6.40 0.000 5. 88 5.78 0.001 5. 65 0.001 6.09 0.004 6.37 0.002 5.71 0.045 π-π ∗ 6.53 0.507 6. 33 6.16 0.025 5. 85 0.014 6.63 0.274 6.60 0.386 5.77 0.878 π-π ∗ 6.65 0.004 6. 50 7.27 0.012 7. 01 0.011 6.80 0.010 6.66 0.021 -π-R 6.87 0.026 6.68 6.99 0.025 6. 08 0.023 6.91 0.037 7.05 0.123 -π-R 6.90 0.127 6.69 6.47 0.178 6. 30 0.199 7.02 0.235 7.08 0.073 6.62 0.050

Tabella 3.2: Citosina. Comparazione delle energie di stato eccitato e forza dell'oscillatore (f) tra CC ed i funzionali PBE0, B3LYP, CAM-B3LYP e M062X e col metodo ZINDO.

(33)

CAPITOLO 3. RISULTATI E DISCUSSIONE 33 CCSD CCSD(T) PBE0 B3L YP CAM-B3L YP M062X ZINDO E(e V) f E(e V) E(e V) f E(e V) f E (e V) f E(e V) f E(e V) f π-R 5.07 0.002 4.9 1 5.51 0.005 5. 23 0.007 5.38 0.003 5.24 0.006 - π-π ∗ 5.10 0.160 4. 86 4.97 0.147 4. 78 0.051 5.11 0.173 5.18 0.172 3.81 0.265 π-R 5.47 0.005 5.3 2 6.18 0.004 5. 92 0.003 6.45 0.025 5.62 0.007 - π-π ∗ 5.61 0.366 5. 37 5.10 0.014 4. 89 0.102 5.59 0.280 5.64 0.315 4.37 0.351 n-π ∗ 5.64 0.000 5. 43 5.39 0.077 5. 29 0.022 5.51 0.023 5.36 0.002 3.76 0.001 π-R 5.98 0.001 5.84 6.34 0.001 5. 92 0.002 6.53 0.001 6.27 0.005 -π-R 6.11 0.001 5.98 6.58 0.002 6. 13 0.008 6.76 0.001 6.32 0.001 -π-R 6.29 0.010 6.15 6.70 0.008 6. 32 0.001 6.89 0.002 6.47 0.006 -π-R 6.41 0.000 6.28 7.19 0.020 6. 48 0.006 -6.71 0.004 - π-π ∗ 6.49 0.024 6. 26 5.34 0.172 5. 20 0.206 5.78 0.007 6.63 0.007 4.81 0.018 n-π ∗ 6.59 0.003 6. 37 6.01 0.001 5. 78 0.001 6.38 0.001 6.34 0.003 5.13 0.001 π-R 6.79 0.001 6.51 7.21 0.144 6. 89 0.006 -7.08 0.010

-Tabella 3.3: Guanina. Comparazione delle energie di stato eccitato e for-za dell'oscillatore (f) tra CC ed i funzionali PBE0, B3LYP CAM-B3LYP e M062X e col metodo ZINDO.

(34)

CC2 PBE0 B3L Y P CAM-B3L YP M062X ZINDO E(e V) f E(e V) f E(e V) f E(e V) f E(e V) f E(e V ) f n-π ∗ 4.80 0.000 4.70 0.000 4.57 0.000 4.96 0.000 4.85 0.000 3.55 0.000 π-π ∗ 5.35 0.182 5.21 0.145 5.09 0.130 5.34 0.190 5.39 0.201 4.76 0.397 π-R 6.08 0.002 6.02 0.002 5.75 0.002 6.14 0.003 6.03 0.003 - n-π ∗ 6.10 0.000 5.88 0.000 6.05 0.000 6.21 0.000 6.09 0.000 4.18 0.000 π-π ∗ 6.26 0.036 6.48 0.131 6.29 0.095 6.45 0.045 6.54 0.039 5.59 0.201 n-R 6.49 0.036 6.83 0.026 6.46 0.057 7.34 0.003 7.53 0.002 - n-π ∗ 6.56 0.001 6.29 0.000 6.56 0.000 7.20 0.000 7.41 0.000 6.46 0.000 π-π ∗ 6.70 0.166 7.34 0.240 7.32 0.398 6.70 0.168 6.75 0.184 6.06 0.192

Tabella 3.4: Uracile. Comparazione delle energie di stato eccitato e forza dell'oscillatore (f) tra CC ed i funzionali PBE0, B3LYP, CAM-B3LYP e M062X e col metodo ZINDO.

(35)

CAPITOLO 3. RISULTATI E DISCUSSIONE 35 CCSD CCSD(T) PBE0 B3L YP CAM-B3L YP M062X ZINDO E(e V) f E(e V) E(e V) f E(e V) f E(e V) f E(e V) f E(e V) f G π-π ∗ 4.89 0.077 4.67 4.80 0.108 4.68 0.102 5.06 0.064 5.07 0.086 3.79 0.200 C π-π ∗ 5.07 0.097 4.86 4.91 0.056 4.77 0.039 5.11 0.108 5.15 0.118 4.39 0.107 G π-π ∗ 5.45 0.447 5.27 5.20 0.225 4.99 0.037 5.37 0.418 5.42 0.425 4.16 0.504 C π-π ∗ 5.55 0.174 5.30 5.22 0.153 5.06 0.287 5.62 0.116 5.66 0.118 5.21 0.323 Cn-π ∗ 5.79 0.002 5.57 5.52 0.000 5.29 0.000 5.77 0.000 5.71 0.000 4.11 0.000 Gn-π ∗ 5.91 0.000 5.73 5.60 0.000 5.47 0.000 6.21 0.001 6.17 0.001 3.90 0.001 G π-R 4.92 0.000 4.84 5.07 0.001 4.80 0.001 5.27 0.000 5.09 0.000 -G π-R 5.37 0.006 5.27 5.50 0.005 5.53 0.001 6.35 0.000 6.06 0.000 -G π-R 5.66 0.003 5.55 5.85 0.001 5.84 0.000 6.44 0.000 6.20 0.000 -C π-R 5.86 0.002 5.76 5.89 0.002 5.62 0.002 6.04 0.002 5.94 0.0 02 -CT π-π ∗ 5.68 0.004 5.40 3.51 0.002 3.24 0.002 4.74 0.038 4.65 0.021

-Tabella 3.5: Dimero CG. Comparazione delle energie di stato eccitato e forza dell'oscillatore (f) tra CC ed i funzionali PBE0, B3LYP, CAM-B3LYP e M062X e col metodo ZINDO.

(36)

A denina Citosina Guanina Uracile Dimero CG R(all) R( π-π ∗ ) R(all) R( π-π ∗ ) R(all) R( π-π ∗ ) R(all) R( π-π ∗ ) R(all) R( π-π ∗ ) PBE0 0.921 0.993 0.828 0. 996 0.480 1.000 0.893 0.992 0.849 0.9 99 B3L YP 0.933 0.994 0.762 0. 982 0.522 0.989 0.931 0.976 0.733 0.9 84 CAM-B3L YP 0.951 1.000 0.975 0. 999 0.485 0.848 0.873 0.979 0.643 0.8 56 M062X 0.961 1.000 0.945 0. 995 0.923 0.997 0.835 0.969 0.765 0.8 77 ZINDO 0.873 0.906 0.686 0. 937 0.810 0.949 0.722 0.998 0.002 0.4 70

Tabella 3.6: Correlazione delle energie DFT e ZINDO con il riferimento CC per ciascun funzionale e ciascuna base azotata.

(37)

CAPITOLO 3. RISULTATI E DISCUSSIONE 37 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 Energia DFT (eV) Energia CCSD(T) (eV)

Correlazione tra E(DFT) ed E(CC): Dimero Guanina-Citosina

Figura 3.6: Dimero CG. Il CAM-B3LYP è rappresentato in turchese, l'M062X in nero, il PBE0 in rosso, in blu il B3LYP ed in grigio lo ZINDO.

Adenina Citosina Guanina Uracile h | ∆E | i h | ∆E | i h | ∆E | i h | ∆E | i

PBE0 0.17 0.26 0.53 0.25

B3LYP 0.17 0.32 0.35 0.19

CAM-B3LYP 0.25 0.24 0.48 0.25

M062X 0.19 0.26 0.31 0.30

Tabella 3.7: Valor medio dello spostamento in energia degli stati eccitati DFT rispetto al CCSD(T); riportiamo la deviazione media assoluta (MAD), ottenuta come media sui valori assoluti degli spostamenti ∆E dell'energia DFT rispetto a quella CC.

(38)

i risultati di più scarso valore e dunque lo tralasceremo nella discussione. Mentre tutti i funzionali proposti danno buoni risultati, con rare eccezioni, nel predire le energie di eccitazione per transizioni di valenza π → π∗, per le

n → π∗ ed ancor più per le transizioni Rydberg, il funzionale più adabile è risultato l'M062X. Questo è evidente specialmente nel caso della G, do-ve molti stati eccitati coinvolgono proprio stati Rydberg. Questo fattore ha indirizzato notevolmente la scelta del funzionale; essendo infatti interessati a simulare gli spettri CD determinati da stati eccitonici le cui composizioni sono dicili da prevedere, diventa necessario descrivere con generale buo-na accuratezza non solo gli stati di valenza. Il ∆E tra le energie M062X e CCSD(T) è abbastanza eterogeneo in relazione alla base ed alla transizione e si attesta ad un valore medio di 0.25 eV, che nell'ambito dell'accuratezza DFT è del tutto ragionevole. I valori dell'R2 supportano quanto detto non

allontanandosi molto da valori attorno a 0.9 tranne che nel caso della G; fa eccezione il funzionale M062X che descrive sucientemente bene anche le transizioni della guanina.

Per quel che riguarda il dimero GC alcune specicità sono evidenti: in esso uno degli stati a bassa energia viene bene caratterizzato dal CCSD(T) come un charge-trasfer da una base all'altra, ma questo tipo di transizioni non sono ben descritte dal DFT, come nel nostro caso, anche nei funzionali di concezione più moderna come l'M062X od il CAM-B3LYP.

In denitiva, il confronto tra DFT e EOM-CC sembra indicare che il funzio-nale M062X rappresenta un buon compromesso tra accuratezza e costo com-putazionale e sarà quindi il funzionale utilizzato nellle successive simulazioni degli spettri CD.

3.3 Risultati RNA β-hairpin

Come descritto nel Capitolo 2, la simulazione dello spettro CD di un sistema multicromoforico come la beta-hairpin richiede la costruzione dell'Hamilto-niano eccitonico. Per far questo è necessario calcolare le proprietà di stato eccitato (site energies e couplings) delle diverse unità cromoforiche che co-stituscono il sistema oggetto di studio. Per quanto riguarda la beta-hairpin abbiamo preso in considerazione dodici delle quattordici basi azotate, quelle cioè che interagiscono formando legami idrogeno. Le ultime due basi del loop sono state tralasciate perchè non accoppiate tra loro.

Le geometrie utilizzate per i calcoli provengono da due set di dati diversi: i) misure NMR in soluzione; ii) congurazioni estratte da una simulazione di dinamica molecolare classica. Su entrambe i tipi di struttura sono state calcolate le proprietà di stato eccitato a livello TDM062X in combinazione

(39)

CAPITOLO 3. RISULTATI E DISCUSSIONE 39

Figura 3.7: Rappresentazione schematica della β-hairpin.

con i diversi modelli descritti nel Capitolo 2 per includere gli eetti della presenza dell'ambiente.

3.3.1 Strutture NMR

Sono state analizzate le strutture corrispondenti alle conformazioni di minima energia identicate da Shwalbe et all. e disponibili nel PDB. In particolare in questo lavoro sono state eettuate misure di NMR in soluzione acquosa ad alta risoluzione facendo uso di diverse tecniche NMR su campioni sin-tetici marcati C13/N15. Con l'impiego di queste tecniche è stato possibile

determinare in modo quantitativo un gran numero di parametri torsionali e angoli diedri relativi sia alla backbone che alle conformazioni degli zuccheri che all'orientazione delle basi azotate. Questa mole di dati sperimentali è stata poi usata nel ranamento del calcolo delle strutture NMR in soluzione con ARIA (Ambigous Restraints for Iterative Assignment) arrivando al-l'identicazione di 20 strutture di minima energia da 200 strutture calcolate in partenza. Sulla base di ciò è stato possibile determinare la struttura del lamento di RNA con un RMSD di 0.3 Å per la porzione dell'elica e di 0.25 Å per il loop nale, costituendo un benchmark per la determinazione di oli-gonucleotidi dell'RNA con tecniche NMR.

Le venti strutture riportate nel PDB non risultano avere dierenze signicati-ve tra loro, come confermato dalla simulazione degli spettri CD su di queste. Infatti, come mostreremo in seguito, le somiglianze nelle strutture NMR si rispecchiano negli spettri che sono in buona parte largamente sovrapponibili tra loro.

(40)

3.3.2 Strutture MD

Tratteremo ora dello studio di Dinamica Molecolare (MD) che è stato fatto sulla β-hairpin in modo da generare le diverse conformazioni su cui sono poi stati fatti i calcoli sulle proprietà spettroscopiche. Per la simulazione MD è stato utilizzato il pacchetto Amber12 [31] ed utilizzata come struttura iniziale di partenza la prima delle 20 conformazioni NMR. La preparazione del sistema è stata condotta come segue:

- iniziale minimizzazione della struttura;

- aggiunta di controioni; infatti la backbone della molecola biologica co-stituita da gruppi fosfato risulta carica negativamente in modo diretta-mente proporzionale al numero di gruppi fosfato, che nel caso corrente corrisponde a 13;

- solvatazione del sistema con la costruzione di una box di molecole d'acqua, procedendo poi con una seconda minimizzazione.

Queste minimizzazioni preliminari sono state condotte per un numero di ci-cli ridotto ed imponendo sul lamento di RNA un vincolo, nella forma di un potenziale armonico ttizio, anche tra atomi non legati chimicamente, in modo da impedirne variazioni strutturali signicative (restraint_wt = 25.0 Kcal mol−1 Å2).

La box del solvente è di forma cubica ed il bordo di questa dista 50 Å dal-l'hairpin ed è costituita da oltre duecentomila atomi. Le dimensioni notevoli garantiscono un buon bagno termico al sistema molecolare e scongiurano la possibilità di ritrovare la β hairpin troppo vicina al bordo della scatola, in-ducendo un'asimmetria nel sistema.

Per tutte le simulazioni di dinamica sono state impiegate le condizioni pe-riodiche al contorno (P eriodic Bounduary Conditions, PBC) dove la cella unitaria è costituita dalla scatola di solvente appena descritta con al suo interno la molecola biologica. Il tempo di integrazione è stato di 2 fs, utiliz-zando l'algoritmo SHAKE per gli atomi di idrogeno [32].

La simulazione di dinamica è stata suddivisa in due fasi successive: riscal-damento e successiva equilibratura della temperatura e della pressione. La prima fase di riscaldamento (50 ps) è stata condotta a volume costante, ri-scaldando progressivamente il sistema da 0K a 300K utilizzando il termostato di Langevin. Durante il riscaldamento è stato mantenuto il vincolo di 25.0 Kcal mol−1 Å2) sul lamento di RNA, in modo da lasciarlo in gran parte

fermo ed impedire movimenti impropri della struttura. Questo è stato suc-cessivamente rimosso in modo da equilibrare il sistema per ulteriori 200 ps generando un insieme statistico NVT.

(41)

CAPITOLO 3. RISULTATI E DISCUSSIONE 41 A questo punto la simulazione è proseguita per 27 ns realizzando un ensamble statistico NPT dal momento che si è mantenuta una temperatura costante di 300K (termostato tipo Berendsen) ed una pressione di 1 bar. Rimuovendo il vincolo sul volume, nella prima fase della simulazione NPT la densità del sistema varia per raggiungere il suo valore di equilibrio, come mostrato in Figura 3.9. Nelle Figure 3.8 e 3.9 riportiamo alcuni graci che mostra-no la bontà della dinamica molecolare svolta: nella prima è rappresentanto l'andamento dell'energia totale del sistema mentre nella seconda della sua pressione, insieme alla densità, durante la dinamica. Dagli ultimi 5 ns della simulazione NPT sono stati estratti 120 frames ogni 40 ps, sui quali sono sta-ti eettuasta-ti i calcoli QM. Su di un campione delle strutture ottenute dalla MD abbiamo calcolato l'RMSD (Figura 3.10) rispetto alla struttura NMR di partenza, tralasciando i due residui centrali del loop (un U ed una C), più mobili rispetto al resto della struttura, e ne riportiamo l'andamento durante i 27 ns. Da questo è evidente come la dinamica del sistema devii alla struttura da quella di minimo identicata all'NMR e per rendere più esplicito questo fatto riportiamo in Figura due rappresentazioni grache, una per la struttura di partenza (NMR) e l'altra in cui sono stati sovrapposti alcuni frame della MD (Figura 3.11).

3.3.3 Simulazione dello spettro CD in vuoto

In prima approssimazione abbiamo costruito l'Hamiltoniano eccitonico del sistema a partire da calcoli TDDFT in vuoto. Questo tipo di analisi per-mette di disaccoppiare l'eetto strutturale da quello dovuto alla presenza dell'ambiente sulle proprietà eccitoniche del sistema. Comparando i risultati dei calcoli in vuoto ottenuti sulle strutture NMR con quelli ottenuti dagli snapshots della dinamica possiamo esplorare l'eetto delle uttuazioni strut-turali sullo spettro di dicroismo circolare.

In Figura 3.12 mostriamo gli spettri CD ottenuti dal calcolo eseguito su ciascuno dei venti conformeri NMR. Si osserva come tra questi non ci siano dierenze signicative nè per quanto riguarda le posizioni nè per le intensità dei picchi. Questo dato non è sorprendente in quanto le diverse strutture NMR prese in esame non sono signicativamente dierenti tra loro. É pos-sibile quindi calcolare uno spettro medio (Ave-NMR) ottenuto dalla media aritmetica degli spettri dei diversi conformeri (somma di ogni cotributo allo spettro per ogni conformero diviso il numero complessivo di conformeri). Lo stesso tipo di analisi in vuoto è stato eettuato sulle congurazioni estratte dalla simulazione di dinamica molecolare classica. Durante la traiettoria è probabile ritrovare frequentemente le diverse conformazioni NMR, che rap-presentano strutture di minima energia per il sistema, ma è vero anche che

(42)

Figura 3.8: Si riportano con colori diversi gli andamenti dell'energia totale del sistema durante la dinamica e le fasi di equilibratura: in nero (prima frazione del graco praticamente indistinguibile all'asse delle ordinate) ed in rosso sono riportati i valori di energia totale durante l'equilibratura del sistema a V costante mentre in verde ed in blu durante la fase di dinamica; è evidente come l'energia totale si stabilizzi intorno ad un valore medio già dopo poche centinani di femtosecondi.

(43)

CAPITOLO 3. RISULTATI E DISCUSSIONE 43

Figura 3.9: L'andamento della pressione (sinistra) e della densità (destra) del sistema raggiungono entrambe un plateau già entro il primo ns di dinamica NPT.

(44)

0.0 0.5 1.0 1.5 2.0 2.5 3.0 0 5 10 15 20 25 RMSD (Å) t (ns) RMSD

Figura 3.10: Riportiamo l'RMSD calcolato rispetto alla struttura di partenza su di un campione di strutture estratte dalla MD; questo oscilla attorno ad un valor medio di circa 1.6 Å.

(45)

CAPITOLO 3. RISULTATI E DISCUSSIONE 45

(a) NMR (b) MD

Figura 3.11: Confronto tra la struttura NMR iniziale (a) e variazioni strut-turali durante la dinamica (b). Gli atomi di idrogeno sono omessi per chia-rezza. Nella gura (b) le strutture rappresentate in rosso corrispondono alla geometria NMR.

(46)

Figura 3.12: Confronto tra gli spettri ECCD di ogni conformero NMR e la loro media; i venti spettri, ciscuno per ogni struttura sperimentale, sono stati mediati direttamente per ottenere lo spettro Ave-NMR.

durante la dinamica la molecola esplora altre conformazioni, di peso mino-re e ad energie più alte. Un sampling sulla dinamica che ora una buona statistica sulla distribuzione delle geometrie di stato fondamentale può, in li-nea di principio, condurre a risultati migliori nella riproduzione dello spettro CD grazie all'inclusione dell'eetto delle uttuazioni strutturali. É opprotu-no però sottolineare che un'analisi di questo tipo richiede un opprotu-notevole sforzo computazionale, sia per quanto riguarda il set-up della simulazione di dinami-ca classidinami-ca, sia per i dinami-calcoli quantistici che devono essere svolti su un elevato numero di strutture per ottenere un ensamble statistico corretto. Una volta ottenute le diverse congurazioni e le corrispondenti proprietà eccitoniche, è possibile calcolare uno spettro CD medio utilizzando diversi approcci. Il metodo più semplice è analogo a quanto già descritto per le strutture NMR e richiede il calcolo della media aritmetica dello spettro di ciascuna congu-razione (Ave-MD1). Un altro approccio è quello che permette di ottenere lo spettro medio calcolando prima una media delle proprietà eccitoniche, inclu-dendo esplicitamente l'eetto delle uttuazioni strutturali su site energies, couplings e dipoli di transizione, e successivamente costruendo lo spettro as-sumendo un opportuno allargamento di riga, che nel nostro caso è di forma gaussiana (Ave-MD 2). I due diversi approcci forniscono, in questo caso, un risultato del tutto paragonabile in termini di forma e di intensità relativa

Riferimenti

Documenti correlati

1 Uno studio combinato XANES e Dinamica Molecolare ha rivelato che gli ioni zinco e mercurio hanno un effetto molto diverso sulla struttura dell’acqua.. Mentre lo zinco non altera

GLI STUDI CULTURALI E LE SOTTOCULTURE GIOVANILI: CENNI TEORICI.. 1.1 I CULTURAL

Variables considered are market capitalisation for competition, bank assets for banking regulation, gross external assets for the GFSN, exports and imports for trade, CO2

Il reticolo cristallino fisico, formato da atomi, invece può essere descritto come costituito da celle unitarie di base identiche, ciascuna delle quali è disposta in corrispondenza di

As special votive gifts which contributed to the effort of ritual performance, musical instruments and sound objects deposited in shrines and sacred places could have con- tributed

The present study was not designed to reconstruct phylogeny of the whole genus, the small-sized species were used as outgroup taxa in the morphological analy- sis, and indeed we

Il ruolo strutturale dello ione Zn 2+ a livello del sito catalitico di LF, è stato in parte confermato dall’analisi degli spettri di dicroismo circolare nel vicino UV e degli

In questo senso Bellocchio affronta anche le ragioni di chi, a differenza di Beppino – e probabilmente anche alla luce di una diversa visione della vita da parte del paziente,