Sequenza idrofoba - MODELLIDINAMICIPERILRIPIEGAMENTODELLAPROTEINA Universit`adegliStudidiBologn

6.3 Analisi

6.3.4 Sequenza idrofoba

8 0 0,2 0,4 0,6 0,8 -35 -30 -25 -20 -15 -10 -5 0 5

V

%

V

χ

zona metastabile

Figura 6.8: Spettro delle popolazioni e spettro energia-similarit`a per una serie di simulazioni a T = 0.15 per la sequenza completamente idrofoba (B)₂₁. Il minimo energetico assoluto `e stato assunto come stato nativo di riferimento anche se non risulta essere coincidente con il massimo della popolazione.

Le tre configurazioni metastabili possiedono locali alterazioni sugli an-goli diedrali (spesso nel tornante della forcina) che le rendono distin-guibili nella classificazione, anche se nelle immagini visibili in Figura 6.9 appaiono sostanzialmente uguali.

Come si osserva in Figura 6.3 le fluttuazioni termiche a T = 0.15 fanno si che χ oscilli prevalentemente all’interno della regione metastabile. L’istantanea a t = 200τ fotografa il filamento in una delle sue possibili permutazioni; la frequenza con la quale ricorre ognuna di esse è correla-bile alla permanenza temporale in quella configurazione in accordo con la teoria di Kramers [38] sulla probabilità di transizione e in qualche modo ricalca l’ipotesi di metastabilità avanzata da Thirumalai.

6.3.4 Sequenza idrofoba

Per avere un raffronto qualitativo sulla bont`a del ripiegatore Beta21 `e stata eseguita una ulteriore serie di simulazioni a T = 0.15 per la se-quenza completamente idrofoba (B)₂₁ rappresentata in Figura 6.2(c).

Figura 6.9: Configurazioni metastabili a T = 0.15. La differen-za energetica è dell’ordine 20 kbT . La mutua similarità è compresa nell’intervallo [0.05, 0.1].

Gli spettri di popolazione ottenuti riportati in Figura 6.8 delineano la radicale differenza del panorama energetico fra buono e cattivo ripie-gatore e l’assenza per quest’ultimo di una configurazione probabilisti-camente dominante.

6.4 Risultati

Una spiegazione teorica riguardo alla dinamica evolutiva del sistema all’interno del panorama energetico esula dagli obiettivi preliminari di questo lavoro.

Lo studio presentato in questo ultimo Capitolo inoltre `e un’ analisi meccanica e non termodinamica del processo.

Una distinzione non trascurabile sta nel fatto che la classificazione dei minimi qui compiuta si basa sull’energia interna e non sull’energia lib-era di Gibbs a cui fa riferimento l’ipotesi termodinamica discussa nel Paragrafo 6.1.

Si pu`o comunque pensare che le visioni dello scenario da queste due ottiche non siano troppo dissimili o comunque complementari. Il fatto ad esempio che il minimo meccanico assoluto sia anche il pi`u frequente lo rende identificabile anche come il minimo assoluto dell’energia lib-era.

Le simulazioni condotte danno risulati in accordo con le aspettative del modello per quanto riguarda la presenza di una configurazione preferenziale, ossia l’esistenza di uno stato nativo.

T

χ<0.05 χ<0.1

0.05

0.1

0.15 18 % 25 %

25 % 29 %

30 % 63 %

χ>0.7

7 %

10 %

11 %

0.15 3 % 3 % 81 %

beta21 sequenza idrofoba

Figura 6.10: Percentuale delle simulazioni con Beta21 che al ter-mine del processo (t = 200τ ) sono in una configurazione identica (χ 6 0.05), molto simile (χ 6 0.1, zona metastabile) o completamente dissimile (χ > 0.7) allo stato nativo. Nell’ultimo riquadro in grigio i valori per le simulazioni compiute con la sequenza completamente idrofoba (B)₂₁.

Dalla tabella riportata in Figura 6.10 emerge una valutazione quan-titativa della bont`a del ripiegatore Beta21 tramite le percentuali di successo nel processo di ripiegamento divise in fasce di similarit`a in contrapposizione con quelle per la sequenza idrofoba (B)₂₁.

Ricordiamo che per ∆χ 6 0.1 due strutture appaiono indistinguibili. Per quanto riguarda l’aspetto termodinamico della simulazione in questo lavoro non si `e compiuta un’analisi approfondita sulla cruciale influen-za della temperatura dell’ ambiente. Osservando i dati nella tabelle 6.10 ci limitiamo a concludere che il processo di ripiegamento appare molto sensibile al cambio di T indice dell’incidenza di un fattore en-tropico sulla scelta della configurazione di minimo.

Il valore della temperatura per la quale nelle nostre simulazioni si ha il pi`u alto successo (T = 0.15 corrispondente circa alla temperatura am-biente) risulta coerente con gli esperimenti reali compiuti sui filamenti.

Conclusioni

La modellizzazione della proteina necessita la costruzione di un algo-ritmo per la dinamica di una catena di punti connessi che identificano gli amminoacidi.

La struttura semi-rigida di questo oggetto si presta ad essere parametriz-zata mediante angoli e la sua dinamica fatta evolvere tramite rotazioni nello spazio.

L’utilizzo dei quaternioni che si fa all’interno dell’algoritmo proposto rappresenta il contributo originale dato in questo lavoro di tesi. La topologia della catena composta di elementi unidimensionali (aste) fa s`ı che una completa parametrizzazione in senso quaternionale sia ridondante; essa potrebbe rivelarsi particolarmente utile per una trat-tazione degli amminoacidi come corpi rigidi non puntiformi.

Le variabili dinamiche, nel nostro caso, restano i vettori che individ-uano i segmenti della catena e le relative velocit`a angolari; i quater-nioni intervengono all’interno dello schema producendo l’avanzamento rotazionale delle posizioni.

Il secondo contributo di questo lavoro nella creazione dell’integratore sta nel sistema di calcolo delle forze vincolari che si propagano lungo la catena e la mantengono connessa.

L’integratore `e strutturato in modo da raggiungere localmente (sulle posizioni relative) un errore al terzo ordine preservando implicitamente le distanze tra elementi contigui.

I test di prova compiuti per il caso di una catena di N pendoli connes-si mostrano una deriva energetica lineare dell’ordine di una parte su centomila dopo un periodo di 100τ con h = 0.005τ (N 6 10). L’errore cresce linearmente con l’aumento del numero di elementi.

I tempi di calcolo in presenza di campo costante crescono linearmente con N, quadraticamente nel caso di interazioni a coppie per le quali `e necessaria la misura delle distanze reciproche, raddoppiano nel pas-saggio dal secondo al terzo ordine nello schema di integrazione. La non triviale introduzione di una componente stocastica nella di-namica (rumore o bagno termico) `e gestita sull’impronta della dinam-ica di Langevin nel limite di bassa frizione.

Opportune modifiche sono apportate nel trasporto della trattazione dalle variabili cartesiane (x , v ) a quelle della catena (ˆe, ~ω).

Come verifica del procedimento i test sul moto browniano di un fila-mento immerso in un solvente a temperatura costante riproducono con buona fedeltà le caratteristiche statistiche attese teoricamente (dis-tribuzione maxwelliana delle velocità, equipartizione dell’energia). Utilizzando tale integratore viene costruito il modello per la proteina. Gli esperimenti condotti sulla sequenza campione Beta21 rivelano la presenza di un’alta probabilità di comparsa della caratteristica β-sheet corrispondente allo stato nativo della sequenza.

Tale probabilità è modulata dalla temperatura del bagno termico. Ad esempio per una simulazione isoterma a temperatura T = 0.15 (circa la temperatura ambiente) il 30% dei processi di ripiegamento conducono a configurazioni che differiscono per meno del 5% 2 dallo stato nativo, il 63% per meno del 10%, solo il 10% per più del 70%. Per la sequenza (B)₂₁ tipicamente associata ad un cattivo ripiegatore, identificando lo stato nativo con il minimo energetico assoluto si ot-tiene che circa il 3% dei processi conducono a strutture che differiscono per meno del 10%, almeno l’81% per più del 70%.

Il modello che si è costruito dà risultati che confermano l’affidabilità dell’integratore accoppiato ad una componente stocastica (dinamica di Langevin) e che si dimostrano coerenti e in linea con le simulazioni effettuate in altri lavori di ricerca e con gli esperimenti reali.

Appendice A

Metodo Verlet L’algoritmo rappresenta la soluzione diretta dell’e-quazione m¨r = f per la trattazione di moti di oggetti puntiformi. L’evoluzione della posizione r(t + h) si basa sulla posizione r(t), l’ac-celerazione a(t) e la posizione r(t − h) del passo precedente

r(t + h) = 2r(t) − r(t − h) + h²a(t) (6.2) Come si può notare la velocità non compaiono poichè sono state elim-inate utilizzando lo sviluppo di Taylor

r(t + h) = r(t) + hv(t) + ^h 2 2^{a(t) + ...} r(t − h) = r(t) − hv(t) + ^h 2 2a(t) − ... (6.3)

La velocit`a al tempo corrente v(t) potrebbe essere necessaria per cal-colare la traiettoria nel caso di forze dipendenti da essa (magnetiche, per esempio) o per stimare l’energia cinetica.

Essa pu`o essere ottenuta

v(t) = r(t + h) − r(t − h)

2h ^(6.4)

L’equazione 6.2 `e corretta con una stima locale dell’ordine O(h4) men-tre le velocit`a lo sono con O(h2).

La caratteristica del metodo Verlet `e quella di essere centrato; r(t + h) e r(t − h) giocano un ruolo simmetirco e rendono l’algoritmo tempo-ralmente reversibile.

Lo schema logico della procedura `e illustrato in Figura 6.11.

Leap-frog I limiti del metodo Verlet risiedono nell’imprecisione con la quale vengono maneggiate le velocit`a e dalla deriva numerica che

t−h t t+h t−h t t+h t−h t t+h

r

v

a

Figura 6.11: Schema rappresentativo del metodo Verlet. Nei riquadri posizione r, velocit`a v, accelerazione a relative ai tempi t − h, t, t + h. Le frecce indicano il calcolo a partire da grandezze note (in grigio). emerge dall’equazione 6.2 dove un piccolo termine dell’ordine h² `e sommato ad una differenza di grandi termini dell’ordine h0.

Nel 1970 Hockney propose la variante denominata leap-frog, salto della rana. Lo schema si struttura r(t + h) = r(t) + hv(t + ^h 2⁾ ^(6.5a) v(t +^h 2) = v(t − ^h₂) + ha(t) (6.5b)

Le grandezze archiviate sono la posizione e l’accelerazione correnti r(t), a(t) e la velocit`a v(t − ^h2).

L’equazione 6.5b aggiorna la velocit`a al semi-passo successivo che viene utilizzata in 6.5a per il calcolo della nuova posizione.

La velocit`a corrente pu`o essere calcolata v(t) = ¹

2^{[v(t +} h

2) + v(t − ^h₂)] (6.6)

L’eliminazione di v dal sistema 6.5a,6.5b mostra come l’algoritmo sia algebricamente equivalente al metodo Verlet.

Velocity-Verlet L’equazione 6.6 mostra ancora come la velocit`a siano maneggiate in modo non completamente soddisfacente.

Nel 1982 (Swope-Andersen-Berens-Wilson) viene proposta la variante detta velocity-Verlet

r(t + h) = r(t) + hv(t) + ^h

r

v

a

t−h t t+h t−h t t+h t−h t t+h

Figura 6.12: Schema rappresentativo della variante Leap-frog anal-ogo a quello in Figura 6.11. I riquadri interposti rappresentano le grandezze ai midstep. t t+h

r

v

a

t+h/2 t t+h/2 t+h t t+h/2 t+h

Figura 6.13: Schema rappresentativo della variante Velocity-Verlet. v(t + h) = v(t) + ^h

2^{[a(t) + a(t + h)]} ^(6.7b)

Ancora una volta eliminando v ci si riconduce al comune Verlet. L’algoritmo richiede l’archiviazione di r(t), v(t), a(t) e si svolge in due tappe 3.

Da 6.7a la posizione è fatta evolvere a r(t+h) e la velocità al semipasso è calcolata

v(t + ^h

2^{) = v(t) +} h

2^a(t) ^(6.8)

Si ricavano cos`ı le velocit`a aggiornate v(t + h) = v(t + ^h

2^{) +} h

2^{a(t + h)} ^(6.9)

La stabilit`a numerica di questa variante fa si che essa sia la pi`u utiliz-zata per opportune simulazioni computazionali.

Appendice B

Metodo di integrazione quaternionale Considerando il fatto che non si possono ottenere equazioni prive di singolarit`a numeriche uti-lizzando solo 3 variabili (angoli di Eulero, per esempio) Evans [12] nel 1977 propose l’uso delle 4 variabili quaternionali come coordinate generalizzate.

Come `e stato discusso nel Capitolo 1 il quaternione q = (q₀, q₁, q₂, q₃)

`e soggetto al vincolo

q₀²+ q₁²+ q₂²+ q²₃ = 1 (6.10) Riconducendoci ai convenzionali angoli di Eulero, le coordinate q_i sono definite q0 = cos^θ 2^cos φ + ψ 2 q₀ = sin^θ 2^cos φ − ψ 2 q0 = sin^θ 2^sin φ − ψ 2 q0 = cos^θ 2^sin φ + ψ 2 (6.11)

e soddisfano l’equazione differenziale     ˙ q0 ˙ q1 ˙ q2 ˙ q3     = ¹ 2     q0 −q1 −q2 −q3 q1 q0 −q3 q2 q2 q3 q0 −q1 q3 −q2 q1 q0         0 ωx ωy ωz     (6.12)

scritta in forma quaternionale ˙q = ¹

2 q · ω (6.13)

dove ω rappresenta il vettore velocit`a angolare nel riferimento sol-idale con il corpo.

Le equazioni 6.12 vanno accoppiate con le equazioni di Eulero per la dinamica del corpo rigido

˙ ω_x = ^τ b x Ixx + Iyy− Izz Ixx ω_xω_z x → y → z (6.14)

dove τb `e il momento delle forze nel sistema solidale.

Insieme rappresentano un sistema differenziale al primo ordine risolu-bile numericamente.

Come abbiamo gi`a detto la dipendenza posizionale della derivata po-sizionale in 6.12 rende inapplicabile il comune metodo Verlet (vedi Appendice A); in secondo luogo vi `e la questione del mantenimento del vincolo sulla norma di q.

Una formulazione stile leap-frog per l’integrazione delle equazioni 6.12 e 6.14 `e stata avanzata nel 1981 da Fincham [13].

     ~ Ls(t) = ~Ls(t − ^h2) + ^h₂τ^~s(t) q(t + h) = q(t) + h ˙q(t + h 2) (6.15)

dove la prima equazione coinvolge il momento angolare ~Ls riferito al sistema esterno per il quale vale la legge dinamica ˙Ls = τs.

Le difficolt`a annidate nel sistema 6.15 sono principalmente la necessit`a di operare le trasformazioni tra sistema solidale ed esterno

L^s= q L^b q e tra momento e velocit`a angolari

ω^b = I−1L^b

dove I `e il tensore costante di inerzia nel sistema solidale.

con l’ausilio di una estrapolazione4.

Il vincolo inoltre `e preservato forzatamente con una riscalatura delle coordinate qi al termine di ogni passo di integrazione.

Recentemente [7] Omelyan presenta un metodo di integrazione dove tale vincolo `e preservato implicitamente e che fa uso solo di in-terpolazioni e non di estrapolazioni.

In modo simile a 6.15 il momento angolare viene fatto avanzare al semipasso Ls(t + ^h₂) quindi si ricava la velocit`a angolare nel sistema solidale ω^b(t +^h 2^{) = I} −1q(t + ^h 2^{) L} s(t +^h 2⁾ ^(6.16)

L’orientazione aggiornata del corpo si ottiene con una trasfor-mazione ortonormale nello spazio dei quaternioni Q.

q(t + h) = 1 − ^h 2^ω b(t + ^h 2⁾ −1 1 + ^h 2^ω b(t +^h 2⁾ q(t) (6.17)

dove 1 = (1, 0, 0, 0) e ωb = (0, ωx, ωy, ωz) nello spazio Q.

Le equazioni 6.16 e 6.17 si risolvono iterativamente considerando che in 6.16 ci si avvale dell’interpolazione

q(t + ^h 2^{) =}

2^{[q(t) + q(t + h)]} ^(6.18)

L’algoritmo di Omelyan raggiunge una precisione e una stabilit`a confrontabili a quelle ottenute tramite un approccio atomico.

Matrici di rotazione (metodo R-SHAKE) In contrapposizione con l’utilizzo dei quaternioni o degli angoli di Eulero per i quali la

predizione di una variabile ad un tempo avanzato ottenuta con errori di ordine pi`u basso

matrice di rotazione A viene parametrizzata 5 A =   q2 0 + q2 1 + q2 2 + q2 3 2(q1q2− q0q3) 2(q1q3+ q0q2) 2(q1q2+ q0q3) q2 0 − q2 1 + q2 2 − q2 3 2(q2q3− q0q1) 2(q1q3− q0q2) 2(q2q3 + q0q1) q2 0− q2 1 − q2 2 + q2 3  =  

cos ψ cos φ − cos θ sin φ sin ψ − sin ψ cos φ − cos θ sin φ cos ψ sin θ sin φ cos ψ sin φ + cos θ cos φ sin ψ − sin ψ sin φ + cos θ cos φ cos ψ − sin θ cos φ

sin θ sin ψ sin θ cos ψ cos θ





(6.19) in questo metodo le 6 varaibili indipendenti di A vengono fatte evolvere direttamente sotto il vincolo

AA^T = 1 (6.20)

Scriviamo la Lagrangiana per un corpo rigido rotante

L = ^M 2 ^˙r^cm^˙r^cm⁺ 1 2^{T r[ ˙}^{AI ˙}Â T ] − V (A, rcm) + T r[Λ(AA^T − 1)] (6.21) dove i primi due termini rappresentano le energie cinetiche traslazionale e rotazionale, rcm è la posizione del centro di massa, M è la massa totale, I è il tensore di inerzia, il terzo termine è il potenziale totale e l’ultimo termine è stato aggiunto per assicurare il mantenimento del vincolo 6.20 tramite la matrice simmetrica Λ di moltiplicatori di La-grange (6 condizioni di vincolo).

Per costruire le equazioni del moto definiamo il momento coniugato (matrice 3 × 3)

Π ≡ ^∂L

∂ ˙A ^{= ˙}^AI ^(6.22)

Le equazioni di Hamilton risultano

˙ A = Π · I⁻¹ ˙ Π = −∂AV + 2A · Λ g(A) = AA^T − 1 = 0 (6.23) 5

la matrice A trasporta le coordinate dal sistema solidale al sistema esterno xs= Axb.

A questo punto si applica l’algoritmo R-SHAKE (derivato da SHAKE) Π(t + ^h 2) = Π(t −^h₂) + h[2A(t)Λ(t) − ∂A(t)V ] A(t + h) = A(t) + h Π(t + ^h 2) · I⁻¹ g[A(t + h)] = 0 (6.24)

L’errore locale ad ogni passo di integrazione è dell’ordine O(h3). Con questo metodo il vincolo è imposto forzatamente mentre è sarebbe possibile [10] costruire una evoluzione esponenziata di A che lo man-tenga implicitamente con lo svantaggio del calcolo dell’esponenziale matriciale ad ogni passo per ogni molecola.

L’algoritmo R-SHAKE, pur presentando un errore locale maggiore per brevi simulazioni per un fissato passo di integrazione rispetto ad un algoritmo quaternionale, mostra maggiore stabilit`a e assenza di derive energetiche per simulazioni di lunga durata a causa del suo carattere simplettico.

Bibliografia

[1] Anfinsen C. Science 181, 223 (1973)

[2] Anfinsen C. Scheraga H.A. Adv.Prot.Chem. 29, 205 (1975) [3] Branden C. Tooze J. Introduzione alla struttura delle proteine

Zanichelli 1993

[4] Clementi C. Effective potentials for protein folding models SISSA 1998

[5] Hamilton W.R. On Quaternions Proceedings of the Royal Irish Academy 3, 1-16 (1847)

[6] Kuipers J.B. Quaternions and rotation sequences, Princeton University Press, 1999

[7] Omelyan I.P. Algorithm for numerical integration of the rigid-body equations of motionPhysical Review E 58, 1169 (1998)

[8] Ryckaert J.P. Ciccotti G. Berendsen H.J.C. J. Comput. Phys. 23, 327 (1977)

[9] Andersen H.C. J. Comput. Phys. 52, 24 (1983)

[10] Ahlrichs R. Brode S. Comput. Phys. Commun. 42, 59 (1986) [11] Dullweber A. Leimkuhler B. McLachlan R. J. Chem. Phys. 107,

5840 (1997)

[12] Evans D.J. Mol.Phys. 34 , 317 (1977) [13] Fincham D. Mol.Simul. 8 , 165 (1992)

[14] Omelyan I.P. A new leapfrog integrator of rotational motion, Jan 1999

[15] Kol A. Laird B. Leimkuhler B. A symplectic Method for Rigid-Body Molecular Simulation, March 1997

[16] Kneller G.R. Hinsen K. Phys.Rev. E 50, 1559 (1994)

[17] Kalra D. A formulation of Rigid-Body Assemblies for Computer Graphics Modeling

[18] Honeycutt J.D. Thirumalai D. Metastability of the folded states of globular proteins Proc.Natl.Acad.Sci.USA 87 3526 (1990)

[19] Baumketner A. Hiwatari Y. Phys.Rev. E 66, 11905 (2002) [20] Sorenson J.M. Head-Gordon T. Proteins 37, 582 (1999) [21] Shea J.E. et al. J. Chem. Phys. 109, 2895 (1998)

[22] Klimov D.K. Thirumalai D. Phys.Rev.Lett. 79, 317 (1997) [23] Stillinger F.H. Head-Gordon T. Hirshfeld C.L. Phys.Rev. E 48,

1469 (1993)

[24] Kalra D. A general formulation of rigid-body assemblies for computer graphics modeling

[25] Risken H. The Fokker-Planck Equation Springer-Verlag (1989) [26] Turchetti G. Dinamica Classica dei sistemi fisici Zanichelli 1998 [27] Landau L.D. Lifsits E.M. Fisica statistica Editori Riuniti 1978 [28] Guo Z. Thirumalai D. Kinetics of protein folding: nucleation

mechanism, time scales and pathways Biopolymers, 36,83 (1994) [29] Levinthal C. J. Chem. Phys. 65, 44 (1968)

[30] Nymeyer H. Garc´ıa A. Onuchic J.N. Proc. Natl. Acad. Sci. USA 95, 5921 (1998)

[31] Rapaport D.C. Phys. Rev. E 66, 011906 (2002)

[32] Baumketner A. Hiwatari Y. Phys.Rev. E 66, 011905 (2002) [33] Micheletti C. Seno F. Maritan A. Banavar J.R. Computational

Materials Science 20, 305 (2001)

[34] Micheletti C. Seno F. Maritan A. Banavar J.R. Learning effective amino acid interactions through iterative stochastic techniques [35] Klimov D.K. Thirumalai D. Phys.Rev. Lett. 79, 317 (1997) [36] Veitshans T. Klimov D.K. Thirumalai D. Folding and design 2,

1 (1997)

[37] Zhou Y. Karplus M. J. Mol. Biol. 293, 917 (1999)

Nel documento MODELLIDINAMICIPERILRIPIEGAMENTODELLAPROTEINA Universit`adegliStudidiBologna (pagine 74-91)