persistenza
Sempre nell’ipotesi di elasticità del DNA, è possibile definire un energia di bending, associata alle flessioni dell’asse del DNA e un’energia di twisting as-sociato all’overtwisting o all’untwisting della doppia elica. L’energia libera per le flessioni della dopia elica è:
∆Gbend= 1 2B θ2 L (B.12) dove L è la lunghezza assiale dell’elica che è piegata di un angolo θ radianti, B la costante di bending. Analogamente per il twisting elastico:
∆Gtwist= 1 2C φ2 L (B.13) dove φ è l’angolo di torsione della doppia elica, di lunghezza assiale L. Si può notare la somiglianza conB.8. Si trova che B = 350 kJ mol-1bp (180 RT bp a 25oC) e C = 440 kJ mol-1bp (180 RT bp a 25oC) [4].
La costante di bending B è una misura dell’energia richiesta per piegare l’asse della doppia elica, ma è direttamente legata alla flessibilità del DNA derivante dal moto termico. Questa flessibilità è tipicamente descritta da un parametro chiamato lunghezza di persistenza, che indichiao con a. La lunghez-za di persistenlunghez-za descrive la lunghezlunghez-za per la quale c’è correlazione tra la posizione iniziale e finale dell’elica. Dopo una distanza a, grazie al moto ter-mico, la deflessione media dell’asse dell’elica dalla direzione di partenza è di un radiante dopo 2a la correlazione è praticamente nulla e l’angolo di defles-sione medio è circa 90o. Il valore della lunghezza di persistenza è dunque legato a B, tramite la temperatura T :
a = B
kT. (B.14)
Appendice C
Fluttuazioni: effetti di volume
finito e di numero finito
Figura C.1. Un modello dell’espressione di un singolo ge-ne. Ciascuno step rappresenta diverse reazioni biochimiche, che sono associate alla produzione di mRNA e proteine, alle transizioni tra gli stati del promotore e alla degradazione di mRNA e proteine. Figura adattata da [39].
Supponiamo di avere uno schema cinetico leggermente differente da quel-lo mostrato nelCapitolo 2. In particolare seguiamo [39], il cui schema cine-tico è mostrato in Figura C.1, dove i rate di switch ON ↔ OFF dello stato del gene sono kON e kOF F, la produzione di mRNA e proteine avvengono con rate rispettivamente sA e sP e la degradazione dei trascritti e delle pro-teine con rate δM e δP. Viene aggiunto il rate sR che tiene conto della della possibile trascrizione del gene anche nello stato represso. Allora è possibile descrivere l’espressione genica usando equazioni di rate deterministiche per le concentrazioni di mRNA [M] e proteine [P]. Queste equazioni sono:
d[M ] dt = kON kON + kOF F sA V + kOF F kON + kOF F sR V − δM[M ] (C.1) d[P ] dt = sP[M ] − δP[P ] (C.2)
dove V è il volume della cellula. I termini δM[M ]e δP[P ]sono rispettiva-mete i rate di degradazione per mRNA e proteine; il termine sp[M ]è il rate di sintesi delle proteine. I rate costanti KON e KOF F governano le transizioni fra lo stato attivo e lo stato passivo del promotore. I rapporti kON/(kON+ kOF F)e
kOF F/(kON+ kOF F)in (C.1) sono le frazioni di tempo che il gene trascorre ri-spettivamente negli stati attivo e passivo (vedi (2.36)). La produzione di mR-NA, dunque, accade a rate costante, che è data data dalla media ponderata del rate di sintesi attiva (sa) e del tasso di sintesi passiva (sr).
C.1 Il limite macroscopico e cinetica di promotore
Le equazioni (C.1), (C.2) rappresentano una valida approssimazione della de-scrizione stocastica quando due limiti sono soddisfatti (FiguraC.2a). il primo è il limite macroscopico nel quale sr, sae V diventando grandi, con i rapporti sr/V e sa/V costanti. Il secondo è il limite di cinetica veloce del promotore, nel quale kON e kOF Fdiventano grandi, ma con rapporto costante. Da notare che questi limiti non alterano le equazioni (C.1) e (C.2). Nella FiguraC.2b, il limi-te della cinetica veloce del promotore è soddisfatto, ma le fluttuazioni sono grandi. Questo è dovuto al volume finito; le fluttuazioni tendono ad aumen-tare quando la taglia del sistema diminuisce. Per comprendere questa rela-zione, consideriamo una proteina che può muoversi liberamente tra il nucleo e il citoplasma. All’equilibrio le concentrazioni di proteine nel nucleo e nel citoplasma sono uguali in media. Comunque, poichè il volume del nucleo è minore di quello dell’intera cellula, la translocazione di una proteina attraver-so la membrana nucleare ha un effetto più significativo sulla concentrazione nucleare rispetto all’effetto che produce sulla concentrazione citoplasmatica. Se 10 molecole sono presenti nel nucleo e 1000 nel citoplasma, la translocazio-ne di 1 molecola causa una modifica del 10% translocazio-nella concentraziotranslocazio-ne nucleare, ma solo una modifica dello 0.1% nella concentrazione citoplasmatica. Questo effetto deriva dal differente numero di molecole nei due compartimenti, e ci si riferisce spesso a questo effetto come effetto di numero finito. In generale, se N denota l’abbondanza molecolare, una decrescita nell’abbondanza corri-sponde con un aumento del rumore, che scala come ∼ 1/√N. In C.2cviene mostrato come gli effetti di numero finito produca ampie fluttuazioni.
Gli effetti di volume finito e numero finito sono due dei fattori che con-tribuiscono all’aumento delle fluttuazioni nella abbondanza di proteine, e dunque aumenta l’eterogenenità della popolazione. Osserviamo, però, che, confrontando C.2b e C.2c, che le fluttuazioni sono perlopiù derivanti dal numero limitato di mRNA, piuttosto che di proteine.
(a)
(b) (c)
Figura C.2. Il rumore nell’espressione genica dipende dai rate cinetici. Concentrazione di proteine nel tempo generata da equazioni stocastiche (curva rossa) e deterministiche (cur-va blu). Gli istogrammi mostrano la probabilità che una cellu-la abbia una determinata abbondanza di proteina in un certo istante di tempo. In (a) notiamo piccole fluttuazioni rispetto al valore della concentrazione atteso (curva blu) per un nume-ro alto di mRNA e pnume-roteine espresse (i rate sono gli stessi di Figura2.5b). In (b) le fluttuazioni aumentano, in virtù della decrescita del numero espresso di mRNA e di proteine (ri-spettivamente ∼ 30 e ∼ 100). I rate di trascrizione e il volume sono diminuiti 100 volte, in confronto ad (a). In (c) Le gran-di fluttuazioni sono causate dal numero limitato gran-di mRNA (∼ 30), mentre il livello di proteine è mantenuto a ∼ 10000. Si noti che l’ampiezza delle fluttuazioni e le distribuzioni sono praticamente le stesse. Pertanto gli effetti di numero finito e di volume finito producono gli stessi effetti sulla distribuzio-ne di proteidistribuzio-ne. La barra sopra alla figura in (c) rappresenta gli intervalli nella time series in cui il livello di proteine devìa più del 10 % dal livello medio. Immagini tratte da [39].
Appendice D
Il processo di Poisson interrotto
Nel paragrafo4.2.1abbiamo mostrato, in breve, la differenza tra il modello IPP e il modello da noi utilizzato, che presenta una leggera modifica al mo-dello IPP. In particolare, supponevamo che la transizione ON → OF F poteva avvenire solo incrementando di 1 il numero di arrivi, ovvero ogni transizione nello stato ON avviene con una trascrizione. Il modello cinetico utilizzato in letteratura è però il modello standard dell’espressione genica (Figura 2.4) e gli step relativi alla trascrizione sono noti come processo di Poisson interrotto. Per completezza mostriamo i risultati che si hanno per il processo IPP, sotto-lineando le differenze con il modello di riferimento da noi adottato nel testo principale.
D.1 Statistica dei tempi di attesa
Per comodità riportiamo in questa appendice la Figura 4.15, già mostrata nellasezione 4.2. Lo schema cinetico che analizzeremo è dunque riportato in Figura D.1. Definiamo gli stati del gene ON e OF F rispettivamente gli stati in cui il gene è attivo e disattivo. I relativi rate associati alle transizioni ON ↔ OF F sono kOF F e kON. InFigura D.1si nota subito la differenza ri-spetto al caso trattato nel testo principale: il sistema può passare in ON solo se è nello stato attivo.
Detto t il tempo di attesa tra due arrivi consecutivi, cerchiamo la pdf asso-ciata all’occorrenza del primo evento nell’intervallo infinitesimo [t, t + dt] se poniamo a t = 0 l’istante in cui è avvenuto l’evento precedente. Denotiamo la probabilità di avere k arrivi nell’intervallo di tempo ]0, t], condizionata ad una arrivo a t = 0. La variabile = {0, 1} descrive se ad un dato istante di tempo t il sistema si trova in OF F ( = 0) o in ON ( = 1). Le master equation che governano l’evoluzione del sistema sono:
Figura D.1. Schema degli stati discreti in un processo IPP. Come inFigura 4.16, ciascuna box rappresenta uno stato de-scritto da pk,. Il sistema può trovarsi in un determinato istan-te t nello stato ON ( = 1) o OF F ( = 1). L’indice k denota il numero degli arrivi nell’intervallo temporale [0, t], condizio-nato ad un arrivo avvenuto all’istante t = 0. a differenza del caso trattato nel tsto principale, gli eventi occorrono con rate kisolo se il sistema si trova in ON . Immagine adattata da [19].
dp0,1(t) dt = kON p0,0(t) − (ki+ kOF F) p0,1(t) dpk,1(t) dt = kON pk,0(t) − (ki+ kOF F) pk,1(t) + kipk−1,1(t), k = 1, 2, ... dpk,0(t) dt = −kON pk,0(t) + kOF F pk,1(t) k = 0, 1, ... (D.1) con la condizione iniziale p0,1(t = 0) = 1.
La probabilità che il primo evento accada nell’intervallino [t, t + dt] è pari solamente alla probabilità che il sistema sia in ON senza aver trascrito fino al tempo t per la probabilità infinitesima kidtdi trascrivere tra t e t + dt:
f (t)dt = kip0,1(t)dt (D.2) da cui si ottiene la pdf dei tempi di attesa:
f (t) = kip0,1(t). (D.3)
Notiamo che non abbiamo aggiunto kOF F p1,0(t)dtin (D.2). Infatti il sistema visita lo stato p1,1(t)prima di arrivare nello stato descritto da p1,0(t).
Osserviamo che per trovare p0,1(t), e dunque f (t), basta risolvere le se-guenti due equazioni differenziali del prim’ordine estratte da (D.1):
dp0,1(t) dt = kON p0,0(t) − (ki+ kOF F) p0,1(t) dp0,0(t) dt = −kON p0,0(t) + kOF F p0,1(t) (D.4)
la soluzione è ancora la somma pesata di due esponenziali:
dove i rate r1,2 sono: r1,2 = 1 2 kON + kOF F + ki±p(kON+ kOF F + ki)2− 4kikOF F . (D.6) e i pesi sono formalmente analoghi a quelli trovati in (4.20) e (4.21)