1. INTRODUZIONE
1.2 CASO DI STUDIO 1 L’AGENTE EZIOLOGICO DELLA SINDROME
1.2.2 LE PROTEINE STRUTTURALI
1.2.2.1 La proteina N
Il gene N, lungo 1269 nucleotidi, codifica per una fosfoproteina di 422 amminoacidi del peso di 46 KDa, la cui funzione principale è quella di interagire con l'RNA virale a formare una struttura nucleocapsidica elicoidale (Surjit & Lal, 2007). La sua composizione in amminoacidi polari la rende altamente idrofilica. E' l'unica proteina del SARS-CoV che non presenta ponti disolfuro in quanto è totalmente priva di residui di cisteina. Ciò le conferisce una stabilità molto bassa rispetto alle altre proteine strutturali del virus (Qin et al., 2003). Studi termodinamici condotti in vitro sulla proteina N ricombinante purificata hanno mostrato che essa è stabile a valori di pH compresi tra 7 e 10, con un massimo di stabilità conformazionale intorno a pH 9 (Luo et al., 2004). E‘ stato inoltre dimostrato che tale proteina inizia a perdere la conformazione a 35°C ed è irreversibilmente denaturata a 55°C (Wang et al., 2004), mentre la denaturazione ottenuta con agenti chimici (ad esempio urea) è reversibile (Surjit & Lal, 2007).
La regione N-terminale consiste principalmente di amminoacidi carichi positivamente ed è responsabile del legame con l‘RNA virale (Huang et al., 2004) mentre la regione C- terminale, ricca di lisine presente tra gli amminoacidi 373 e 390, è probabilmente un segnale di localizzazione nucleare. Nella regione centrale, tra gli amminoacidi 177 e 207, è presente un motivo ricco in serine e arginine (SR-rich motif) (Surjit & Lal, 2007) (figura 17).
Studi biofisici condotti da Chang e colleghi hanno suggerito che la proteina N è composta da due domini strutturali indipendenti e una regione linker (Chang et al., 2006) (figura
18). Il primo dominio, presente all‘N-terminale, si trova all‘interno del dominio di legame
all‘RNA. Il secondo dominio consiste di una regione C-terminale in grado di auto- assemblaggio. Tra i due domini è presente una regione altamente disordinata che serve da linker. Questa regione interagisce con la proteina M e con la ribonucleoproteina umana cellulare hnRNPA1 (Fang et al., 2006; Luo et al., 2005a, b). Inoltre, questa regione sembra essere sito delle numerose fosforilazioni presenti nella proteina N. Le fosforilazioni, ad opera di diverse chinasi, avvengono, infatti, a livello delle serine, presenti nel ―SR-rich motif‖ (Chang et al., 2006).
Figura 17. Struttura della proteina N del SARS-CoV.(Fonte: Surjit & Lal, 2007)
GK62EE: motivo di sumoilazione (residui di lisina); KEL105: motivo RXL, responsabile del legame con la ciclina D; S207PAR: motivo soggetto a fosforilazione ad opera del complesso ciclina-CDK (residui di
serina).
Figura 18. Modello proposto da Chang e collaboratori per la struttura della proteina N (Fonte: Chang et al., 2006) . E‘ mostrata l‘interazione tra due proteine N. RBD: dominio di legame all‘RNA; DD: dominio
di dimerizzazione.
Come nel caso degli altri coronavirus, la proteina N del SARS-CoV è soggetta a varie modificazioni post-traduzionali come l‘acetilazione, la fosforilazione e la sumoilazione. La prima metionina della proteina è rimossa, le altre metionine all‘N-terminale sono ossidate, e la serina all‘N-terminale è acetilata (Krokhin et al., 2003).
La sumoilazione avviene a livello del residuo di lisina 62, presente all‘interno del putativo sito di sumoilazione GKEE mostrato in figura 17 (Li et al., 2005b), e sembra svolgere un ruolo chiave nel modulare l‘oligomerizzazione della proteina, nella sua traslocazione nucleolare e nelle proprietà della proteina di de-regolare il ciclo cellulare (Surjit & Lal, 2007). Inoltre è stato dimostrato che la maggior parte delle serine presenti nella proteina N sono fosforilate ad opera di diverse chinasi (Surjit et al., 2005).
Diversamente dalla maggior parte dei coronavirus, la proteina N del SARS-CoV è distribuita prevalentemente nel citoplasma, sia in cellule infettate che quando espressa in maniera eterologa (Surjit et al., 2005; You et al., 2005; Rowland et al., 2005).
In aggiunta, alcuni studi condotti su cellule infettate mostrano una localizzazione nucleolare della proteina (You et al., 2005). E‘ ancora da chiarire completamente la localizzazione intracellulare della proteina. Tuttavia, uno studio condotto dal gruppo di Timani e colleghi su mutanti per delezione della proteina N, ha mostrato che l‘estremità N-terminale si localizza nel nucleo, mentre l‘estremità C-terminale si riscontra nel citoplasma e nel nucleolo. Usando diverse combinazioni di differenti mutanti di delezione, questi ricercatori sono giunti alla conclusione che la proteina N potrebbe agire da ―shuttle‖ tra il citoplasma, il nucleo e il nucleolo (Timani et al., 2005).
Come accennato in precedenza, la principale funzione della proteina N è quella di interagire con l‘RNA virale a formare la struttura nucleocapsidica e questa interazione avviene principalmente a livello del dominio N-terminale; tuttavia studi recenti hanno dimostrato che esiste un altro dominio in grado di legare più fortemente l‘RNA, nella regione C-terminale della proteina (Chen et al., 2007). La proteina N è anche in grado di oligomerizzare, formando dimeri, trimeri, tetrameri o esameri dipendentemente dalla concentrazione della stessa (Surjit & Lal, 2007).
In aggiunta alla capacità di formare il nucleocapside, la proteina N presenta numerose altre funzioni. Essa è in grado di deregolare il ciclo cellulare dell‘ospite, principalmente attraverso il motivo di sumoilazione (Li et al., 2005b), inibendo la progressione della fase S del ciclo cellulare e la sintesi dei geni specifici di questa fase come la ciclina E e la CDK2 (Surjit et al., 2006). E‘ stato osservato che la proteina N inibisce direttamente l‘attività dei complessi ciclina-CDK, che risulta nell‘ipofosforilazione della proteina del retinoblastoma, ma sono ancora da chiarire completamente i meccanismi che portano alla deregolazione del ciclo cellulare (Surjit & Lal, 2007). E‘ stato inoltre dimostrato il ruolo che la proteina N svolge nell‘attivazione del fattore nucleare kappa B (NF-kB) (Liao et
al., 2005a), un fattore di trascrizione che attiva numerosi geni coinvolti in risposte
immunitarie cellulari e nei processi infiammatori, come l‘interferon-β, il fattore di necrosi tumorale (TNF)-α e le interleuchine (IL) 2, 6 ed 8. Altri studi hanno suggerito che la proteina N è coinvolta anche nell‘attivazione della via di trasduzione del segnale dell‘attivatore proteico AP1. Questo attivatore è coinvolto in processi come la proliferazione cellulare, la differenziazione e l‘apoptosi (He et al., 2003a).
La proteina N risultata essere un buon marcatore di diagnosi precoce dell‘infezione da parte del SARS-CoV. Essa può essere riscontrata il giorno successivo l‘insorgenza della malattia ed è la proteina virale più abbondante nel plasma di pazienti infetti (Che et al.,
pazienti infetti da SARS (Shi et al., 2004; Tan et al., 2004), mentre solo nel 63% dei pazienti sono stati rilevati anticorpi diretti contro la proteina S (Leung et al., 2004). La proteina N rappresenta anche un buon antigene da impiegare nella formulazione di un vaccino contro il SARS-CoV, in quanto è in grado di promuovere la produzione di anticorpi e di linfociti T citotossici (CTL), questi ultimi importanti per l‘eliminazione delle cellule infettate (Gao et al., 2003; Zhu et al., 2004).