• Non ci sono risultati.

RISULTATI e DISCUSSIONE A. IL BIORECETTORE KE1

1. Analisi bioinformatica

Ke1 è un polipeptide composto di 35 aminoacidi con formula molecolare C181H312N44O49S2. Le percentuali di ogni singolo aminoacido calcolate tramite il programma ProtParam (www.expasy.org) sono 22.9% Lys, 17.1% Leu, 11.4% Ala, Val, Glu e Ser, 5.7% Met e Phe ed infine 2.9% Gln. Il punto isoelettrico calcolato è pari a 9.78: la basicità di questa proteina è essenzialmente data dai residui di lisina che rivestono di cariche positive la superficie del peptide; sono presenti, infatti, 8 residui carichi positivamente (Lys) e 4 carichi negativamente (Asp e Glu). Il peso molecolare calcolato è di 3952.8Da, l’indice alifatico 111.43 e il valore di idrofobicità 0.123. L’indice di instabilità, stimato a -10.64, permette statisticamente di classificare KE1 come un peptide stabile.

Se si effettua un allineamento multiplo di sequenza con il programma SuperFamily (Gought J. 2001), impostando come input la sequenza del peptide KE1 e lanciando il calcolo contro il database SCOOP, che contiene tutti i motivi strutturali di proteine sperimentalmente determinate suddivisi gerarchicamente in classi, domini, superfamiglie, famiglie e speci, il risultato che si ottiene (figura 1) è una omologia di sequenza di questo biorecettore con 11 proteine che appartengono alla famiglia con motivo tipo leucine zipper, a dominio coiled-coil parallelo. L’omologia maggiore (95%) si riscontra con la catena A della proteina con codice 1JUN (Junius 1996), dominio trascrizionale di tipo omodimerico che lega il DNA.

ke1/1-35 ---KVSALKEKVSALKEQFLMLMFKV---SALKEKVSALKE--- 1junA/1-43 ---CGGRIARLEEKVKTLKAQNSELASTA---NMLREQVAQLKQKVMNY-- 1dh3A/1-55 ---KREVRLMKNREAARESRRKKKEYVKSLENRVAVLENQN---KTLIEELKALKDLYSHK-- 1hbwA/1-57 ---TRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDS--LRDIEALLTGLFVQDNVNKDA-- 1ysaC/1-58 ---MKDPAALKRARNTEAARRSRARKLQRMKQLEDKVEELLSKN---YHLENEVARLKKLVGER-- 1t2kD/1-61 ---KRRKFLERNRAAASRSRQKRKVWVQSLEKKAEDLSSLNGQLQSEVTLLRNEVAQLKQLLLA--- 1fosE/1-62 ---KRRIRR-ERNKMAAAKSRNRRRELTDTLQAETDQLEDEKSALQTEIANLLKEKEKLEFILAAH-- 1nwqC/1-62 ---GSNSNEYRVRRERNNIAVRKSRDKAKQRNVETQQKVLELTSDNDRLRKRVEQLSRELDTLRG--- 2c9lZ/1-63 ---MLEIKRYKNRVAARKSRAKFKQLLQHYREVAAAKSSENDRLRLLLKQMCPSLD-VDSIIPRTPD 1ci6A/1-63 ---MKKLKKMEQNKTAATRYRQKKRAEQEALTGECKELEKKNEALKERADSLAKEIQYLKDLIEEV-- 1gd2G/1-70 ---RKNSDQEPSSKRKAQNRAAQRAFRKRKEDHLKALETQVVTLKELHSSTTLENDQLRQKVRQLEEELRILK- 1h88A/1-78 VKSKAKKTVDKHSDEYKIRRERNNIAVRKSRDKAKMRNLETQHKVLELTAENERLQKKVEQLSRELSTLRNLFKQLPE

Figura 1. Allineamento di sequenza effettuato con il programma SuperFamily tra KE1 e le proteine a più alta omologia prese dal database SCOOP con motivo tipo Leucine Zipper. L’allineamento è stato condotto con una matrice Gonnet con penalità per presenza di un gap 10 e per estensione di un gap 0.2. I residui con maggior grado di conservazione sono evidenziati in rosso (basici), viola (acidi), verde (polari) e ciano (idrofobici).

Dato che le caratteristiche di residui omologhi, o conservati dal punto di vista funzionale, possono essere correlate anche ad una similarità strutturale, è pensabile che se esiste una omologia funzionale nella sequenza polipeptidica tra KE1 e le proteine con dominio coiled-coil, questa possa rispecchiare una omologia di strutture. Usando il programma Coil (Lupas A. 1991) ed il programma MultiCoil (Wolf E. 1997) è stata effettuata una analisi statistica (figura 2) per determinare la struttura secondaria teorica del biorecettore. Entrambi i programmi effettuano inizialmente una ricerca nel Protein Data Bank di tutte quelle strutture, risolte tramite diffrazione di raggi x e NMR, che presentano motivi strutturali tipo α-elica o coiled-coil e successivamente confrontano la sequenza di queste con quella data come input. Tramite una matrice, in cui sono assegnate per ogni singola struttura la media e la deviazione standard dai valori ideali nei singoli motivi, viene determinata la probabilità in percentuale che si formi quella struttura.

Motivi strutturali 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.91 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 Residui P ro b ab il it à

Elica Dimero Trimero

Figura 2. Predizione secondaria dei motivi strutturali del peptide KE1 usando i programmi Coil e MultiCoil. È visualizzata la probabilità per ogni singolo aminoacido di strutturarsi in α-elica (blu), dimero coiled-coil (giallo) e trimero coiled-coil (verde).

Come si osserva dal grafico in figura 2, la probabilità che il peptide assuma una conformazione ad α-elica è >90% per i residui la cui sequenza è conservata nelle 4 eptadi (KVSALKE), mentre è quasi nulla (<1%) per i residui dell’eptade centrale (QFLMLMF), ossia quei residui che sono stati randomizzati per aumentare l’affinità di legame e riconoscimento del recettore verso caffeina e teofillina. Questo andamento è indice della formazione di un motivo tipo α-loop-α (linea blu). Per quanto riguarda invece la probabilità che la catena polipeptidica possa generare in soluzione un motivo tipo coiled-coil parallelo, essa è quasi nulla se si tratta di una forma dimerica (linea gialla) mentre è >50% se si tratta di trimero (linea verde). Si può notare come le percentuali che indicano la strutturazione α -loop-α e tipo coiled-coil dimerico, sono in contrasto tra loro, in quanto di per se,

strutturalmente, i due motivi sono lo stesso. Il motivo α-loop-α, infatti, può essere ricondotto al coiled-coil dimerico antiparallelo (α) nel caso in cui le 2 eliche siano interfacciate tra loro tramite interazioni idrofobiche. Per ottenere ulteriori informazioni sulla possibile struttura del biorecettore è stato fatto un confronto strutturale di tipo teorico-statistico con le strutture a più alta omologia che sono disponibili nel Protein Data Bank. Il multiallineamento, effettuato con DALI (Holm L. 1998; Holm L. 2010), è stato lanciato dando come input le coordinate sperimentali del peptide e ottimizzando gli allineamenti, prima a coppie e poi globalmente, in modo da trovare quelle strutture secondarie omologhe (Zscore>3) caratterizzate da una sequenza con identità >20%.

KE1 --KVSALKEKVSALKEQFLCLMFKVSALKEKVSALKE-- --LHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH LL--1kd8B --KVKQLKAKVEELKSKLWHLKNKVARLKKKNAECKA-- --LHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH L--1kd9A --EVKQLEAEVEELESELWHLENEVARLEKENAECEA-- --LHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH L--1rb4B --RMKQLEDKVEELLSKAYHLENEVARLKKLVGE--- --LHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH L---2zfcA vqQQNNILRALEATQHAVQALVWGVKQLQARVLALER-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --2wpzC --RMKQLEDKVEENLSKVYHNENEVARLKKLVGER---- --LHHHHHHHHHHHHHHHHHHHHHHHHHHHHH LLL----2nrnB --KVKQLADKVEELLSKNYHLANEVARLAKLVGER---- --LHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH LL----2hy6A ---VKQLADAVEELASANYHLANAVARLAKAVGE--- --LHHHHHHHHHHHHHHHHHHHHHHHHHHHHH L---1ij2B --RMKQLEDKVEELLSKTYHLENEVARLKKLVGE--- --LHHHHHHHHHHHHHHHHHHHHHHHHHHHHHLL--- 2akfA ---VSRLEEDVRNLNAIVQKLQERLDRLEETVQAK---- --LLHHHHHHHHHHHHHHHHHHHHHHHHHHHHH L---1g2cX lvFPSDEFDASISQVNEKINQSLAFIRKSDELLHNVN-- llLLHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH LLL--3he4A klKENAKLENIVARLENDNANLEKDIANLEKDIANLE-- llLHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --2oqqA saYLSELENRVKDLENKNSELEERLSTLQNENQMLRH-- lhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-- 2r2vE ----MKLKQVADKLEEVASKLYHNANELARVAKLL---- --LLHHHHHHHHHHHHHHHHHHHHHHHHHHHH L---1mz9A pqMLRELQETNAALQDVRELLRQQVKEITFLKNTVME-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH L--3he5D lrKKIARLKKDNLQLERDEQNLEKIIANLRDEIARLE-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --1ci6B kmRNLETQHKVLELTAENERLQKKVEQLSRELSTLRN-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --1w2eB rvAVXAALNITHDLLHRKERLDQESSSTRERVRELLD-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --1nhlA ieSQDAGIKTITXLDEQKEQLNRIEEGLDQINKDXRE-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --2z5hI aaSMDAIKKKMQMLKLDKENALDRAEQLENEVARLKK-- -lLLLHHHHLLLLLLLLLHHHH LLLLLLLLLLLLLLL--2rddB spMSLILMLVVFGLIFYFMILRPQQKRTKEHK-KLMD-- llLHHHHHHHHHHHHHHHHLHHHHHHHHHHHL-LHHH --2wt7A akCRNRRRELTDTLQAETDQLEDEKSALQTEIANLLK-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --2w83C ilENTQLLETKNALNIVKNDLIAKVDELTCEKDVLQG-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --1t2kD srSRQKRKVWVQSLEKKAEDLSSLNGQLQSEVTLLRN-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --2k88A aeKEAHEIVSKARKYRQDKLKQAKTDAAKEIDSYKIQ-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH --1t2kC skSRKRKLERIARLEEKVKTLKAQNSELASTANMLRE-- hhHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH--

Figura 3. Allineamento di strutture effettuato contro il database PDB con il programma DALI tra KE1 e le 25 catene proteiche trovate a più alta omologia strutturale (Z>3 e omologia di sequenza >20%). A sinistra sono allineate le sequenze: i residui conservati sono evidenziati in blu (acidi), in rosso (basici), in verde (apolari) ed in viola (polari). A destra le relative strutture secondarie.

Il programma confronta le mappe di contatti tra carboni α tra coppie di proteine (pairwise

alignment). Ogni proteina viene descritta da una matrice di distanze, nella quale l’elemento (i,

j) corrisponde alla distanza tra i carboni alfa compresi tra l’i-esimo e il j–esimo residuo. Il confronto di porzioni di proteine si riduce quindi al confronto di sottomatrici di distanze, selezionate sulla base della qualità di ogni accoppiamento di sottomatrici. L’utilizzo di questa matrice semplifica e rende i calcoli più veloci e permette di rappresentare in due dimensioni le informazioni essenziali relative alle strutture tridimensionali delle proteine. Sono state trovate in tutto 60 catene proteiche, alcune delle quali sono risultate ridondanti o derivanti da proteine ipotetiche, perciò escluse dall’allineamento. Le 25 catene polipeptidiche omologhe a KE1 e strutturate totalmente ad α-elica sono visualizzate in figura 3. Da queste

prime analisi è possibile quindi definire, dall’analisi computazionale, che la struttura secondaria del biorecettore genera un motivo tipo coiled-coil, composto interamente da una α-elica.