4. Risultati
4.1 Analisi bioinformatica della proteina-minibody
4.1.1 Analisi della sequenza primaria
L’analisi della sequenza primaria è stata condotta tramite appaiamento contro un database di sequenze proteiche non ridondante (BLASTp, Non redundant protein sequences (nr), GenBank CDS translations + RefSeq Proteins + PDB + SwissProt + PIR + PRF) (cfr. § 3.1.1) al fine di verificare la correttezza della sequenza stessa e approfondire le informazioni riguardanti la sua origine.
Peptide segnale
MGWSLILLFLVAVATGVHS
Peptide segnale, 19 aa. L’analisi con BLASTp non identifica alcun dominio conservato noto (come atteso). Le sequenze che mostrano un’identità più elevata sono le seguenti:
Immunoglobulin heavy chain variable region, precursor (Mus musculus); GenBank: AAB87660.1; copertura 100%, identità 84%.
Query MGWSLILLFLVAVATGVHS 19 Sbjct MGWSYIILFLVATATGVHS 19
Chimeric anti-Burkholderia pseudomallei immunoglobulin heavy chain leader sequence [synthetic construct] GenBank: ADB20405.1; copertura 78% (I primi 15 aa), identità 100%.
Query MGWSLILLFLVAVATGVHS 19 Sbjct MGWSLILLFLVAVAT---- 15
La sequenza è derivata dal peptide segnale nativo di Ig di topo, e vede la sostituzione di 3 amminoacidi (Tyr→Leu, Ile→Leu e Thr→Val). Questa sequenza è stata ricavata da un consensus di tutti i peptidi segnale noti per Ig murine, come avviene in effetti per il secondo risultato (Kim et al., 2011); è stata quindi ribattezzata PSott (ottimizzato).
VL
QAVVTQESALTTSPGETVTLTCRSSTGAVTTSNYANWVQEKPDHLFTGLIGGTNNRAPGVPARFSGSLIGDKAAL TITGAQTEDEAIYFCALWYSNHFIFGSGTKVTVLG
Dominio variabile della catena leggera (VL), 110 aa. L’analisi con BLASTp identifica come atteso la presenza di domini conservati che identificano la sequenza come appartenente alla superfamiglia delle Ig, in particolare parte della regione variabile (V) della catena leggera (L) di isotipo λ.
Le sequenze che mostrano un’identità più elevata sono le seguenti:
Immunoglobulin lambda chain [Mus musculus]; GenBank: AAO53359.1; copertura 100%, identità 100%.
BCL1 lymphoma-derived single chain idiotype variable region [synthetic construct]; GenBank: AAF81417.1; copertura 100%, identità 100%.
Entrambi i risultati indicano come la sequenza VL corrisponda esattamente alla parte variabile della catena leggera di Ig murina, e confermano la sua appartenenza alla linea murina linfoblastoide BCL1.
75 Linker
GSTSGSGKPGSGEGSTKG
Peptide di collegamento fra i domini VL e VH, 18 aa. L’analisi con BLASTp non identifica alcun dominio conservato noto (come atteso). Le sequenze che mostrano un’identità più elevata sono le seguenti:
FMC63-28Z receptor protein [synthetic construct]; GenBank: ADM64594.1 copertura 100%, identità 100%.
Anti-human insulin ScFv antibody [synthetic construct]; GenBank: AEK48236.1, AEK48238.1, AEK48242.1, AEK48240.1; copertura 100%, identità 100%.
Anti-death receptor DR4 ScFv antibody [synthetic construct]; GenBank: AEK48234.1, AEK48233.1; copertura 100%, identità 100%.
Anti-Eimeria acervulina surface ScFv antibody [synthetic construct]; GenBank: AAU21208.1, AAU21209.1; copertura 100%, identità 100%.
Tutti i risultati che presentano la sequenza linker sono costrutti sintetici, in cui viene utilizzata come collegamento fra due porzioni di un scFv; ciò conferma il ruolo del peptide artificiale, già descritto in letteratura (cfr. § 1.2.5).
VH
EVQLQQSGPEVVRPGVSVKISCKGSGYTFTDYAMHWVKQSHAKSLEWIGVISTYNGNTNYNQKFKGKATMTVDKS SSTAYMELARLTSEDSAIYYCARYYGNYFDYWGQGTTLTV
Dominio variabile della catena pesante (VH), 115 aa. L’analisi con BLASTp rivela come atteso la presenza di domini conservati che identificano la sequenza come appartenente alla superfamiglia delle Ig, in particolare parte della regione variabile (V) della catena pesante (H).
Le sequenze che mostrano un’identità più elevata sono le seguenti:
BCL1 lymphoma-derived single chain idiotype variable region [synthetic construct]; GenBank: AAF81417.1; copertura 100%, identità 99%.
Query 1 EVQLQQSGPEVVRP…DYWGQGTTLTV 115 Sbjct 20 QVQLQQSGPEVVRP…DYWGQGTTLTV 134
Immunogloblin M heavy chain variable region [Mus musculus]; GenBank: BAD93357.1; copertura 96%, identità 99%.
Query 1 EVQLQQSGPEVVRP…GNYFDYWGQGT 111 Sbjct 14 QVQLQQSGPEVVRP…GNYFDYWGQGT 124
Full=Ig heavy chain V region BCL1; Flags: Precursor; Swiss-Prot: P01759.1; copertura 100%, identità 95%.
Query 1 EVQLQQSGPEVVRP…SSSTAYMELARLTSEDSAIYYCARYYGNYFDYWGQGTTLTV 115 Sbjct 20 QVQLQQSGPEVVRP…SSSTVHMELARLTSEDSANLYCARYYGNYFDYWGQGTTLTV 134
76 I risultati mostrano una corrispondenza con la regione variabile della catena pesante di Ig murina derivata da BCL1, come atteso. La classificazione come appartenente a IgM è corretta e dovuta alle caratteristiche della linea BCL1 (cfr. § 1.2.5). La sostituzione Gln (Q) → Glu (E) (da un amminoacido polare a uno con carica negativa) presente nella sequenza da noi posseduta è comune e viene ritrovata in diverse sequenze immunoglobuliniche; un’ulteriore analisi su più database rivela infatti questo tratto in sequenze come Swiss-Prot: P01756.1 (Full=Ig heavy chain V region MOPC 104E), Ig secreta da un mieloma murino di diverso tipo.
Mini-linker SSGGSG
L’analisi con BLAST non porta a risultati coerenti, come ci si può aspettare per un peptide di lunghezza così ristretta. Si tratta di una sequenza artificiale con l’unica funzione di collegamento fra scFv e dominio CH3; i linker sono spesso composti da residui flessibili come Gly e Ser in modo da permettere a domini proteici adiacenti di muoversi liberamente l’uno rispetto all’altro; la presenza di Ser serve a conferire proprietà debolmente idrofile (Robinson e Sauer, 1998).
mCH3
GRPKAPQVYTIPPPKEQMAKDKVSLTCMITDFFPEDITVEWQWNGQPAENYKNTQPIMDTDGSYFVYSKLNVQKS NWEAGNTFTCSVLHEGLHNHHTEKSLSHSPGK
Dominio costante della catena pesante (CH) di IgG murina, 107 aa. L’analisi con BLASTp rivela come atteso la presenza di domini conservati che identificano la sequenza come appartenente alla superfamiglia delle Ig.
Le sequenze che mostrano un’identità più elevata sono le seguenti:
Chain A, Murine Unglycosylated Igg Fc Fragment; PDB: 3HKF_A; copertura 100%, identità 100%. Ig gamma-1 chain C region (15C5) - mouse (fragment); PIR: S14236; copertura 100%, identità 98%.
Immunoglobulin gamma 1 heavy chain [Mus musculus]; GenBank: ACO52350.1; copertura 100%, identità 99%.
I risultati confermano la sequenza come appartenente al dominio costante di una catena pesante (γ) di IgG murina, tipo 1.
hCH3
GQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKS RWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK
Dominio costante della catena pesante (CH) di IgG umana, 107 aa. L’analisi con BLASTp rivela come atteso la presenza di domini conservati che identificano la sequenza come appartenente alla superfamiglia delle Ig.
77 Immunoglobulin gamma-1 heavy chain constant region [Homo sapiens]; GenBank: AAL96263.1; copertura 100%, identità 100%.
Immunoglobulin gamma heavy chain 3 [Homo sapiens]; GenBank: AAW65947.1; copertura 100%, identità 100%.
I risultati confermano la sequenza come appartenente al dominio costante (CH3) di una catena pesante (γ) di IgG umana, tipo 1.
Micro-linker GGS
Come per il mini-linker, si tratta di una corta sequenza artificiale composta da Gly e Ser con l’unico scopo di unire in modo ottimale due domini distinti.
Nonamero VQGEESNDK
Nonapeptide derivato da IL1ß, 9aa (cfr, § 1.2.5). L’analisi con BLASTp non identifica alcun dominio conservato noto (come atteso). Le sequenze che mostrano un’identità più elevata sono le seguenti:
Interleukin 1, beta, isoform CRA_c [Homo sapiens]; GenBank: EAW73607.1; copertura 100%, identità 100%.
Come atteso, l’analisi riconosce il nonamero come parte dell’interleuchina 1 ß umana. Di seguito è riportata la sequenza dell’interleuchina (precursore: in grigio la regione rimossa con la maturazione della proteina) con in evidenza la localizzazione del nonamero.
1 MTAMHWMLRE ITHERSRHGE VTHFLLFTQV SEAAMAEVPE LASEMMAYYS GNEDDLFFEA 61 DGPKQMKCSF QDLDLCPLDG GIQLRISDHH YSKGFRQAAS VVVAMDKLRK MLVPCPQTFQ 121 ENDLSTFFPF IFEEEPIFFD TWDNEAYVHD APVRSLNCTL RDSQQKSLVM SGPYELKALH 181 LQGQDMEQQV VFSMSFVQGE ESNDKIPVAL GLKEKNLYLS CVLKDDKPTL QLESVDPKNY 241 PKKKMEKRFV FNKIEINNKL EFESAQFPNW YISTSQAENM PVFLGGTKGG QDITDFTMQF 301 VSS