Aplicació de la metodologia QSPR al càlcul de
propietats de compostos inorgànics i de
sistemes multicomponents
Jesús Jover Modrego
Aquesta tesi doctoral està subjecta a la llicència Reconeixement 4.0. Espanya de Creative
Commons.
Esta tesis doctoral está sujeta a la licencia Reconocimiento 4.0. España de Creative
Commons.
(1
bw
UNIVERSITAT DE BARCELONA4D
Departament
de
Química
Inorgánica
Aplicació
de la
metodologia
QSPR
al
cálcul
de
propietats
de
compostos
ínorgánícs
i de
sistemes
multicomponents
. ,,'. �
Jesús
Jover
Modrego
Tesi Doctoral
U
niversitat de
Barcelona
Departament
de
Química
Inorgánica
Programa
de Doctorat de
Química Inorgánica
Bienni 2003/2005
Aplicació
de
la
metodologia
QSPR
al
cálcul
de
propietats
de
compostos
Inorgánícs
i de
sistemes
multicomponents
Memoria
presentada
per
enJesús
Jover
Modrego
Joaquim
Sales Cabré. Catedrátic delDepartament
deQuímica
Inorgánica
de laUniversitatdeBarcelona.
Ramón
Bosque Pueyo.
Professor titular delDepartament
deQuímica Inorgánica
de la Universitat deBarcelona.Certifiquen: Que
el treball titulat"Aplicació
de lametodologia QSPR
al cálcul depropietats
decompostos
inorgánics
i de sistemesmulticomponents"
quepresenta
Jesús JoverModrego,
peraspirar
al grau de doctor per la Universitat deBarcelona,
ha estatrealitzat sotalaseva direccióenel
Departament
deQuímica Inorgánica
de laUniversitatdeBarcelona.
Barcelona,
Desembre de 2007.Dr.
Joaquim
Sales Cabré Dr. RamónBosque
Pueyo
La realització
d'aquesta
Tesi Doctoral ha estatpossible grácies
a la concessió d'unaBeca de Formació en la Recerca i la Docencia
(BRD)
de la Universitat de BarcelonaFa més de cinc anys que
vaig
aterrar enaquest
departament,
en totaquest temps
m'han
passat
un munt de coses i heconegut
un gran nombre de persones que, d'una manera o una altra m'han marcatprofundament. Aquest petit espai
ha de servir com aagrairnent
atotes ellesi, també,
per atotes les que de segur estaréoblidant,
encara que nosigui
voluntáriament.En
primer
lloc,
als meus directors deTesi,
Joaquim
Sales i RamónBosque.
Per haver-rneensenyat
que no tota laQuímica
es fa en elslaboratoris,
per anar sempre unpas més enllá del que
jo
hauria estat capac, per la resolució dedubtes,
el programes i mil coses més queno cabenenaquestes
pagines.
Als meus companys fixos de "camarote". Al Jordi Cirera per
TOT,
és adir,
elsmoments d'humor
compartits,
els concerts, el MarioKart,
les sortidespero,
sobretot,
per ser un bon amic. Al David Casanova per
aguantar-nos
al' Avi i a mi quan ensposávem
enplan "salvaje",
pels
seusapunts
humorísticsinesperats,
per les consoles iveduretes
(hem
de feralguna més)
i també per les seves deduccionsmaternátiques
increíbles. Si és cert aixó que
diuen,
quegaudir
fa viure més anys, nosaltres arribaremals cent.
Als altres companys que es vantraslladar quanvan
poder (no
sé si perculpa
delsque ens vam
quedar).
Al ThomasCauchy
per les classes defrances-chicano,
els ballsregionals
i les crepes(sobretot
aixóúltim).
Al Javi Tercero per ser capac se sumar-se anosaltres.
A los
"niños", Toni,
Benji, Jorge
iEdu,
perqué
en vosaltresveig
des de fora elreflex del que per a mi hanestat
aquests
anys, per la míticaorganització
de la tesi d'enTommy
i pertotsels bons momentsque m'hanajudat
a acabar lameya. A lameya novacompanya de
despatx,
laSílvia,
que haaparegut
quanja
portava quatre
mesos sol aldespatx
(comencava
a sentir-me com unprofe,
ambdespatx
propi)
per fer-me veure quesempre ésmillorestar
acompanyat.
Atotel grup d'Estructura Electrónica per demostrar que ser un"membre annex"
té molts
avantatges,
com que et convidin als aniversaris on l'Eliseo posa elspastissos.
Al grup de Materials
Catalítics,
al Narcís Homs i la Pilar Ramírez de laPiscina,
per acollir-me en les seves files
(estic
segur queaquesta
dada haagafat desprevingut
amés
d'un).
To all the
people
ofthe ITODYS lab in Paris withaspecial
memory to Prof. Bo Tao Fan(or
just
Fan asyousaid).
ACátia porayudarme
mientras estuveallí,
por venir a vermeaquí,
por el día de la música(que llovió)
y poracompañarme
a ver la final de laChampions
que elBarca ganó
en París. 1 wantto thank alsoJoseph,
Florent, Lina,
Ana andCyril.
A mi
familia,
por habermeayudado
allegar
hastaaquí,
por hacerme ser lapersona que soy ypor tantas otrascosas que, si
quisiera ponerlas
porescrito,
abarcaríanmás
espacio
que el que ocupa estaTesisentera.A
Nuria,
por ser capaz deaguantarme
y de reirconmigo,
porcompartir
su vida con la mía y por hacerme ver que, a veces, yo también meequivoco. Espero
quesiempre
estés a mi lado para apoyarme, echarme la bronca o lo quetoque
en esemomento.
A la familia
política,
porque sediga
lo que sediga,
ellos también sonimportantes,
Antonio, Nieves,
Fuen y Ernesto. Unagradecimiento especial
para los miembros de la familia que han cambiado mi manera de ver el mundo y que aún nosaben leer:
Álex,
Marc i Alba(espero
que cuando seáis mayores os leáis este tocho queescribióvuestro
tío).
Atatala
gent
deldepartament
deQuímica Inorgánica
pertotes les coses que heucompartit
ambmi,
lespractiques,
els sopars de nadal i elspartits
de futbol(¡estúpida
rodilla!).
Unagraiment
moltespecial
per al'Oscar
i el Fran d'EstatSolid,
pertotes les"Es
simple.
Laestupidez
realsiempre
vence alainteligencia
artificial."Mustrum
Ridcully
enPapá
Puerco,
Terry
Pratchett"Lo quellamamos "casualidad"no esmás quela
ignorancia
de lascausas físicas."GottfriedWilhelmLeibniz.
"¿Quería
matarme?Bajo
esta capanoqueda
carnenisangre que sepueda
matar.Sólo
hay
unaidea,
y lasideas son aprueba
de balas."Índex
1. Introducció 1.1. Antecedents 1.2.Objectius
1.3.Bibliografia
1 6 12 17 2. Fonaments imetodologia
2.1.
Esquema
general
de treball 2.1.1.Dades d' entrada2.1.2.
Optimització
delageometria
2.1.3. Cálcul dedescriptors
2.1.4. Establiment dels models 2.1.5. Validacions
2.2 Annexos
Annex 1. Criteris estadístics 44 Annex2. Selecció de
descriptors
i construcció de models 512.3.
Bibliografia
79 25 27 27 28 29 34 40 3.Compostos inorgánics
853.1 Viscositat de
compostos
organometál-Iics
89 3.1.1 Viscositata20°C 92Modellineal 93
Modelno lineal: Xarxes neuronals BPNN 96
Modelno lineal:
Support
VectorMachines 1003.1.2.Viscositat a
temperatura
variable 110Modellineal 111
Modelnolineal: Xarxes neuronals BPNN 114 Modelnolineal:
Support
Vector Machines 1193.2 Tensió
superficial
decompostos
organometál-Iics
135 3.2.1. Tensiósuperficial
a20°C 138Modellineal 139
Modelno lineal: Xarxes neuronals BPNN 142
3.2.2. Tensió
superficial
atemperatura
variable 155Modellineal 156
Modelno lineal: Xarxes neuronalsBPNN 159
Modelno lineal:
Support
VectorMachines 1633.3
Entalpia
de formació decompostos
organometál-lics
179Compostos organometál-lics
182Compostos
orgánics
1893.4. Basicitat catiónica de
compostos
orgánics
front liti 202Modellineal 204
Modelsno lineals 210
3.5.
Bibliografia
2214. Sistemes
multicomponents
227 4.1. Afinitat i basicitatcatióniques
dels aminoácids habituals 2324.1.1. Afinitat i basicitat amb cálculsteórics 234 4.1.2. Afinitat amb la
metodologia QSPR
267 4.2. Constant d'acidesadecompostos
orgánics
endiferentssolvents 277 4.2.1.pKa
de fenols 284 Modelno lineal: Xarxes neuronals BPNN 285 Modelno lineal:Support
VectorMachines 291 4.2.2.pKa
d'ácids benzoics 300 Modelno lineal: Xarxes neuronals BPNN 301 Modelno lineal:Support
Vector Machines 312 4.2.3. Análisiconjunta
de fenols i ácidsbenzoics 326 4.2.4.pKa
d'ácids carboxílics alifátics 349 Modelnolineal: Xarxes neuronals BPNN 350 Modelno lineal:Support
VectorMachines 356 4.2.5.pKb
d'anilines 364 Modelno lineal: Xarxes neuronals BPNN 366 Model nolineal:Support
Vector Machines 3734.3.
Bibliografia
379Capítol 1: Introducció
La
Química
pot
definir-se,
d'una maneraplanera,
com la ciencia ques'ocupa
dels
compostos,
les sevespropietats
i les seves transformacions. El coneixementque esté avui dia de la naturalesa íntima de la materia
és,
encara, moltlimitat,
i si bé és certque
l'estructura,
l'energia
i moltes altrespropietats
d'uncompost
poden
descriure's perl'equació
deSchrodinger,
aquesta
equació
nomésespot
resoldre de maneraexactaperasistemes moltsenzills. En laseva
aplicació
amb caráctergeneral
calrecórrer asolucionsaproxirnades
que,grácies
alspoderosos
métodes de cálcul i als no menyspotents
ordinadors
actuals,
són cada cop mésprecises.
A pesar
d'aquestes
limitacions i de lacomplexitat propia
de laQuímica,
eldesenvolupament
d'aquesta
ciencia ha estat i continua sent extraordinario La raód'aquest
éxit ha estat lacapacitat
d'aprendre
deIs fetsexperimentals.
EIsquímics
hanestat capaces de deduir models a
partir
deIs resultatsexperimentals,
hancomprovat
la seva bondat amb nousexperiments especialment
dissenyats
i, finalment,
han deduúcomportaments
general
s iproposat
neis capaces depredir
l'activitat deIscompostos
químics
ja
siguin
nous o prou ben coneguts.Aquest
métode inductiu dedesenvolupament
ha estatemprat
des del bell inici de laQuímica
com a ciencia. Una deles
principals
ocupacions
deIsquímics
es prepararcompostos
amb unes determinadespropietats
i,
apoder
ser, relacionar-les amb la seva estructura.Quant
millorsigui
el coneixementd'aquesta
relació més fácil sera preparar nous compostos amb novespropietats.
Una
aproximació
ques'ocupa d'aprofundir
enaquests
lligams
id'expressar-ho
de manera mesurable és la
metodologia
anomenada "Relacionsestructura-propietat
quantitatives",
mésconeguda
per l'acrónim enanglés QSPR (Quantitative
StructureProperty Relationships).
Aquests
métodes tenen unallarga
tradició i el méspopular
és elQSAR (Quantitative Structure-Activity
Relationships)
que correspon alcasparticular
en
que
lapropietat
estudiadaésl'activitatbiológica
ipertantelseudesenvolupament
haCapítol 1: Introducció
La
metodologia QSPR,
tal i com esrepresenta
en laFigura
1.1,
proposal'existencia d'una relació directa entre l'estructura d'un
compost
i les sevespropietats
físiques,
químiques,
biológiques,
etc. Partintd'aquesta premissa
espot
dir que si esconeix l'estructurad'un
compost
químic
se'npoden
estimar lespropietats.
Estructura
molecular
Propietat experimental
Representació
numérica Análisi estadísticaDescriptors
moleculars
Figura
1.1.Esquema
delametodologia QSPR.
El
problema
d'aquest plantejament
apareix
a l'hora d'establir la relació directaentre l'estructura i la
propietat
estudiada;
devegades
aquesta
relació pot serforca
evident
pero,
engeneral,
no és així.L'objectiu
principal
de lametodologia QSPR
ésestablir un camí altematiu que
permeti
relacionar l'estructura d'uncompost
amb lesseves
propietats. Aquest
camí altematiu consisteix abuscar,
a través de l'análisiestadística,
unarelaciómatemática,
quepot serlinealono, entrelapropietat
estudiada iun o més
parámetres,
anomenatsdescriptors,
derivats de I'estructura molecular deiscompostos
químics;
és adir,
I'objectiu
últim de lametodologia QSPR
consisteix aestablirunarelació del
tipus:
propietat
=f(descriptors)
Aquests
descriptors
moleculars que s'extreuen directament de l'estructurasón,
simplement,
el resultat d'unprocediment
matemátic que transforma la informacióquímica continguda
en larepresentació
simbólica d'una moléculaenunnombre útil. ElCapítol 1: Introducció
interpretació
de lapropietat
estudiadai/o ser útil en lapredicció
d'aquesta propietat
per a altresmolecules,
que no sempre hauran estat sintetitzadespréviament.
Si la relació matemática ques'estableix,
també anomenadamodel,
ésacceptable
pot servir no tansolsperestimar la
propietat
decompostos
análegs,
sinó també persuggerir,
o fins i totproposar mecanismes
pels quals
lapropietat
estudiada es relaciona amb l'estructuramolecular.
A tall de
presentació,
en laFigura
1.2 es mostra un esquema amb els diferentspassos que conformen
l'aplicació
de lametodologia QSPR
a un estudiconcretoDades
d'entrada
1
Opñmitzacíó
de
geometria
1
Cálcul
de
descriptors
1
Análísi
estadística
Selecciódedescrfptors
ModelsIineals Modelsnolineals Validacions1
Prediccions
Figura
1.2.Passosd'un estudiQSPR.
Cerca
bibliográfica
i selecció dels valorsexperimentals
de lapropietat
aanalitzar.Dibuix i
optimització
de les estructuresdel
conjunt
decompostos
estudiats.Cálcul dels
descriptors
moleculars.Selecció dels
descriptors
i deducció del modelmitjancant
métodes deregressió
lineals o no lineals.Comprovació
de labondat del model a través dels criteris
estadístics.
Verificació de la
capacitat
predictiva
del model ambl'aplicació
alconjunt
externoCapítol 1:Introducció
1.1.
AntecedentsLa
metodologia QSAR/QSPR
no té unpunt
departida
historieclar.I-6
Es creuque les seves arrels es remunten
gairebé
a fa més d'unsegle;
elprimer
registre
conegut
on es relaciona una
propietat
biológica
amb l'estructura delscompostos
químics
estroba en la tesi doctoral de A. F. A.
Cross,
presentada
a la Universitatd'Estrasburg,
l'any
1863. Enaquest
estudi es descriu l'increment de la toxicitatde diferent alcohols en mamífers amb la disminució de la solubilitatd'aquests
compostos
enaigua,"
L'any
1868
apareix
el que es considera elprimer
treball deQSAR,
Crum Brown i Fraser vanestudiar l'efecte
biológic d'alguns
alcaloides,
abans idesprés
de metilar elnitrogen
basic.8
Lespronunciades
diferencies entre elscompostos
básics i elscompostos
quatemaris
carregatsvan ferpensar que l'activitatfisiológica
dels alcaloides <Pha de ser[unció de lasevaconstitució
química
C.fjJ
=f(C)
Gairebé al mateix
temps,
Richardson va demostrar que l'activitat narcótica delsalcohols és
proporcional
al seu pesmolecular.9
Posteriorment,
l'any
1893,
Richet vaobservar que la toxicitat de diversos
compostos
químics:
éters, aldehids,
cetones id'altres,
es relaciona inversament amb la seva solubilitat enaigua:
"Plus ils sontsolubles,
moins ils sonttoxiques";
com méssolubles,
menystóxicssón.IO
Altres teoriesgenerals
d'aquest
mateixprocediment
de narcosi van ser formuladesindependentment
per
Meyerll,12
iOverton13,14
a inicis delsegle
XX. Totes dues teories proposen que la toxicitat delscompostos
orgánics,
en forma neutra,depén
de la sevacapacitat
departició
entrel'aigua
iunaaltra biofaselipófila,
ons'exerceix lasevaactivitatbiológica,
El model
emprat
enaquests
estudis és el sistemaaigua/oli
d'oliva.Més o menys en
aquesta
mateixaepoca
es vandesenvolupar
lesprimeres
hipótesis
sobre la naturalesa de les interaccionsespecífiques.
L' any1894,
Fischer vaestudiar el trencamentheterolític de diversos
glicósids
amb diferents enzims. Apartir
del'especificitat
observadavaconcloure: "Um einBildzugebrauehen,
will iehsagen, dassEnzym
und Glueosid wie Sehloss und Sehlüssel zueinanderpassen müssen, um eineCapítol 1: Introducció
han
d'encaixar,
com unpany iunaclau,
pertald'exerciralgun
efectequímic
l'un sobrel'altre.15-17 Alguns
anysméstard,
Ehrlichva formular:"Corpora
nonaguntnisifixata";
lessubstanciesnoactuen sino estroben
enllacades."
El
desenvolupament
de lametodologia
QSARlQSPR
va romandre aturat durant elssegüents
40-50 anys. Lesúniques
contribucions van ser realitzades per Fúhner iNeubauer,
en estudis d'increments de l'activitat narcótica de serieshomologues
decompostos;
iFerguson,
que vaproporcionar
unainterpretació
termodinámica per a lesrelacions no
específiques
entrelipofília
iactivitat.i"
Mentrestant,
Harnmet19
vaproposar, als anys
30,
una de lesmajors
contribucions a laquímica
orgánica
teórica: utilitzant les constants d'ionització dácids benzoics substituíts com a sistema dereferencia,
vapostular
que les constantd'equilibri
(K)
deIscompostos
aromátics espodien
descriure amb lasegüent
equació:
logKR_x -logKR_H
=pa
onp és una constant de reacció
específica
per acada reacció i (J, l'anomenadaconstantde
Hammet,
és unparámetre
quedepén
només de lacapacitat
donadora del substituentestudiat.
Naturalment,
es vaintentar traslladaraquestes
equacions
a sistemesbiológics;
correlacionant
propietats
biológiques
amb els valors de les constants deHammet20
o bédefinint
"equacions
biológiques
deHarnmet"_21-23
Detota manera, cap a
principis
deIs anysseixanta,
lametodologia QSAR/QSPR
semblava haver arribata unatzucac, i no va serfins al'any
1964,
quan els estudis Free Wilson iHansch-Fujita
van provocar elsegüent
pas endavant. El modeldesenvolupat
per Free i
Wilson24
diu que tots els valors d'activitatbiológica
són la suma, en escalalogarítmica,
de l'activitat d'uncompost
de referencia i de les contribucions de grup deIs diferents substituentsenllacats
aaquest compost.
Aquest
tipus
de model ésmolt senzilld'utilitzar
ja
que no són necessáries altrespropietats
fisicoquímiques
deIscompostos,
només calen els valors O i 1 per indicar lapresencia
d'un determinat substituent en unaCapítol 1:Introducció
El model
desenvolupat
per Hansch iFujita: "P-CJ-7r Analysis.
A methodfor
the Correlationof Biological
Activity
and ChemicalStructure,,25
és considerat com elpunt
de
partida
delQSAR
clássic tal i com s'utilitza actualment. La based'aquest
modelproposa combinar diversos
parámetres
fisicoquímics
en una únicaequació
multilineal,
per
exemple, l'equació
següent
és el model quepermet
calcular la dosi molar d'uncompost
queprodueix
unacertaresposta
biológicar"
log(Yc)
= ast +ba
+000+ ct,
on 7r CJ són els anomenats
parámetres
d'hidrofóbia i electrónic deHansch,
respectivament.
EIs avantatges quepresenta aquest model,
anomenatanálisi de Hansch(o
LFER o relacióextratermodinámica),
són la seva flexibilitat i la sevacapacitat
perdescriure un gran ventall d'activitats
biológiques diferents,
especialment
dades in vitrocomlesd'inhibició
d'enzims_27-29
Tot
just
després
del'aparició
d'aquest model,
només esdisposava
d'uns pocsparámetres:
10gP
i 7r com a mesures dehidrofobia,
valors def
per a lalipofília,
les escales CJ, F i R per apropietats
electróniques,
Es
per apropietats
estériques
i larefractivitat molarcom a mesurade les forces de
dispersió.i"
Totiaixí,
ben aviat es vandesenvolupar
multitud d'altresdescriptora."
Afinals dels anys 70vanéixer el 3D
QSAR,
queintenta relacionar lespropietats
de les molécules
mitjancant
camps tridimensionals calculats dintre d'una reixetaregularo32
Mésendavant, aquesta
metodologia
va rebre el nom DYLOMMS(Dynamic
Lattice-Oriented Molecular
Modeling
System) pero
no va serfins al'any
1988 quan esvan
desenvolupar
un gran nombre de correlacions entre els valors delsdescriptors
calculatsapartir
dels campstridimensionals i diverses activitatsbiológiques.
Enaquest
moment,
aquesta
metodologia
passa a anomenar-se CoMFA(Comparative
Molecular FieldAnalysis)33
i es converteix en un dels metodes més utilitzats actualment perestablir models
quantitatius. Després
d'aquest
punt
es vandesenvolupar
altresmetodologies
3DQSAR:
CoMSIA(Comparative
MolecularSimilarity
IndicesAnalysis),34
CoMMA(Comparative
Molecular MomentAnalysis),35 Compassr'"
MSCapítol 1:Introducció
En els últims anys, la
química
combinatoria i laquímica computacional
s'han unit perproduir
els meto des descreening
amb elsquals
éspossible,
apartir
d'unfarmacófor
seleccionat,
buscar fármacspotencials
entre un gran nombre decompostos
inc1osos en diferents bases de
dades.4o,41
Diversos models han estatdesenvolupats
seguint
aquesta
metodologia
per tal depredir
labiodisponibilitat,
ladistribució,
lacapacitat
de metabolització per diferentscitocroms,
l'eliminació,
lapenetració
a travésde les barreres del cervell i la
placenta,
la toxicitat i lacapacitat
cancerígena.42-52
Fins a
aquest
momentnomés s'haparlat
de lapart
mésQSAR
delametodologia
QSARlQSPR,
ésimportant
recordar que la seva evolució ha estat fortamentlligada
aldisseny
idesenvolupament
de nousfármacs,
pero
no s'ha deperdre
de vistaquetambéés
possible
utilitzar-la perpredir
altrespropietats físiques
oquímiques
deIscompostos,
aspecte
queespresenta
sotaelnom deQSPR;
nocal dir queaquesta
és lavessantques'ha estudiat en
aquest
trebal1. Lametodologia
QSPR
ha estataplicada
ámpliament
enl'estimació de gran
quantitat
depropietats
físiques
iquímiques
decompostos
orgánics.
Recentment s'han
publicat
unes revisions bastantcompletes
sobre el seu ús enpropietats
físiques
ambimportancia
tecnologica.53-55
Enaquests
treballs s'ordenen lesaplicacions
segons si analitzenpropietats
quedepenen
de moléculesindividuals,
de lainteracció entre molécules i
propietats
biológiques,
A més delsconjunts
formats percompostos moleculars,
hi ha referénciesal'análisi depolímers.
El
primer
intent de correlacionar unapropietat
experimental
amb l'estructuradels
compostos
químics
data del 1925 quanLangmuir
va intentar establir una relacióentre les interaccions intermoleculars que es donen en un
líquid
i la sevaenergia
superficial."
Apartir
d'aquell
moment, un gran nombre depropietats
quedepenen
de moléculesaillades,
és adir,
de les interaccions intermoleculars que es donen en elscompostos
químics,
vancomencara serestudiadesmítjancant
lametodologia QSPR.
Elpunt
d'ebullició delscompostos
químics
ha estat unapropietat
molt estudiada des delsinicis
d'aquesta metodologia, ja
el 1947Wiener,
en va ferun.57
Engeneral,
lamajoría
dels treballs
publicats
treballen ambconjunts petits
decompostos
análegs.
No és fins alsanys
90,
paral-lelament
a lageneralització
delsordinadors,
quan es comencen adesenvolupar
models lineals i no lineals quepermeten
fer estimacionsd'aquesta
Capítol 1:Introducció
resultats que s'obtenen dels models construits solen ser de gran
qualitat,
amb errors alvoltant dels 8-12K.
Una altra
propietat
d'aquest
mateixtipus
és elpunt
de fusió. Enaquest
cas, lamajoria
dels models constnúts són detipus linea1.62,63
Un dels millors modelsdesenvolupats
haestatconstruít per a unconjunt
de 366alcans.64
Els resultatsobtinguts
amb
aquest
modellineal d'onzedescriptors
són proubons amb uns errors propers a 17K.
La
temperatura
crítica és una altrapropietat
quedepén
de les interaccionsintermoleculars dels
compostos
químics.
S'han trobat diversos treballspublicats
en elsquals
s'utilitza lametodologia QSPR
percalcular-la.Y'"
El grup de Jurs ha establert models de vuitdescriptors
lineals i no lineals- amb xarxesneuronals-,
per estimaraquesta
propietat
pera unconjunt
de més de 150compostos
orgimics.59,69
Altres
propietats d'aquest
mateixtipus
que han estat analitzades amb lametodologia
QSPR
són lapressió
devapor,70-72
ladensitat,73-75
l'índex derefracció,73,74,76
elpunt
d'inflamació77
ilatemperatura
d'autoignició.78-80
Existeixun grannombre de
propietats
que, tot ipertányer
a moléculesaYllades,
depenen
fortament de les interaccions que s'estableixenentre duesespecies
químiques.
El seu estudi s'ha centratmajoritáriament
encompostos
ambaplicacions
industrials,
compoden
ser els surfactants i elspolímers.
Una de lespropietats
destacades dels surfactants és la concentració micel-larcrítica,
que ha estat tractada amb diferents modelslineals.81,82
Unaaltrapropietat d'aquest
mateixtipus
decompostos
és elpunt
denúvol,
que es defineix com latemperatura
en laqual
una solució monofásica micel-lar es converteix en bifásica.Aquesta propietat
s'ha estimat tant amb models lineals comambno
lineals.83,84
Les
propietats
més estudiadesper a famílies depolímers
són latemperatura
de transicióvítria,85-88
l'índex derefracció.f"
la velocitat depolimerització radicalária'"
i l'acceleració delprocés
de vulcanització delcautxú."
Les
propietats
relacionades amb els processos que es donen en solució són ungrup de gran
importancia
i tambéárnpliament
estudiat. Una de les més destacades és elcoeficient de
partició
octanol/aigua (logP),
moltimportant
en medicina itoxicologia ja
que se sol utilitzar com a mesura d'hidrofobicitat dels
compostos
químics.
Lametodologia QSPR
ha estat moltemprada
per estimar-latant amb models lineals com nolineals.92-100
Capítol 1:Introducció
Una altra
propietat
d'aquest tipus,
quepresenta
gran interés i també grancomplexitat,
és la solubilitat deIscompostos
químics.
La solubilitat aquosa de sólids ilíquids
ha estatámpliament
estudiada per diversosmétodes,
entre els que s'inclou lametodologia
QSPR.IOI-IIO
Algun
deIs treballspublicats
presenta
resultatsespectaculars,
amb coeficients de determinació(R2)
majors
que 0.98 i errors semblants als de les mesuresexperimentals.P"
La solubilitat aquosa de gasos també ha estatforca
estudiada.1ll-1l4
Unaaportació
molt destacable és el modeldesenvolupat
per Abraham amb els seus cincparámetres
solvatocrómics per mesurar la solubilitat de 408 gasosdiferentsen
aigua,
ambelqual
s'obtenenresultats moltacurats.ll5
Altres
propietats
que es relacionen amb els processos ensolució,
i que tambéhan estat avaluades per la
metodologia
QSPR,
són les escales depolaritat
deIs solvents116-119iparámetres
decromatografia
de gasos ilíquids.12o-124
Altres camps en els que s'ha
aplicat
lametodologia
QSPR
són ser lamesura develocitats de
reacció,125
predicció
de constants de RMN de diferentsnuclis,126
ipropietats
de cristallslíquids.127
En la revisió més
recent55
es comenta la necessitat de trobar una manerad'aplicar
aquest
tipus
demetodologia
a sistemes méscomplicats:
sistemesmulticomponents
o mesclesja
que, fins al diad'avui, aquest
tipus
d'estudi s'hamostratprácticament
inaccessible. De la mateixa manera, l'úsd'aquesta metodologia
encompostos
inorgánics
es troba moltrestringida.
EIs estudis més rellevants enaquest
camp han estatrealitzats per
Cundari,
establintmodels lineals i no lineals quepermeten
l'estimació de diverses
propietats:
distanciad'enllac,
freqüéncia
devibració ienergia
dedissociació,
de moléculesinorgániques
diatomiques.128,129
Alguns
treballs han estudiatalgunes
propietats atómiques,
com ara elspotencials
d'ionització en funció decaracterístiques
estructurals senzilles: electronsde valenciaen cada capaicarrega.130
Més propers en el
temps
sónalguns
estudis ambcompostos
organometál-Iics.
Així,
es troben treballs enque
es comencen a estudiarpropietats
interessants com la sevatoxicitat13I-135
i elcomportament
com a catalitzadorshomogenis
en reaccionsd' acoblaments de
Heck,136
cross-coupltng.r''
metátesi d'olefines="
i catálisiasimetrica.139-142
Capítol 1:Introducció
El grup de treball en
que
es s'ha fetaquesta
Tesi haaplicat
aquesta
metodologia
a l'estudi deldesplacament
químic
en ressonánciamagnética
nuclear de31p
de fosfinesterciáries.v"
al cálcul de lapolaritzabilitat
de solventsorgánics.v'"
a l'estimaciód'energies d'enllac
O-H defenols,145
a lapredicció
delparámetre
depolaritat
de solutsprelacionatamb els
temps
de retenció encromatografia
delíquids!"
(HPLC)
i al cálculdeIs
parámetres
solvatocrómics d'Abraham.147
1.2.
Objectius
EIs
objectius
proposats
enlapresent
Tesipoden
resumir-se,
d'unamanerageneral,
enl'extensió de la
metodologia
QSPR
asistemesenque
finsaralasevautilització haviaestat molt limitada o inexistent. En concret, s'ha
aplicat
als dostipus
de sistemessegüents:
-) Compostos inorgánics,
que de fet sóncompostos
de coordinació ocompostos
organometálIics, agafant
eltermeorganometál-lic
enunsentitamplio
-)
Sistemesmulticomponents,
entesos comaquells
casos enque
lapropietat
experimental
estudiada nodepén
exclusivament de la naturalesa delscompostos
queconformen el
conjunt
analitzat,
sinó quedepén,
també,
d'altres elementspresents,
elsquals
encondicionen clarament el valor queté.En l'estudi dels
conjunts
decompostos
de coordinació iorganometál-lics,
s'haseguit
el tractamentusual,
és a dir s'ha deduít el model apartir
delsdescriptors
moleculars
habituals;
encanvi,
I'análisi deIs sistemesmulticomponents
requereix
l'ús dedescriptors
extems. Perdescriptors
extems s'entenenaquells
que caracteritzen els altreselements,
elsquals
s'importen
préviament
alprogramari
emprat
en la deducciódel model final
proposat.
En la deducció del model
poden
aplicar-se
relacions lineals o bé no lineals. Engeneral,
en I'análisi deIs sistemes habituals, és adir quan lapropietat
depén
només delscompostos estudiats,
inicialment es fa unaregressió
linealmúltiple
iposteriorment
s'hiCapítol 1: Introducció
estimacions. Amb els sistemes
multicomponents,
quan lapropietat
estudiadadepén
de la naturalesa dels compostos analitzats id'algun
altrefactor,
lacomplexitat
de les interaccions que espoden
donar entre els diferents elements fixa l'úsd'aproximacions
nolineals.
És
evidentque en el campde laQuímica
Inorgánica,
constituidaen bonapart
percompostos
sólids amb un carácter iónicimportant,
no es fácildisposar
d'unconjunt
decompostos
moleculars d'estructuraanáloga
i delsquals
se'nconegui,
amb prouexactitud,
unapropietat
físicaoquímica
d'interés, Aixídones,
la selecció decompostos
organometál-Iics
o de coordinació com a base de l'estudiaquí
descrit ésquasi
obligada,
ja
que és en aquesttipus
de derivats on s'hipoden
trobarconjunts
decompostos
suficientment grans i amb estructures moleculars prou semblants que
permetin
l'ús del'aproximació
QSPR.
Pel que fa als
conjunts
decompostos
organometál-lics
estudiats,
s'ha deremarcard'entrada que el terme
organometál-Iic
s'haagafat
en un sentitampli,
és adir,
s'hi inclouen derivats d'elements semimetál-Iics combor,
silici,
germani,
arsenic,
tel-Iuri i fins i totalgun
compost
de fósfor o de selenio També s'han inclósalguns
derivats defosfor i estany en
que
els grupsorgánics
s'hi uneixen a través d'átomsd'oxigen
initrogeni queno contenen
enllacos
metall-carboni.Aquesta
interpretació
laxa deltermeorganometál-lic
hapermés disposar
deconjunts
de valors prou grans perpoder
aplicar
hi lametodologia
QSPR.
DeIs compostos
organometál-Iics
se n'ha estudiat laviscositat,
1], la tensiósuperficial,
(J, il'entalpia
de formació en fase gasosa,�f¡.¡o.
De la viscositat i la tensiósuperficial,
les Taules Landolt-Borsntein fomeixen d'un bonconjunt
de dadesexperimentals
ben contrastades que facilita l'análisiQSPR.
Amés,
endisposar
de valors a diferentstemperatures, s'hapogut
ampliar
l'análisi considerant latemperatura
com unavariable,
i fer estimacionsd'aquestes
propietats
en l'interval detemperatures
estudiat. S 'han analitzat
conjunts
bastant grans de derivatsprincipalment
deP, As, Si,
Ge i Sn. D'altrabanda,
el fet quetant laviscositat com la tensiósuperficial
de diferentsconjunts
de compostosorgánics
hagués
estat examinada per métodesQSPR
ha depermetre
fer-ne elcorresponent
estudicomparatiu.
La situació és ben diferent amb lesentalpies
de formació.Actualment,
elnombre de valorsexperimentals
disponibles
noésCapítol 1:Introducció
experimental
semprats
O els autorsresponsables
de la determinació. Enparticular
s'ha estudiat la/1fI-r
en fase gasosa d'unconjunt
decompostos
organometál-lics
de fórmulageneral
MRnXm,
on M és un metall o semimetall deIs grups 12 al 16 de la Taulaperiódica,
R és un gruporgánic tipus
alquil,
aril,
etc. i X ésCI, Br,
1 o H. Tot iaixó,
aquest
primer
intentmitjancant
lametodologia QSPR,
d'estimació d'unapropietat
tanfonamental com és la
/1fI-r, pot
considerar-se proureeixida;
ja
que si bé els errors nosón
petits,
el modelproposat permet
computar-la
apartir
d'unsdescriptors
que espoden
calcular fácilmenta
partir
de la fórmula delscompostos.
Unaaltra
propietat
estudiada ha estat la basicitat catiónica frontelliti,
LCB,
d'unconjunt
bastant nombrós decompostos
orgánics,
L,
que contenen diferents grupsfuncionals com:
alcohols,
éters,
cetones,ácids, amines,
nitrils,
etc., i fins i totalguns
aminoácids,
s'estudia,
dones,
l'energia
associada a la formació deIscompostos
decoordinació
tipus
[LiL
t.
Pel que fa als anomenats sistemes
multicomponents,
l'estudi s'ha centrat en elssegüents
processos:-)
l'afinitat i la basicitatcatióniques
dels 20 aminoácids habitualsenfasegasosa-)
laconstantd'acidesa d'unconjunt
d'ácidsorgánics
endiferents solvents.EIs bons resultats
obtinguts
en l'estudi de la basicitat catiónica de l'extensconjunt
de moléculesorgániques,
vanpermetre
elplantejament
d'un tema mésampli
com és el de les interaccions d'aminoácids front cations monovalents. La cerca
bibliográfica
pertinent
va mostrar que no esdisposa
d'unconjunt
de valorsexperimentals
coherents de lescorresponents
afinitats i basicitatscatióniques,
i que hi ha diferenciessignificatives
en els valorsproposats
per diferents autors, incoherénciesagreujades
pel
fet que enalguns
casos els valors determinatsexperimentalment
són valorsrelatius,
és adir,
cal l'establimentd'algun
valor perpoder
fixar els valorscorresponents a la basicitat de cadascun dels aminoácids estudiats.
Paral-lelament,
a labibliografia
es troben valors calculats per diferentsmétodes,
lamajor
part
d'ellsd'exigéncia
elevadacomDFTianálegs,
d'un bongrapat
d'entalpies
ienergies
lliures de reaccióentre els aminoácids ialguns
cations.Pertal depoder
aplicar
els métodesQSPR
a un
conjunt
coherent dedades,
s'haportat
a terme un estudi teóric detallat i sistemáticCapítol 1: lntroducció
Lt, Na+, K+,
CU+
iAg",
Aquests
cálculs s'han fet amb DFT i basesrigoroses,
i els valors d'afinitat i basicitatcatióniques
així calculats s'han pres com a valors dereferencia i s'hi ha
aplicat
lametodologia
QSPR,
amb bons resultats. En l'análisi d'aquest
sistemamulticomponent,
a més delsdescriptors
moleculars habituals delsaminoácids,
deduitsdesprés
d'una acuradaoptimització
del'estructura,
s'han consideratcom a
descriptors
externsalgunes
propietats
deIs cations metál-lics comsón,
entrealtres, radis,
relacionscárrega/radi, potencial d'ionització, electronegativitat
segons diferentsescales,
etc. EIs resultatsobtinguts
sónbons,
més teninten compte la varietat icomplexitat
de les interaccions existents entre els aminoácids i els cations metál-lics enla formació dels corresponents
[M(AA)t.
L'altre gran grup de sistemes
multicomponents
abordat ha estat l'análisi de lesconstants de
dissociació,
pKa,
d'ácidsorgánics
en diferents solvents alhora. Enaquest
sentit s'han estudiat
conjunts
defenols,
ácidsbenzoics,
ácids carboxílics alifátics ianilines; aquests
tipus
decompostos
sónespecialment
adequats
per aestudisQSPR
atesel gran nombre i varietat de derivats que es coneixen.
Aquests
derivats que contenendistints grups substituents amb
característiques
electróniques
iestériques
particulars
enles
posicions
orto-, meta- ipara- de l'anellbenzénic,
generen uns valors depKa
proudiferents,
moltapropiat
per altipus
d'estudi queaquí
es volportar
aterme. Elconjunt
de solvents enque
s'han determinat elspKa
és prou variat i en conté deprótics,
comaigua,
metanol, etanol,
id'aprótics
comdimetilsulfóxid, acetonitril, dimetilformamida,
acetona. Com a
descriptors
externs, per aportar el paper delsolvent,
s'hanemprat
algunes
propietats
físiques
com, la constantdieléctrica,
lapolaritzabilitat,
ladensitat,
elmoment
dipolar,
l'entalpia
devaporització,
així com elsparámetres
de les escalesempíriques
depolaritat
mésconegudes,
com són les de Kamlet iTaft, Reichardt,
Koppel
iPalm, Gutmann,
Drago,
entre d'altres. EIs resultatsobtinguts
són,
també,
prou bons i els models deduits contenendescriptors
dels soluts i dels solvents quepoden
relacionar-se amb lescomplicades
i subtils interaccions solut/solventprópies
delprocés
de dissociació estudiat.Capítol 1: Introducció
En
general
s'han deduít models queprediuen
amb bons resultats lespropietats
analitzades i que contenen
descriptors
capaces, en lamajoria
dels casos,d'interpretar
les. Durant tot el
procés
de realitzaciód'aquesta
Tesi,
i moltespecialment
en lapart
final de
redacció,
a l'horad'analitzar,
resumir i de posar ennet tota la feinad'aquests
quatre
anys, maino s'ha oblidatunaantiga
regla
d'orQSPR:
Proposeu
unmodelque:sigui
elméssimple
icontingui
quants menysdescriptors
millorpermeti
unainterpretaciá fisicoquimica
de lapropietat
estudiadademostriunbon
poder
predictiu
amb unconjunt
de validaciáexternoCapítol 1: Introducció
1.3.
Bibliografia
1.
Purcell,
W.P.; Bass,
G.E;
C1ayton,
J. M.Strategy of
Drug Design.
A Molecular GuidetoBiological Activity,
Wi1ey:
NewYork,
1973.2.
Tute,
M. S.History
andObjectives
of
Quantitative Drug Design,
Ramsden,
C.A.;
Ed.;
Quantitative Drug Design,
Vo1um4; Hansch,
C.; Sammes,
P.G;
Taylor,
1.B.;
Eds.;
Comprehensive
MedicinalChemistry.
The RationalDesign,
MechanisticStudy
&Therapeutic Application of
ChemicalCompounds, Pergamon
Press:Oxford,
1990,1.
3.
Rekker,
R. F.Quant.
Struct.-Act. Relat.1992,
11,
195.4. vande
Waterbeemd,
H.Quant.
Struct.-Act. Relat.1992, 11,200.
5.
Kubinyi,
H.Quant.
Struct.-Act. Relat.2002,21,348.
6.
Se1assie,
C. D.History of Quantitative Structure-Activity Relationships Burger's
MedicinalChemistry
andDrug Discovery,
6th
Ed.,
Drug Discovery:
Volum1,
Abraham,
D.1.; Ed;
Jo1mWi1ey
&Sons,
2003.7.
Cross,
A. F. A. PhDThesis, University
ofStrasbourg,
1863. Citat de:Borman,
S.New
QSAR Techniques
Eyedfor
EnvironmentalAssessments,
Chem. &Eng.
News,
1990,20.
8. Crum
Brown, A.; Fraser,
T. R. Trans.Roy.
SocoEdinburgh
1868, 25,
151.9.
Richardson,
B. 1.Medical Times andGazette1869,2,
703.10.
Richet,
M. C.Compt.
Rend. Soco Biof.(Paris)
1893,45,
775. 11.Meyer,
H. H.Arch.Exp.
Path. Pharm.1899,42,
109. 12.Lipnick,
R. L.TrendsPharmacol. Sei.1989,
10,265.
13.0verton,
E. Studien uber dienarkose,
zugleich
einBeitrag
zurallgemeinen
Pharmakologie,
Fischer,
G.,
1901. Traduccióanglesa: Lipnick,
R.L.,
Studies onNarcosis,
Charles ErnestOverton,
Chapman
and Hall:London,
1991. 14.Lipnick,
R. L. Trends Pharmacof. Sei.1986, 7,
161.15.
Fischer,
E.Ber. Dtsch. Chem.Ges.1894, 27,
2985.16.
Lichtentha1er,
F. W.Angew.
Chemie1994,
106,2456; Angew.
Chem. lnt. Ed.Engl.
1994, 33,
2364.17.
Folkers,
G.Pharm. Acta Helv.1995,69,
175.Capítol 1: Introducció
19.
Hammett,
L. P.Physical
Organic Chemistry.
ReactionRates,
Equilibria
andMechanism,
2nd
Ed.,
McGraw-Hill: NewYork,
1970.20.
Hansen,
O. R.ActaChem. Scand.1962, 16,
1593.21.
Zahradnik, R.;
Chvapil,
M.Experientia
1960,
16,
511.22.
Zahradnik,
R. Arch.Int.Pharmacodyn.
Ther.1962, 135,
311.23.
Zahradnik,
R.Experientia
1962, 18,534.
24.
Free,
S. M.Jr.;
Wilson,
1. W. J Med. Chem.1964, 7,
395.25.
Hansch,
C.;
Fujita,
T. JAm. Chem. Soco1964,86,
1616. 26.Hansch,
C. Acc. Chem.Res.1969,2,232.
27.
Martin,
Y. C.Quantitative Drug Design.
A Critical Introduction(Medicinal
ResearchSeries,
Volume8),
Marcel Dekker:NewYork,
1978.28.
Kubinyi,
H.QSAR:
HanschAnalysis
and RelatedApproaches,
Volum1,
Mannhold,
R.;
Krogsgaard-Larsen,
P;
Timmerman,
H; Eds.;
Methods andPrinciples
inMedicinal
Chemistry,
VCH:Weinheim,
1993.29. Hansch
C.; Leo,
A.Exploring
QSAR
Fundamentals andApplications
inChemistry
and
Biology,
American ChemicalSociety: Washington,
1995.30.
Hansch, C.; Leo, A.; Hoekman,
D.Exploring
QSAR.
Hydrophobic,
Electronic and StericConstants,
AmericanChemicalSociety: Washington,
1995.31.
Todeschini, R.; Consonni,
V. Handbookof
MolecularDescriptors,
Volum 11 de:Mannhold,
R.;
Kubinyi,
H.; Timmerman, H.; Eds.;
Methods andPrincipies
inMedicinal
Chemistry, Wiley-VCH: Weinheim,
2000.32.
Cramer,
R. D.II1;
Milne,
M. The lattice model: ageneral paradigm
for
shaped
related
structure/activity,
AbstractsofPapers of
theAm. Chem. SocoMeeting,
Abril1979,
comp. 44.33.
Cramer,
R. D.IlI; Patterson,
D.E.; Bunce,
1. D.J Am. Chem. Soco1988, 110,5959.
34.Klebe,
G.; Abraham, U.;
Mietzner,
T. J Med. Chem.1994,37,4130.
35.
Silverman,
B.D.;
Platt,
D. E.JMed. Chem.1996,39,2129.
36.Jain,
A.N.; Koile, K.;
Chapman,
D.J Med. Chem.1994,37,2315.
37.
Bravi, G.; Gancia, E.;
Mascagni,
P.;
Pegna,
M.;
Todeschini,
R.;
Zaliani,
A. JComput-Aided
Mol.Design
1997, 11,
79.38.
Kellogg,
G.E.;
Kier,
L.B.;
Gaillard, P.;
Hall,
L. H. JComput.-Aided
Mol.Design
1996,10,513.
39.