Ai fini dell’analisi statistica le variabili inserite nel database sono state espres- se in forma differente a seconda della loro tipologia: quelle discrete, “binarie”,
sono state rappresentate in termini di frequenza assoluta e di prevalenza percentuale; quelle continue, invece, sono innanzitutto state ulteriormente suddivise in due gruppi a seconda della loro distribuzione (gaussiana o no), dopodich´e sono state rappresentate in forma distinta a seconda che rientras- sero nella prima o nella seconda categoria. Una volta sfruttato il test di Kolmogorov-Smirnov per verificare l’ipotesi di normalit`a della distribuzione di ciascuna delle variabili continue, quelle caratterizzate da un andamento di tipo gaussiano sono state espresse come media ± deviazione standard, mentre le rimanenti come mediana ed intervallo interquartile.
Come ampiamente e dettagliatamente discusso in precedenza, gli obiettivi con cui `e stato concepito questo lavoro sono sostanzialmente due: innanzi- tutto comprendere quali potessero essere le variabili associate in maniera indipendente ad un incremento del tasso di mortalit`a per endocardite infet- tiva da una parte e dell’incidenza di eventi embolici maggiori dall’altra; in seconda istanza, approfondire ed indagare meglio l’esistenza di una possibile correlazione fra il riscontro di elevati livelli sierici di procalcitonina e l’au- mento dell’incidenza di episodi embolici maggiori.
Per rispondere al primo quesito, riguardante i fattori predittivi per mortalit`a nel caso di soggetti affetti da endocardite infettiva, si sono prima di tutto suddivisi i pazienti in due gruppi in base all’esito della malattia (guarigione o decesso); in un secondo momento si sono poi utilizzati gli opportuni test statistici per individuare tutti i parametri per cui sussisteva una differenza significativa fra i soggetti sopravvissuti e quelli, invece, andati incontro a morte. Per il confronto di variabili continue a distribuzione non gaussiana si `e impiegato il test non parametrico di Mann- Whitney, mentre per quelle continue ad andamento gaussiano si `e potuto sfruttare il t- test di Student a due code per dati indipendenti; infine, per le variabili binarie si `e fatto ricorso al test del chi-quadrato (χ2) con correzione di continuit`a (di Yate). A questo punto, un ulteriore processo di analisi ha consentito di definire esat- tamente quali fossero i fattori indipendentemente associati ad un incremento del tasso di mortalit`a per endocardite infettiva, eliminando tutti i possibili parametri confondenti.
A tale scopo, si `e preferita alla regressione logistica multivariata la costru- zione di una cosiddetta “random forest” [33], meno classica e diffusa rispetto alla prima, ma pi`u adeguata al caso in ragione del numero piuttosto elevato di co- variate da considerare (ben 38) e delle loro collinearit`a.
La random forest `e un algoritmo di machine learning realizzato da molteplici (centinaia, migliaia) alberi di decisione costruiti seguendo una procedura det- ta di “bootstrap”, ovvero scegliendo a caso dall’intero campione disponibile dei sottogruppi di “oggetti” (nel nostro caso, quindi, di pazienti).
La random forest fornisce automaticamente una misura di validazione interna (chiamata “out of bag” error rate) circa la possibilit`a di una sua estensione e generalizzazione a dati differenti rispetto a quelli in base ai quali `e stata costruita.
Tale metodo di machine learning offre alcuni vantaggi peculiari: in primo luogo, `e capace di trattare in maniera naturale variabili di tipologia diversa (continue e discrete), ed `e parimenti in grado di trattare, senza bisogno di al- cuna trasformazione, tutte le variabili continue indipendentemente dalla loro distribuzione; essa pu`o infine selezionare in maniera automatica le covariate pi`u importanti ai fini della predizione dell’evento in questione (nel caso dello studio qui descritto, la mortalit`a dei pazienti affetti da endocardite infettiva). Oltre alla misura di errore citata prima (l’ “out of bag” error rate), la ran- dom forest fornisce infatti, in uscita, anche un ranking di importanza delle covariate, misurando la variazione di purezza delle foglie degli alberi causata dalla loro eliminazione: `e questo il cosiddetto “coefficiente di Gini”.
Visto il ristretto numero di eventi considerati, la sensibilit`a dell’algoritmo `
e stata conservata mediante l’esecuzione di un sotto- campionamento della procedura di bootstrap.
Nel caso specifico, la random forest `e stata costruita con 500 alberi decisionali e le 38 co- variate considerate, scelte fra tutte quelle raccolte ed aventi meno di 50 valori mancanti, sono elencate qui di seguito: infezione a carico delle sezioni sinistre, endocardite associata a ICD, presenza di valvole protesiche, comparsa di eventi embolici, pregressa endocardite, cardiopatia ischemica cronica, fibrillazione atriale, presenza di cardiopatia dilatativa, ipertrofica o congenita, precedente intervento cardio- chirurgico, pregresso IMA o TIA, ipertensione, aterosclerosi, insufficienza renale cronica, fumo, uso di dro- ghe per via endovenosa, diabete mellito, uso di statine, comparsa di febbre, TIA, ictus, dispnea, insufficienza renale oppure scompenso cardiaco, neces- sit`a di un intervento cardiochirurgico, sesso, isolamento di germi dotati di farmaco-resistenza o di S. aureus, terapia con daptomicina, et`a, CCI, livelli di emoglobina, piastrine, creatinina, PCR e PCT, ed infine positivit`a delle emocolture.
Per quanto riguarda invece il secondo obiettivo di questo lavoro, ovvero l’individuazione dei fattori di rischio per embolizzazione settica in corso di endocardite infettiva, si `e applicato, almeno nella prima fase, un procedimen- to analogo a quello ora descritto: i pazienti sono quindi stati smistati in due gruppi, assegnando ad uno quelli per cui era stato documentato (clinicamente e/o mediante esami di imaging) almeno un episodio di embolismo periferico, ed al secondo tutti gli altri.
riabili fra i due gruppi, si `e riusciti ad indentificare quelle per cui sussisteva una differenza significativa fra i soggetti vittime di un’embolizzazione perife- rica ed i pi`u fortunati non andati incontro a questa complicanza. I parametri cos`ı indagati ed i test statistici sfruttati per il confronto fra gruppi relativo a ciascuno di essi sono stati scelti sulla base del medesimo criterio applicato nel corso dell’analisi riguardante la correlazione con il tasso di mortalit`a (ri- portato quindi nei paragrafi precedenti).
Per concludere l’analisi, si `e scelto di indagare la relazione fra le concentra- zioni ematiche di procalcitonina e l’insorgenza di embolizzazioni periferiche utilizzando come strumento la costruzione della relativa curva ROC (Recei- ver Operating Characteristic, o anche Relative Operating Characteristic): tale strategia ha consentito di individuare il valore di PCT per cui risulta massima la capacit`a di discriminare i pazienti andati incontro ad almeno un episodio di embolia settica da quelli in cui una simile evenienza non si `e in- vece verificata (`e il cosiddetto test di Youden).
Sulla base del cut- off cos`ı trovato, `e stato possibile “dicotomizzare”, o meglio “binarizzare”, i valori di PCT registrati, ovvero suddividere il campione in due gruppi distinti, inserendo nel primo i soggetti in cui non si era riscontrata alcuna concentrazione di PCT superiore al livello- soglia, e nel secondo tutti gli altri.
Successivamente, `e stato pertanto possibile verificare con un test del chi- quadrato se vi fosse una significativa associazione fra il rilievo di valori di procalcitonina nel sangue superiori al cut- off sancito e l’incidenza di eventi embolici maggiori.
Tutte le analisi sono state effettuate utilizzando il software statistico R; in ciascuna di esse, un valore di p< 0, 05 `e stato considerato statisticamente significativo.
Capitolo 4
Risultati
4.1
Dati epidemiologici ed eziologici
Nel complesso i pazienti arruolati nello studio sono stati 295, di cui 194 uomini e 101 donne, per un rapporto maschi/ femmine pari a 1.9:1. L’et`a media dei soggetti inclusi nello studio `e uguale a 64.55 ± 16.35 anni, e la distribuzione di casi di malattia nelle diverse decadi risulta molto simile e sovrapponibile a quella descritta dai lavori gi`a presenti in letteratura: nello specifico, 6 pazienti hanno un’et`a inferiore o uguale a 20 anni, 10 stanno fra i 21 ed i 30, 10 fra i 31 ed i 40, 28 fra i 41 ed i 50, 33 fra i 51 ed i 60, 71 fra i 61 ed i 70, 100 fra i 71 e gli 80, ed infine 37 sono ultra- ottantenni (Figura 3.1):
Figura 4.1: Epidemiologia dell’endocardite infettiva e correlazione della sua incidenza con l’aumentare dell’et`a
Spostando l’attenzione sulla localizzazione dei vari processi infettivi an- noverati in questo lavoro, si deve innanzitutto premettere che i diversi agenti eziologici sono stati talvolta capaci di intaccare, all’interno dello stesso sog- getto, pi`u di una struttura intracardiaca; il numero complessivo di substrati (anatomici e non) danneggiati dall’infezione ammonta a 336: di questi, 310 sono rappresentati da lembi valvolari, mentre i rimanenti 26 da dispositivi impiantati all’interno del cuore.
`
E dunque possibile notare come siano stati analizzati casi non soltanto di endocardite insorta su valvole, ma anche di endoplastite: i primi costitui- scono la stragrande maggioranza del totale (92%) e comprendono, in ordine decrescente di frequenza, processi infettivi a carico di valvole native (52%), protesi valvolari biologiche (26,5%) ed infine protesi valvolari meccaniche (13,4%); i secondi, invece, molto meno numerosi, includono tutti gli episo- di infettivi associati alla presenza di dispositivi intra- cardiaci impiantabili, quali pacemaker (2%) e defibrillatori (6%) (Figura 4.2).
Figura 4.2: Possibili localizzazioni dell’endocardite infettiva e loro frequenza (espressa in percentuale)
Concentrandosi poi esclusivamente sulla quota di episodi di endocardite infettiva insorti su una valvola (sia essa nativa o protesizzata) ed analizzando la situazione da un punto di vista differente, `e inoltre possibile concludere come i microrganismi vadano preferenzialmente ad invadere e a proliferare all’interno delle camere cardiache di sinistra piuttosto che quelle di destra: le prime sono infatti colpite dal processo infettivo con una frequenza 12,4 volte
superiore rispetto alle seconde. Ancor pi`u in particolare, la valvola aortica `e risultata essere interessata nel 51% dei casi, la mitrale nel 42%, la tricuspide nel 7% ed infine la polmonare solamente nell’1%, come illustrato nella figura seguente (Figura 4.3):
Figura 4.3: Percentuale relativa con cui le diverse valvole cardiache sono interessate dal processo infettivo endocarditico
Conclusa l’analisi pi`u squisitamente epidemiologica della casistica a di- sposizione, si pu`o quindi procedere andando a focalizzare l’attenzione sulla sua eziologia: a tale proposito, si nota subito che nel 20% dei pazienti (59 su 295) le emocolture sono risultate negative.
Le specie microbiche isolate nella restante quota di campioni ematici (236) si sono rivelate come appartenenti, nella maggioranza dei casi, ai generi Staphy- lococcus e Streptococcus (70% del totale): in particolare, lo Staphylococcus aureus da solo si `e reso responsabile del 20% degli episodi di endocardite ad eziologia nota, e nei 2/5 di questi casi si trattava di un ceppo caratterizzato dalla capacit`a di resistere all’azione della meticillina (era, in altri termini, un cosiddetto ceppo MR, ovvero meticillino- resistente).
Al secondo posto per importanza e frequenza di riscontro si collocano gli En- terococchi, rilevati nel 17% delle 236 emocolture positivizzatesi; altri germi isolati sono poi stati Escherichia coli (1%), Pseudomonas aeruginosa (an- ch’esso 1%) e batteri Gram positivi quali Gemella sanguinis, Abiotrophia defectiva, Listeria monocytogenes ed Aerococcus urinae (4% nel loro insie- me).
`
E stato anche possibile isolare pi`u specie microbiche a partire da campioni di sangue prelevati dal medesimo soggetto (6% dei casi): `e a questi episodi che
si riferisce l’attributo di “polimicrobici” utilizzato sia nel corso della compi- lazione del database sia nel grafico sottostante.
Si `e infine registrato un caso di endocardite infettiva sostenuta da Candida albicans.
Le diverse percentuali di prevalenza delle specie batteriche e fungine fino- ra nominate si possono riunire e riepilogare brevemente nel seguente grafico (Figura 4.4):
Figura 4.4: Eziologia dell’endocardite infettiva: si vede come a farla da pa- drone nel determinismo di tale patologia siano i ceppi appartenenti ai generi Stafilococco e Streptococco
Per concludere la disamina delle variabili pi`u “descrittive”, non dicoto- mizzabili n´e esprimibili sotto forma di un numero nudo e schietto, e dunque non impiegate direttamente ai fini dell’analisi statistica vera e propria, si pu`o avanzare qualche considerazione riguardante una delle pi`u gravi complicanze dell’endocardite, ovvero l’insorgenza di embolizzazioni periferiche maggiori. Nella popolazione oggetto di studio questo evento ha dimostrato di avere un’incidenza piuttosto alta, interessando il 40% dei soggetti esaminati. Dei 118 pazienti vittime di una simile evenienza alcuni sono poi andati incontro ad una serie di embolizzazioni periferiche multiple, ragion per cui il numero totale di questi eventi `e salito a 175.
Se si volesse stilare una classifica delle sedi preferenziali di embolizzazione periferica a partire dal presente lavoro, si dovrebbe collocare al primo posto il sistema nervoso centrale, interessato da 52 eventi embolici distinti; ad esso
dovrebbero quindi fare seguito, nell’ordine, la milza, il polmone, la colonna vertebrale, il rene, la cute con i tessuti molli ed infine il fegato.
`
E ovvio che il polmone `e sede di embolizzazione delle endocarditi destre, a meno che non sia presente uno shunt sinistro- destro.
Gli organi appena menzionati ed il numero di episodi embolici riscontrati a carico di ciascuno di essi sono riportati nel seguente grafico, rispettivamente sull’asse delle ordinate e su quello delle ascisse (Figura 4.5):
Figura 4.5: Sedi di embolizzazione periferica elencate in ordine decrescente di frequenza