• Non ci sono risultati.

6 CONTATTI SOCIALI

6.4 Costruzione delle matrici di contatto sociale

In questa sezione presentiamo la procedura con cui, a partire dai dati grezzi dell’indagine Polymod, vengono costruite le matrici di contatto sociale per età, che verranno utilizzate come base del modello matematico SIR, e del corrispondente modello statistico per la stima dei coefficienti di trasmissione per la varicella in Italia. Notiamo preliminarmente che analizzando i dati per un singolo paese non è necessario considerare il peso statistico assegnato, nell’indagine complessiva, ad ognuno dei paesi partecipanti.

Un punto preliminare di una certa importanza relativo alla utilizzazione delle matrici di contatto era se fosse preferibile servirsi delle matrici grezze, come emergono direttamente dai dati, oppure se procedere a procedure di lisciamento (“smoothing”) mediante idonei modelli, al fine di conferire alle matrici utilizzate delle forme più regolari. Abbiamo deciso alla fine di servirci delle matrici “grezze”, al fine di non intaccare in minima misura l’informazione empirica. Pertanto non faremo alcuna assunzione sulle distribuzioni congiunte dei contatti al variare dell’età. Ovviamente il passo successivo non può che essere la ricerca di criteri di smoothing in grado di tenere conto appropriatamente delle struttura interne delle matrici di contatto.

La costruzione delle matrici grezze prevede come primo passo la creazione di idonee classi di età discrete, del tipo

[

a ,i.1 ai

)

, e successivamente la assegnazione di ogni singolo contatto registrato (per tutti i partecipanti, per ogni loro contatto) ad una classe di età congiunta, in base alle classi d’età del partecipante e dei suoi contatti1. In tabella 1 vengono presentate le più importanti variabili investigate nell’indagine Polymod.

Tabella 6.1Variabili per il contatto (principali) dell’indagine Polymod

Nome delle Variabili Etichetta

Country local_id global_id

Variabili identificative del paese e del diario

cnt_count Numero di contatti nel diario

cnt_age_mean Età media

cnt_ age_l Estremo inferiore dell’età del contatto

cnt_age_r Estremo superiore dell’età del contatto

cnt_sex Genere del contatto

cnt_home Contatti a casa

cnt_work Contatti a lavoro

cnt_school Contatti a scuola

cnt_transport Contatti durante gli spostamenti cnt_leisure Contatti durante le attività del

tempo libero

cnt_otherplace Contatti durante altre attività cnt_frequency Frequenza del contatto

cnt_touch Contatti fisici

cnt_duration Durata totale del contatto durante l’intero giorno

1

In questo modo si ottiene la distribuzione assoluta congiunta dei contatti totali giornalieri (ovvero contatti di tutte le tipologie), in base alle età dei partecipanti e dei loro contatti. Naturalmente la procedura può essere ripetuta considerando anziché tutti i contatti registrati, solo una o alcune selezionate tipologie di contatti, come possono essere per esempio i contatti di tipo “fisico”. Il vantaggio del dato Polymod è che fornisce informazioni su una vasta serie di tipologie di contatti, dei quali è di grande interesse andare a verificare, mediante un criterio di adattamento statistico, quali siano quelli che meglio spiegano i dati della trasmissione della varicella. Infatti, a tutt’oggi, non è noto per alcuna infezione a trasmissione per contatto diretto, quali siano le forme di contatto a rischio più efficaci tra due individui al fine di determinare la trasmissione dell’infezione, Da questo punto di vista l’utilizzo del dato Polymod può fornire un contributo molto importante ad antichi problemi irrisolti dell’epidemiologia delle infezioni.

Indichiamo pertanto con Mij il numero di contatti totali giornalieri (ma il discorso può essere ripetuto senza modifiche per una qualunque tipologia specifica di contatti) intercorsi nel campione tra partecipanti della classe di età j-esima con soggetti della classe di età i-esima, e con xj il numero di partecipanti della classe j. Dalla matrice dei contatti totali otteniamo quindi immediatamente la matrice dei contatti medi giornalieri per rispondente nel campione, che ha per elementi le quantità:

j ij

ij M x

m = / (6.1)

Dalla matrice [mij] otteniamo le stime appropriate dei numeri medi di contatti imponendo il vincolo di simmetria dei contatti. Tutte le definizioni di “contatto a rischio” utilizzate nell’indagine Polymod sono infatti simmetriche. Si prenda per esempio il marcatore “two-ways conversation”: se per esempio il rispondente “signor A” ha dichiarato di avere avuto una conversazione con il suo contatto “B”, allora necessariamente B ha avuto una conversazione con A. Si noti che questo non è rilevabile dal dato empirico nemmeno nel caso – per altro straordinariamente improbabile - in cui anche “B” fosse un rispondente selezionato nel campione. Per contatti di tipo simmetrico valgono, in una popolazione stratificata per età e costituente una rete “chiusa” di contatti (in cui cioè tutti i contatti sono all’interno della popolazione medesima) le relazioni:

ji i ji j ij ij C w C w K K = = = (6.2)

Dove w è la numerosità assoluta della popolazione nella classe di età j-esima,j C l’esatto numero ij medio di contatti age-specific della popolazione, e Kij =Kji il corrispondente numero totale di contatti tra soggetti di età i e j nella popolazione. Naturalmente le stime campionarie m non ij possono soddisfare il vincolo di simmetria, in quanto il campione osservato di rispondenti per definizione non costituisce una rete chiusa di contatti. Tuttavia possiamo correggere le stime mediante il principio di simmetria al fine di renderle consistenti con l’ampiezza demografica osservata della popolazione di riferimento. A tale scopo calcoliamo i contatti totali attesi di popolazione mediante le loro stime campionarie. Troviamo così le stime Kˆij =mijwj e Kˆji =mjiwi

che in generale non soddisferanno il vincolo di simmetria, ovvero: KˆijKˆji. Sembra a questo punto ragionevole forzare la simmetrizzazione mediante ricorso ad opportune medie tra tali quantità. Per esempio, utilizzando la media aritmetica semplice dei K otteniamo la stima (simmetrica): s ji ji ij s ij K K K K , , 2 ˆ ˆ = + = (6.3)

A questo punto possiamo calcolare le stime corrette per la simmetria dei numeri medi di contatti come: j ji ij j s ij s ij w K K w K m 2 ˆ ˆ , , + = = (6.4)

Si noti che mentre la matrice dei contatti totali attesi corretta per simmetria Ks =[Kij,s] è simmetrica, ovviamente la matrice dei contatti medi corretti mij,s non è in generale mai simmetrica perché riflette gli sbilanci demografici tra i due gruppi di età i e j: se il gruppo di età j è più numeroso del gruppo i allora necessariamente avrà un numero medio di contatti inferiore.

Documenti correlati