• Non ci sono risultati.

Stima della variabilità degli infetti 5

N/A
N/A
Protected

Academic year: 2021

Condividi "Stima della variabilità degli infetti 5"

Copied!
10
0
0

Testo completo

(1)

1

NOTA METODOLOGICA Premessa

Il metodo si fonda sul calcolo di un indice riproduttivo semplificato denominato R*(t) (letto “R star con t”) che può essere applicato a diversi livelli territoriali (nazionale, regionale e provinciale).

L’indice R*(t) è interpretabile in maniera analoga all’R(t) pubblicato dall’ISS, tuttavia viene calcolato con differenti algoritmi matematici e su una diversa base dati, costituita da quanto pubblicato gior- nalmente dalla Protezione Civile.

Sommario

Introduzione

- Finalità delle analisi - Contesto applicativo

1. Il modello SIR

- descrizione del modello SIR

- perché utilizzarlo per l’analisi dati COVID

2. R*(t)

- Che cosa è l’𝑅(𝑡)

- Come deriva dal modello SIR -

3. Stima di I(t)

- Come si deriva il dato sugli I(t) (infetti) a partire dal totale dei Contagiati C(t)

4. Proiezione della variazione percentuale degli Infetti a 7 giorni - Procedura di stima degli Infetti a 7 giorni a partire dall’ 𝑅(𝑡) - Stima della variabilità degli infetti

5. Rappresentazioni dei grafici regionali e provinciali - Grafici: illustrazione

6. Conclusioni 7. Bibliografia

(2)

2 Introduzione

Lo scopo del modello e delle analisi proposte è quello di fornire uno strumento utile e snello per aiutare i governi locali a interpretare i dati sulla pandemia da Sars-CoV-2, con particolare riguardo alla stima dell’impatto dell’epidemia sui servizi sanitari, in termini di proiezione – a una settimana – del numero degli infetti attivi.

Il metodo di calcolo permette di stimare l’andamento degli infetti attivi a livello regionale e provinciale, utilizzando i dati diffusi quotidianamente dalla Protezione Civile. Esso può rappresentare un utile strumento per valutare l’introduzione di ulteriori misure di contenimento e di contrasto alla pandemia, anche a un livello sub-regionale.

Il metodo si fonda sul calcolo di 𝑅(𝑡) – quale approssimazione dell’𝑅(𝑡) calcolato dall’Istituto Superiore di Sanità. Partendo dalla curva degli Infetti attivi e tramite le equazioni del modello compartimentale SIR (Susceptible, Infected, Resolved) si può ricavare l’andamento nel tempo di 𝑅(𝑡), come discusso di seguito.

1. Il modello SIR

I modelli compartimentali1 sono modelli matematici sviluppati per descrivere la diffusione delle malattie infettive e prevedono la suddivisione della popolazione in compartimenti con determinate caratteristiche.

Il numero di compartimenti utilizzati dal modello dipende dalla tipologia di infezione, ma anche dai dati a disposizione: per garantirne l’efficacia, è necessario “tarare” il modello sui dati disponibili.

Generalmente i modelli compartimentali sono di tipo deterministico, ovvero non “modellizzano” la possibile incertezza presente nelle misure o nei fenomeni, e sono rappresentati tramite equazioni differenziali.

I modelli compartimentali servono quindi a descrivere la dinamica secondo la quale i singoli soggetti transitano da una classe all’altra.

Uno dei più semplici modelli compartimentali, tipicamente utilizzato per descrivere le epidemie che evolvono rapidamente, è il modello SIR ed è basato su 3 variabili:

• 𝑺(𝒕) è il numero di suscettibili al tempo t (parte di popolazione predisposta a contrarre l’infezione)

• 𝑰(𝒕) è il numero di infetti al tempo t (parte di popolazione che ha contratto l’infezione e può trasmetterla)

• 𝑹(𝒕) è il numero di rimossi al tempo t (parte di popolazione che, dopo aver contratto l’infezione, è guarita o è deceduta)

La pandemia da Sars-CoV-2 può essere descritta da un modello compartimentale di tipo SIR, basato sul seguente sistema di equazioni differenziali non lineari.

1 I primi modelli compartimentali risalgono agli anni ’20 del secolo scorso: W.O. Kermack, A.G. McKendrick, Contributions to the mathematical theory of epidemics, part 1, Proc. Roy. Soc. London Ser. A, 115 (1927), pp.

700-721

(3)

3 dove:

I: numero di infetti attivi S: popolazione ancora sana N: popolazione totale

𝛽: probabilità di trasmettere l’infezione R: numero di contatti nell’unità di tempo 𝛾: tasso di uscita (giorni-1)

(4)

4 2. R*(t) Riportando i parametri suddetti al tempo t si ottiene:

𝑑𝐼(𝑡)

𝑑𝑡 =𝛽𝑟𝐼(𝑡)𝑆(𝑡)

𝑁 − 𝛾𝐼(𝑡)

Con un semplice passaggio è possibile definire2:

(1

𝛾) ( 1

𝐼(𝑡) 𝑑𝐼(𝑡)

𝑑𝑡 + 𝛾) = 𝛽𝑟

𝛾 𝑆(𝑡)

𝑁 = 𝑅𝑜𝑆(𝑡)

𝑁 =R*(t)

dove 𝑅𝑜 è il “numero riproduttivo di base” e 𝑅(𝑡) è la quantità di interesse, chiamato anche “numero riproduttivo effettivo”, in questo caso nel contesto del modello SIR.

Il termine ( 1

𝐼(𝑡)) 𝑑𝐼(𝑡)/𝑑𝑡 è la derivata di 𝐿𝑛(𝐼(𝑡)) ed è ricavabile dai dati come coefficiente angolare della tangente a 𝐿𝑛 (𝐼(𝑡)) su un intervallo di k-giorni (tipicamente k=7), assegnato al giorno centrale;

in questo calcolo 𝛾 può essere considerata costante e può essere ricavata dai dati epidemici (𝛾 =19 giorni-1) oppure utilizzando come riferimento quanto prevede la normativa sulla quarantena (𝛾 =101 giorni-1).

Usando il modello SIR è quindi possibile ricavare Ro, il numero riproduttivo di base, e il suo andamento 𝑅(𝑡) direttamente dai dati disponibili sugli infetti attivi (𝐼(𝑡)).

Quando 𝑑𝐼(𝑡)/𝑑𝑡 = 0 la curva raggiunge un massimo e 𝑅(𝑡) sarà pari a 1, valore che corrisponde alla transizione tra epidemia in crescita ed epidemia in calo. Questa proprietà è caratteristica di questo tipo di variabile.

Questo metodo semplificato per il calcolo di 𝑅(𝑡) basato sul modello SIR risulta essere semplice e rapido, fornendo risultati sovrapponibili, tipicamente a meglio del 10%, ad 𝑅(𝑡) calcolato da ISS su base settimanale con dati differenti e più dettagliati (usando il software “EPIESTIM” prodotto da Cori- Ferguson3). Il vantaggio di questo algoritmo per il calcolo di 𝑅(𝑡) è che permette di valutare nel tempo l’andamento dell’epidemia sia a livello nazionale che a livello regionale e/o provinciale, partendo direttamente dalla curva 𝐼(𝑡) degli infetti attivi fornita dalla Protezione Civile.

2Il metodo per il calcolo di R*(t) è descritto in: https://www.scienzainrete.it/articolo/modo-semplice-calcolare- rt/roberto-battiston/2020-11-20.

3 Cori, A., Ferguson, N. M., Fraser, C., & Cauchemez, S. (2013). A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics, Am J Epidemiol. 2013 Nov 1; 178(9): 1505–1512.

Published online 2013 Sep 15. doi: 10.1093/aje/kwt133

(5)

5

3. Stima di 𝑰(𝒕)

L’andamento di 𝐼(𝑡) e delle altre variabili del modello SIR può essere derivato in modo iterativo dall’

andamento della quantità 𝐶(𝑡) = Totale dei casi4 .

Si può infatti determinare una formula iterativa nel modo seguente:

𝐶(𝑡) = 𝐼(𝑡) + 𝑅(𝑡)

𝑅’(𝑡) = 𝛾 𝐼(𝑡)

𝐶(𝑡) = 𝐼(𝑡) + 𝑅(𝑡) = 𝐼(𝑡) + 𝛾∫ 𝐼(𝑡) 𝑑𝑡

Trasformando in una equazione ad elementi discreti

C(t1) = I(t1) + 𝛾 I(t1) = (1 + 𝛾)I(t1) → I(t1) = C(t1)/(1 + 𝛾)

C(t2) = I(t2)(1 + 𝛾) + 𝛾 I(t1) → I(t2) = C(t2) 1 + 𝛾− 𝛾

1 + 𝛾 I(t1)

Di conseguenza:

I(t𝑛) = C(t𝑛) 1 + 𝛾− 𝛾

1 + 𝛾 ∑ 𝐼(t𝑖)

𝑛−1

1

Questo algoritmo risulta particolarmente utile quando, come nel caso delle province, l’unico dato a disposizione nel tempo è il totale dei casi C(t), in quanto permette di estrarre I(t) da C(t) e analizzare le province allo stesso modo delle regioni.

4. Proiezione della variazione percentuale degli Infetti a 7 giorni

La banda di confidenza (rappresentata dal cono giallo visibile nel paragrafo successivo) viene calcolata a partire da 𝑅(𝑡) calcolato 4 giorni prima del giorno in esame.

𝑅(𝑡) per il giorno i-esimo, è calcolato tramite la regressione lineare della retta che passa per n valori, con n dispari, di Ln I(𝑡𝑖); scegliendo 𝑛 = 7, n = i − 3, i + 3.

Il range di incertezza intorno a 𝑅(𝑡i) è ottenuto a partire dall’errore standard del coefficiente di regressione e ha come estremi i valori di 𝑅(ti)𝑚𝑖𝑛 e 𝑅(ti)𝑚𝑎𝑥

Questi due valori vengono usati per la proiezione di I(te) a k-giorni dal giorno in esame (te) con la seguente formula:

𝐼(𝑡𝑘) = I(𝑡𝑒 ) exp[γ(𝑅(𝑡e-4) -1) (𝑡k-𝑡e)]

Il ramo più basso del cono si ottiene usando 𝑅(te)𝑚𝑖𝑛 e il ramo più alto si ottiene usando 𝑅(te)𝑚𝑎𝑥:

dalla formula si ricava facilmente che al crescere di tk le due curve si allontanano.

4 Il metodo per la derivazione di I(t) è descritto in: https://www.scienzainrete.it/articolo/metodo-lo-studio- dellandamento-provinciale-dellepidemia/roberto-battiston/2021-02-03

(6)

6

Considerando che con il metodo della derivata logaritmica è possibile descrivere in modo coerente l’andamento degli infetti attivi 𝐼(𝑡), in funzione di 𝑅(𝑡), è stata analizzata l’accuratezza della proiezione, confrontando diversi scenari in modo da valutare l’impatto sanitario dell’epidemia COVID- 19 nel breve termine.

Si è quindi effettuato un test empirico per valutare l’affidabilità delle stime.

Si sono valutati due scenari:

➢ scenario 1: utilizzando l’ultimo valore di 𝑅(𝑡) calcolato il 4° giorno prima del giorno in esame ed estrapolandolo come valore costante per 5, 10 o 15 giorni successivi, per procedere con l’estrapolazione di 𝐼(𝑡).

➢ scenario 2: utilizzando la stima dell’andamento lineare delle ultime 9 misure di 𝑅(𝑡) (dal 4°

al 13° giorno prima del giorno in esame), ed estrapolandola 5, 10 e 15 giorni dopo il giorno in esame.

Per valutare la bontà dell’estrapolazione nei due scenari, sono state effettuate più di 17.000 verifiche, utilizzando i dati per 𝐼(𝑡) della pandemia in Italia, nel modo seguente:

➢ si sono presi in considerazione i 150 giorni precedenti al giorno in esame

➢ si sono selezionati i primi 130 di questi giorni

➢ per ognuno di questi giorni si è proceduto con le estrapolazioni (come se si trattasse del giorno in esame)

➢ si è confrontata la predizione a 5, 10, 15 giorni, sia per lo scenario 1 e sia per lo scenario 2 rispetto al dato effettivo degli infetti attivi (effettivamente osservato)

➢ si è ripetuto il processo di calcolo per tutte le 21 Regioni e per il caso dell’Italia.

Complessivamente sono stati studiati 130x3x2x22 = 17.160 casi.

Alla luce delle simulazioni effettuate si è potuto osservare quanto segue:

✓ come atteso, l’estrapolazione a 5 giorni presenta una variabilità ∆𝐼

𝐼 più piccola: valori di r.m.s.

(root mean square) compresi tra 5% e 10% rispetto a quella calcolata a 10 giorni, che a sua volta è risultata minore di quella a 15 gg

✓ l’estrapolazione basata sull’ultimo valore di 𝑅(𝑡) (scenario A) mostra una r.m.s. più piccola dell’analogo calcolo fatto con l’estrapolazione tramite regressione lineare su 9 giorni (scenario B)

✓ il valore medio delle distribuzioni delle differenze è sistematicamente positivo, anche se di poco.

Nella figura seguente sono riportati i risultati per l’Italia: risultati analoghi sono stati ottenuti per le varie regioni.

(7)

7

In conclusione, le stime della proiezione della variazione percentuale degli Infetti, ∆𝐼𝐼, sono basate sull’ultimo valore stimato di 𝑅(𝑡) per un periodo di 7 giorni dopo il giorno in esame (vale a dire 11 giorni dopo l’ultima determinazione di 𝑅(𝑡)).

(8)

8

5. Rappresentazione dei grafici regionali e provinciali

Il grafico riporta:

- Linea blu: andamento dell’indice R*(t) calcolato fino al 4° giorno precedente l’ultimo dato disponibile.

- Linea a puntini rossi: stima degli infetti attivi I(t), calcolata a partire dal numero totale dei contagiati.

- Linea a puntini grigi: stima del numero atteso di infetti attivi nella Provincia, qualora l’andamento fosse il medesimo dei dati regionali, riproporzionato al numero dei residenti nella provincia. L’eventuale scostamento tra i puntini grigi e quelli rossi è interpretabile in termini di dinamica provinciale diversa da quella regionale.

- Linea a puntini neri: proiezione dell’andamento degli infetti attivi a 7 giorni (dall’ultimo dato disponibile a partire dalla stima semplificata dell’R*(t)

- Cono giallo: limiti inferiori e superiori dell’intervallo di variabilità dell’estrapolazione a 7 giorni del numero di infetti attivi.

- Frecce (gialle, arancioni, rosse): in corrispondenza della data in cui la singola Regione è entrata in zona Gialla - Arancione - Rossa5.

5si segnala che la freccia rossa in corrispondenza del periodo natalizio, si riferisce alle misure previste dal “DPCM Natale del 18 dicembre 2020”

(9)

9

6. Conclusioni

• L’indice 𝑅(𝑡) esprime l’andamento dell’epidemia, ossia la velocità con cui il numero degli infetti attivi I(t) cresce o diminuisce.

• Il parametro gamma “𝛾” (tasso di uscita) utilizzato per il calcolo dell’𝑅(𝑡) è posto uguale a 1/10 giorni-1, così come previsto dalla normativa per la quarantena.

• La stima dell’andamento del numero di infetti a 7 giorni permette di verificare se nella settimana successiva all’ultimo dato disponibile – presupponendo un 𝑅(𝑡) costante – vi sarà un aumento o una diminuzione nel numero degli infetti nell’area territoriale presa come riferimento, con un certo intervallo d’incertezza (cono giallo). In corrispondenza di intervalli meno ampi le stime risultano più precise.

• Nel caso di basse numerosità, le stime risultano meno accurate

• È possibile che nei dati pubblicati dalla Protezione Civile si evidenzi – in un determinato periodo di tempo – un numero di infetti attivi e/o di guariti disomogeneo o con variazioni rispetto alla settimana precedente, non spiegabili dal punto di vista epidemiologico. Tra le possibili cause si annoverano cambi di numerosità degli infetti e/o dei guariti derivanti dall’eventuale applicazione di nuove definizioni di caso o dei tempi di quarantena, e problematiche connesse all’invio o alla rettifica dei dati da parte delle Regioni. In questi casi, nei periodi in cui il dato non è coerente, si è deciso di non calcolare la curva dell’𝑅(𝑡).

• Il confronto tra gli infetti stimati e quelli attesi nella Provincia in base al dato medio regionale (linea tratteggiata rossa e linea tratteggiata grigia) permette di verificare se vi siano andamenti diversi nella singola Provincia rispetto al resto della Regione.

(10)

10 Bibliografia

O.Diekmann, H. Heesterbeek and T. Britton, Mathematical Tools for Understanding Infective Disease Dynamics, Princeton Series in Theoretical and Computational Biology, Princeton University Press, Princeton (2013)

H. W. Hethcote, The mathematics of infectious diseases, SIAM Review 42, 599-653 (2000)

M.J. Keeling and T. Rohani, Modeling infectious diseases in Humans and Animals, Princeton University Press, Princeton 2007

Cori, A., Ferguson, N. M., Fraser, C., & Cauchemez, S. (2013). A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics, Am J Epidemiol. 2013 Nov 1; 178(9):

1505–1512. Published online 2013 Sep 15. doi: 10.1093/aje/kwt133

Riferimenti

Documenti correlati

Si pu` o dimostrare che da ogni base di Gr¨ obner si pu` o estrarre una ba- se di Gr¨ obner ridotta e la base di Gr¨ obner ridotta `e unica (per un fissato ordinamento).. Seguendo

Utilizzando la notazione asintotica O è possibile descrivere il tempo di esecuzione di un algoritmo al caso peggiore esaminando semplicemente la struttura complessiva

ottenuti tramite ingegneria pancreas artificiale: un dispositivo esterno, che realizza un controllo ad anello chiuso sul metabolismo del glucosio, analogamente a

European University Institute Badia Fiesolana © The Author(s). European University Institute. Available Open Access on Cadmus, European University Institute

b) Il sistema scandinavo social-democratico: tipico di paesi come Danimarca, Svezia, Finlandia e Norvegia, si fonda sulla marcata presenza dello Stato che si occupa

Di fatti, l’elezione diretta del Sindaco introduce una fortissima innovazione nella gestione amministrativa degli enti locali e presto, questa nuova figura, si rivelerà essere

Le presenza in questo periodo rispecchiano abbastanza l’andamento degli arrivi, perciò presenze in costante aumento per quanto riguarda gli italiani, anche se con

Come si può osservare inizialmente viene prodotto un campo di vento bidimensionale orizzontale di primo tentativo, che può essere costante, variabile o