domenica 1 novembre 2020

Un piccolo conto senza pretese

Ho discusso in vari post la questione del calcolo dell'indice di trasmissione del contagio R e del ritardo con cui tale indice viene calcolato in Italia. Ho provato a confrontare le stime fatte recentemente dall'Istituto Superiore di Sanità (incluse le relative barre di errore) con il risultato di un semplice calcolo fatto senza alcuna pretesa basato sul numero dei nuovi contagi riportati quotidianamente dalla Protezione Civile Nazionale. 

La formula brutalmente empirica che ho usato per stimare l'indice di trasmissione R è la seguente:

R = 1+ 0,67 * (N(d)/N(d -7) -1)                                                  (1)

dove N(d) è il numero di nuovi contagi registrati nel giorno d. N(d-7) è il numero di contagi misurati 7 giorni prima del giorno d. Il dato è mediato su un periodo di due settimane, in analogia a quanto fa l'ISS per la sua stima di R. Il confronto tra il dato stimato con la formula (1) e la stima dell'indice calcolata dall'ISS è riportato in figura.

I punti rossi, con le relative barre d'errore corrispondono alla stima dell'indice di trasmissione calcolata dall'ISS (dato nazionale). I punti blu sono il risultato del calcolo basato sulla formula (1), mediato sul periodo di due settimane. Il punto grigio corrispondente al 4 novembre rappresenta una proiezione effettuata in data odierna che utilizza solo una parte limitata di dati (mancano ovviamente i valori dal 2 al 4 novembre.
 

Si nota una incredibile coincidenza tra i valori medi comunicati da ISS e quelli ottenuti con la semplice stima basata sull'equazione (1). Notiamo che i dati ISS fanno riferimento solo ad un sotto insieme dei contagi per i quali è nota la data di insorgenza dei sintomi. I dati usati per il mio conticino contengono tutti i contagi, inclusi gli asintomatici e sono riferiti alla data di comunicazione dell'esito del tampone che tipicamnete è eseguito con un certo ritardo rispetto all'insorgenza dei sintomi.

Considerata la banalità del conto la buona corrispondenza delle due stime nel periodo 23 settembre - 21 ottobre potrebbe essere del tutto casuale, ma ho deciso di pubblicarla ugualmente perché ci sono due punti (tra cui quello del 4 novembre che è solo una proiezione) non ancora coperti dall'analisi dell'ISS.

La tendenza del conto basato sulla formula (1) mostra una diminuzione che potrebbe significare un rallentamento della velocità di crescita dei nuovi contagi. Se questa tendenza fosse confermata sarebbe una buona notizia. Va detto tuttavia che tale effetto potrebbe essere solo un artefatto legato al recente peggioramento della capacità di eseguire tutti i tamponi necessari. La progressiva criticità del sistema di rilevazione potrebbe essere scambiata per una riduzione dell'aumento dei contagi.

Se la coincidenza tra la stima grossolana ottenuta tramite la formula (1) ed i valori prodotti da ISS sia solo casuale lo scopriremo nelle prossime settimane.




4 commenti:

  1. Mi piacerebbe, se possibile , avere lo sviluppo del calcolo per una data specifica, ad esempio per il 21 ottobre.
    Non riesco infatti a far uscire i dati da lei evidenziati nel grafico. Probabilmente non ho capito bene a quale dato si riferisce quando parla di dato mediato su 14 gg. Sono certo che mi sta sfuggendo qualcosa. Grazie comunque.

    RispondiElimina
  2. I dati sono organizzati in righe corrispondenti al giorno. Nella colonna A ci sono i valori delle date. Nella colonna B i nuovi contagi giornalieri. Per ciascun giorno faccio il calcolo del rapporto tra i contagi del giorno stesso e quelli di 7 giorni prima. Questi dati sono messi nella colonna C.
    Per la stima di R al giorno corrispondente alla data della riga 56, calcolo 1+(MEDIA(C43:C56)-1)*$E$1 dove nella casella E1 c'è il parametro libero che ho arbitrariamente fissato a 0,6. Il giorno corrispondente alla riga 56 è quindi l'ultimo giorno del periodo di due settimane considerato. Come ho scritto di tratta di un conto senza pretese e non è neanche detto che la coincidenza con le stime ISS non sia del tutto casuale. Vedremo.

    RispondiElimina
  3. La ringrazio. A me risulterebbero i numeri seguenti
    relativamente alla data esempio del 21 ottobre.
    Il dato dei contagiati al 21 ottobre è pari a 15199.
    Il dato dei contagiati al 14 ottobre è 7332.
    Il rapporto tra i due dati è pertanto pari a 2,07.
    La media dei rapporti a 14 gg è pari a 2,01 ( periodo 8 ott -21 ott).
    Il risultato della formula da lei indicata al 21 ottobre è
    1 + (2,01-1)*0,6 = 1,604
    Come mai il risultato sopracitato è diverso dal valore di circa
    1,75 riportato nel grafico alla data del 21 ottobre?

    RispondiElimina
  4. In effetti c'era un errore nel mio conto. Invece di fare il rapporto rispetto a 7 giorni prima, veniva fatto ad 8 giorni. Grazie per avermelo segnalato: è sempre un piacere avere lettori così attenti. Essendo - come già detto - il modello assolutamente empirico, ho rimodulato il parametro libero facendolo passare da 0,6 a 0,67 in modo da avere la migliore coincidenza tra le due serie di dati. Il post è stato modificato ed ora contiene i valori aggiornati.

    RispondiElimina