venerdì 1 maggio 2020

La “supercazzola” dell’Erre Zero sotto 0,2

Durante questa epidemia tutti abbiamo scoperto l’importanza dell’indice di trasmissione di base R0, ovvero il numero medio contagi secondari che un contagio primario induce all’interno di una popolazione completamente suscettibile. Sull’uso e sull’abuso dell’indice R0 (o meglio del suo valore efficace Rt) hanno scritto già altri. Qui vorrei spiegarvi perché a mio parere – l’indice di trasmissione sia un parametro di primaria importanza per gli studi epidemiologici, ma debba essere usato con una certa prudenza quando si decidono politiche pubbliche

Questa mattina, un politico di cui non faccio il nome perché sembrerebbe che ce l’abbia con lui, ha ipotizzato che lo spostamento tra Regioni potrebbe essere autorizzato solo dopo che il famoso indice sia sceso sotto 0,2. È una affermazione che apparentemente potrebbe apparire sensata, ma che – secondo me – non ha alcuna valenza pratica (nel titolo di questo post sono stato un po' più esplicito)

Partiamo da quello che dice a proposito dell’indice l’autorevole Robert Koch Institute (RKI): “The reproduction number, R can only be estimated based on the nowcasting and not directly extracted from the notification system”. In parole povere, l’unica cosa che possiamo vedere subito osservando l’andamento dei nuovi casi è se il famoso indice sia superiore o inferiore ad 1 (ovvero se i nuovi casi aumentano col tempo o diminuiscono). In pratica è il succo dell’apprezzatissimo discorso che la premier Angela Merkel ha fatto qualche giorno fa ai cittadini tedeschi.

Per estrarre dai dati il valore di R durante questa fase calante dell'epidemia bisogna utilizzare metodi matematici piuttosto sofisticati. Il metodo del nowcasting utilizzato da RKI è una modalità di previsione a breve termine impiegata anche in altre discipline (ad esempio in meteorologia). Per estrarre il valore di R bisogna che i nuovi casi siano classificati non in base alla data di rilevazione, ma piuttosto si faccia riferimento alla data di insorgenza dei primi sintomi. Bisogna poi costruire un modello di diffusione del contagio i cui parametri sono scelti dagli epidemiologi sulla base di considerazioni che contengono un importante margine di discrezionalità. Parametri diversi portano a stime diverse. Tuttavia, se teniamo costante il modello, l’andamento dell’indice di trasmissione ci fornisce utili informazioni sull’evoluzione dell’epidemia, ma utilizzare il valore assoluto di R ottenuto con questa complicata procedura come una "soglia" per prendere decisioni non è una buona scelta, specialmente quando il valore si avvicina a zero. Infatti il risultato è afflitto da un grande margine di errore a causa delle fluttuazioni dei dati da cui viene ricavato: attualmente RKI stima che in Germania l'indice (facendo una media mobile dei dati su 4 giorni) abbia un valore medio pari a 0,75 con un intervallo di errore che, al 95% di confidenza, va da 0,64 a 0,87. Parliamo dei dati complessivi di tutta la Germania, ovvero di circa 1500 nuovi casi al giorno. L'errore che affligge la stima diventerà ancor più significativo quando l’epidemia volgerà al termine ed il numero di nuovi casi si ridurrà ulteriormente. Addirittura quando i nuovi casi giornalieri scenderanno a meno di qualche decina, diventeranno dominanti le fluttuazioni tipiche dei cosiddetti “eventi rari” e la barra d’errore crescerà ulteriormente (in termini percentuali, ovviamente).

Morale della favola: affidarci a stime di parametri indiretti soggetti a forti incertezze statistiche per definire le politiche pubbliche è una pessima idea. Meglio usare una combinazione di parametri diretti facilmente misurabili. Mi sembra che le linee guida che il Ministero della Salute ha iniziato a diffondere, sia pure sotto forma di bozze, vadano in questa direzione. Mentre R0 lo lascerei nelle mani sapienti degli epidemiologi che sapranno farne buon uso per i loro studi.

2 commenti:

  1. Grazie di questi chiarimenti.

    1.
    "Meglio usare una combinazione di parametri diretti facilmente misurabili".
    Su quali parametri possiamo fare affidamento?

    2. Va sistemato il valore superiore dell'IC (simmetrico, a parte gli arrotondamenti); come da originale:
    "The current estimate is R=0.75 (95% confidence interval: 0.64-0.87) and is based on current electronically notified cases"

    3. Ancora un dettaglio
    La fonte dei dati è il Robert Koch-Institut (con la h, non con la k)

    RispondiElimina
  2. Grazie per la segnalazione degli errori che ho corretto. Quanto ai parametri da misurare, il Ministreo della Salute sembra orientato a scegliere un ampio sistema di indicatori. Certamente i nuovi casi, ma anche il numero di tamponi fatti, considerando in particolare solo quelli specificamente dedicati alla individuazione di nuovi contagiati, escludendo quindi quelli usati per verificare se i malati sono tornati virologicamente negativi o quelli usati per il monitoraggio continuativo di specifiche categorie a rischio. Inoltre dovrebbe essere monitorata la capacità di individuare i contatti recenti di ciascun nuovo contagiato. Sono tutti fattori che alla fine finiscono per far variare l'indice R, ma possono essere misurati direttamente senza essere mediati da un modello. Ovviamente se si utilizza una serie di indicatori bisognerà decidere quali siano più rilevanti (non è detto che abbiano tutti lo stesso peso) e alla fine fare una sintesi. Ci sono dei problemi anche in questo approccio, ma almeno le informazioni possono essere estratte in tempo quasi-reale dalla base dati relativa ai contagi.

    RispondiElimina