domenica 1 novembre 2020

Perché l'indice di contagio R non è un buon parametro per far scattere le zone rosse

Vi ricordate quando alla fine del primo lockdown si discuteva dei criteri per la riapertura e un genio della statistica propose di liberalizzare i movimenti all’interno delle regioni che scendevano sotto ad un valore dell'indice di trasmissione del contagio R inferiore a 0,2?

Oggi siamo alle prese con il secondo lockdown. In Italia stiamo disperatamente cercando di prendere provvedimenti equivalenti a quelli ormai adottati da gran parte dei Paesi europei, ma non vogliamo chiamarli lockdown. Parliamo allora di "zone rosse localizzate" che si sarebbero dovute fare già due settimane fa, ma meglio tardi che mai. Se poi le zone rosse localizzate finiranno per bloccare intere regioni non è un problema: basta non chiamarle lockdown.

Ma appena si cerca di stabilire quali siano i criteri da utilizzare per identificare i territori da chiudere, ecco rispuntare un dato tipicamente italiano (nessun altro paese in Europa lo usa), quello dell'indice di trasmissione del contagio calcolato su base regionale. La ricetta è semplice: intervenire quando R supera il valore 1,5. La cosa avrebbe senso se conoscessimo con ragionevole accuratezza la stima di R, ma non è così. 
 
Per farvi capire quanto abbia poco senso questo criterio vi mostro il grafico elaborato dall'Istituto Superiore di Sanità che riporta l'ultima stima disponibile (inserita nel rapporto del 25 ottobre, ma in realtà riferita alla media delle prime due settimane di ottobre) dell'indice di trasmissione del contagio R per le diverse Regioni/PPAA.


Stima dell'indice di trasmissione del contagio nelle diverse Regioni/PPAA italiane elaborato dall'Istituto Superiore di Sanità con riferimento al periodo 8 -21 ottobre. Il dato è contenuto nell'ultimo rapporto ISS pubblicato il 30 ottobre. la linea rossa indica il valore R = 1,5. Lombardia, Piemonte ed Alto-Adige sono le uniche Regioni/PPAA che presentano una stima di R per la quale l'intero intervallo di confidenza (barra di errore) si trova oltre la linea rossa.

Nella Figura, oltre al valore medio della stima dell'indice, vengono riportate anche le cosiddette barre di errore. Il significato statistico è molto semplice: c'è una probabilità del 95% che il vero valore dell'indice sia compreso all'interno dell'intervallo identificato dalle barre d'errore. Quindi il valor medio della stima ci fornisce solo una indicazione, ma solo considerando le barre d'errore possiamo capire quanto la stima sia affidabile. Usare come criterio per una decisione solo il valore medio senza preoccuparci di capire quale sia l'accuratezza della stima è una bestialità statistica.

Nel concreto, vi invito a confrontare il dato della Valle d'Aosta e del Veneto (sono gli ultimi due dati verso il basso). Vedete come la barra d'errore della Valle d'Aosta sia talmente grande da far perdere qualsiasi significato alla stima stessa (il dato vero potrebbe essere addirittura minore di uno). Viceversa nel caso del Veneto le barre d'errore sono contenute e quindi possiamo parlare di una stima che ha una sostanziale affidabilità. Questo risultato non è sorprendente perché il rapporto delle popolazioni di Veneto e Valle d'Aosta è pari a quasi 40. Questo vuol dire che la stima fatta in Veneto può disporre di un numero molto maggiore di casi (e magari è capace di tracciarli meglio) è quindi diventa statisticamente più accurata. Senza contare che in una piccola comunità come quella valdostana anche un solo focolaio intenso, ma molto circoscritto, farebbe divergere la stima sovrastimando le criticità (che in Val d'Aosta ci sono, ma lo si vede da altri parametri!). 

Se si tiene conto dell'intervallo di confidenza (larghezza delle barre d'errore) le uniche Regioni/PPAA che sono sopra 1,5 sono Lombardia, Piemonte e Alto-Adige. Tutti gli altri sarebbero ancora in zona non critica.

Che fare allora? La ricetta è semplice: copiare da chi è più bravo di noi. Prima di tutto bisognerebbe adottare anche in Italia le tecniche di stima dell'indice nazionale di riproduzione dei contagi R basate sul nowcasting esattamente come fa la Germania. Le stime ritardate, mediate su due settimane e differenziate su base regionale servono forse per gli studi teorici degli epidemiologi, ma sono di scarsa utilità per i decisori politici. Anzi rischiano di fornire informazioni poco comprensibili che inducono a prendere decisioni sbagliate.

Se vogliamo capire come vanno le cose dovremmo monitorare la progressione dei contagi su una base territoriale più ristretta rispetto a quella regionale (almeno per le regioni più grandi). Ad esempio, l'attuale situazione della Provincia di Bergamo è nettamente migliore rispetto alla media lombarda, mentre quella della Provincia di Belluno è molto più preoccupante rispetto alla media del Veneto. Analogo discorso andrebbe fatto rispetto all'utilizzo delle strutture sanitarie. Un altro dato importante è quello dei decessi per capire quanti decessi avvengano al di fuori degli ospedali. Altrimenti c’è il rischio di vedere che le terapie intensive sono ancora scarsamente occupate e illudersi che tutto vada bene.

Soprattutto dovremmo avere dati aggiornati quotidianamente così come avviene in Germania, sia pure mediati a 7 giorni (running average) quando si devono smorzare le tipiche fluttuazioni che avvengono durante l’arco della settimana. I rapporti ISS arrivano troppo tardi e contengono dati non aggiornati (l’ultimo giorno incluso nell’analisi dei contagi risale a 4-5 giorni prima della data di pubblicazione). Poteva avere senso quando la pandemia era in fase calante, ma ora bisogna cambiare passo.

In questo blog non ho mai risparmiato le critiche ai decisori politici per la loro incapacità di prendere decisioni al momento giusto. Ma se gli organi tecnico-scientifici ritardano a elaborare e pubblicare i dati sull'evoluzione dell'epidemia saranno altrettanto responsabili dei disastri che si sarebbero potuti evitare.


1 commento:

  1. È chiaro che la sanitá non è purtroppo alla data competenza della UE . Sará opportuno in ogni modo che almeno a livello delle principali nazioni europee vengano definiti degli standard sia per la raccolta che per l’elaborazione ed il controllo dei dati in ambito sanitario.
    In fondo ECDC che è un’agenzia UE svolge in parte questa funzione. Sul loro sito si intravede l’assenza di standard quando si vanno a vedere le sorgenti dei dati fresi disponibili dai diversi stati. Si capisce che siamo in presenza di una complessitá derivante dal fatto che i paesi hanno configurazioni amministrative , organizzazione sanitarie, risorse a disposizione per investimenti, competenze e sensibilitá molto diverse.
    Poi un giorno forse arriveremo a degli standard a livello mondiale ma qui entriamo probabilmente nel mondo dei sogni. Meglio pensare ai piccoli passi.

    RispondiElimina