sabato 13 febbraio 2021

Una stima elementare dell’indice Rt del Trentino

Dopo essersi illuso, per due settimane consecutive, di avere “l’indice Rt più basso d’Italia”, ieri il Trentino si è bruscamente risvegliato con un indice Rt = 1,2 che ha fatto immediatamente scattare le limitazioni da “zona arancione”. 
 
Messo da parte, almeno per un po’, il sogno del “Trentino prima zona bianca d’Italia  ci troviamo nella scomoda situazione di dover bloccare molte attività, proprio mentre Valle D’Aosta, Lombardia e Veneto – che pure nelle settimane e nei mesi scorsi avevano affrontato momenti assai critici – potranno finalmente far partire i loro impianti sciistici

Di fronte a questa imbarazzante situazione, i vertici politici e sanitari trentini si sono inventati spiegazioni improvvisate (sarebbe tutta colpa della variante inglese) oppure hanno parlato di “evento imprevedibile”, come se l’Istituto Superiore di Sanità (ISS) agisse nell’ombra, usando formule misteriose per elaborare le sue classificazioni.
 
Senza dubbio, i metodi adottati dall'Istituto Superiore di Sanità si possono criticare per l’inconsistenza scientifica di talune scelte (ed io l’ho fatto sovente in questo blog) e soprattutto per i mancati controlli di consistenza sui dati che Regioni/PPAA inviano all’ISS e che sono la base delle elaborazioni che l’ISS stesso svolge con cadenza settimanale. 
 
Tutto si può dire, ma non che “gli algoritmi siano sconosciuti
 
È vero esattamente il contrario: gli algoritmi utilizzati dall’ISS sono conosciuti in dettaglio. 
 
Chiunque volesse approfondire la tematica relativa all’indicatore Rt può consultare il sito dell’Istituto Nazionale di Fisica Nucleare (INFN) dove è disponibile un approfondito confronto delle metodologie di stima. A proposito del suo algoritmo, l'ISS dichiara:  
 
"L’algoritmo per il calcolo dell’Rt ... è pubblico, reperibile sul Sito web dell’ISS ed è stato illustrato a tutti i referenti regionali che hanno contestualmente ricevuto il software per la sua applicazione e l’eventuale verifica".

Molto più modestamente, in questo blog alcuni mesi fa proposi una semplice formuletta empirica che permette di ottenere una stima del valore di Rt in tempo “quasi reale”, anticipando di circa 10 giorni le stime elaborate da ISS. La formuletta non ha molte pretese, ma sembra funzionare abbastanza bene: le discrepanze più significative tra le mie stime e quelle dell’ISS si sono verificate soprattutto in presenza di festività infra-settimanali che hanno alterato il ritmo di somministrazione dei tamponi. 
 
A differenza dell’ISS, nella mia formuletta vengono considerati tutti i contagi (asintomatici e sintomatici) e come data del contagio viene assunta la data di comunicazione del contagio alla Protezione Civile Nazionale (questo può comportare uno sfasamento di alcuni giorni dovuto al tempo che passa tra comparsa dei sintomi e diagnosi).

Il metodo utilizzato da ISS è più accurato (ammesso e non concesso che le Regioni/PPAA si comportino in modo leale e mandino i dati reali dei contagi) perché considera solo il sottoinsieme dei contagi sintomatici e li classifica in base alla data di comparsa dei sintomi. Questa maggiore accuratezza comporta anche una maggiore “fragilità” dell’indicatore. 
 
Come ci ha insegnato il caso recente della regione Lombardia, basta “giocare con la classificazione dei contagi" (ad esempio, facendo apparire come asintomatici un numero consistente di casi pauci-sintomatici) ed ecco che la stima dell'indice Rt può cambiare in modo sostanziale

Tornando al mio modellino senza pretese, ho provato ad applicarlo ai dati dei contagi del Trentino per cercare di capire meglio come sia variata la circolazione virale nel corso degli ultimi due mesi. 
 
Il primo problema che ho dovuto affrontare è stato quello della reperibilità dei dati. La storia la conoscete bene e non c’è bisogno che la ripeta. Prima dello scorso 15 gennaio, non ho potuto usare i dati che la Provincia Autonoma di Trento ha comunicato alla Protezione Civile Nazionale o all’ISS perché sappiamo che, oltre ad essere discordanti, rappresentavano solo un sottoinsieme dei contagi complessivi.
 
Ho provato quindi a ricostruire i contagi effettivi partendo da quanto comunicato durante le conferenze stampa serali della Provincia. Per ciascun giorno, ho sommato i tamponi molecolari positivi ai tamponi rapidi antigenici positivi, sottraendo i molecolari positivi che confermavano un contagio precedentemente riscontrato con il tampone antigenico. Questa operazione l’ho potuta fare dalla seconda settimana di dicembre in poi. Da metà ottobre fino all’inizio di dicembre è stato impossibile ricostruire l’andamento dei contagi in Trentino perché il dato è un segreto, ben custodito nei cassetti della Provincia. 
 
Dal 15 di gennaio in poi ho considerato i contagi giornalieri comunicati alla Protezione Civile Nazionale. Applicando il mio modellino empirico ho ottenuto le stime dell'indice Rt che sono mostrate nella figura seguente con i punti rossi. 
 
Notate che la figura riporta anche una proiezione dell’indice Rt del Trentino riferita al prossimo 17 febbraio. Questa proiezione va intesa come assolutamente preliminare ed il suo valore definitivo lo potrò fornire solo quando saranno noti i nuovi contagi dal 14 fino al 17 febbraio incluso. 
 
Poiché - come ricordato precedentemente - il mio modellino risente della presenza di festività infra-settimanali che alterano il calendario di somministrazione dei tamponi, ho provato ad usare un altro approccio empirico che, invece di calcolare il rapporto dei contagi di ogni giorno rispetto a 7 giorni prima e poi mediare, calcola il rapporto dei contagi settimanali, rispetto a quelli della settimana precedente. La formula utilizzata è:
 
Rt = 1+ [(contagi settimana)/(contagi settimana precedente) -1]*0.6                  (1)
 
Le stime ottenute con questo modello empirico alternativo sono rappresentate in figura con i punti verdi.
 
Nella stessa figura riporto le stime elaborate dall’ISS per il Trentino (punti neri), utilizzate per identificare la classe di rischio. Vi faccio notare che le stime ISS sono quelle che rientrano tra i "21 parametri" e sono mediate su un periodo di una settimana, mentre il mio modellino media sull’arco di due settimane. Questo può comportare, per il mio modellino, un effetto di smorzamento di eventuali rapide variazioni dell’indice. Parliamo comunque di un fenomeno che può produrre forti discrepanze tra le due stime solo nelle fasi più acute della pandemia. In una situazione come quella attuale, dove i contagi sono sostanzialmente stabili (mi riferisco, in particolare, alla media nazionale), mediare su 7 o 14 giorni non comporta variazioni di particolare rilievo. 

Come vi avevo anticipato in precedenti post, secondo le mie stime, dall'ultima settimana di dicembre fino ad oggi l’indice Rt del Trentino è sempre stato intorno ad 1, salvo una temporanea discesa intorno alla metà del mese di gennaio. 
 
Le stime dell’indice Rt “più basso d’Italia” fornite dall’ISS nei giorni 13 e 20 gennaio sono un chiaro artificio legato al mancato conteggio dei contagi antigenici (la grande maggioranza dei contagi rilevati in Trentino). Il giorno 27 gennaio, in concomitanza con il passaggio al computo di tutti i contagi (molecolari + antigenici), il valore medio della stima ISS dell’indice Rt del Trentino è schizzato a 1,2.

I punti rossi sono il risultato del mio modellino empirico. I punti verdi sono il risultato del modello empirico alternativo (eq. (1)) che considera i dati cumulativi settimanali al posto dei dati giornalieri. Si vede che ambedue i modelli empirici mostrano un andamento oscillante intorno al valore unitario, durante tutto il periodo di tempo considerato. I punti neri sono le stime elaborate da ISS (quelle decisive per assegnare i "colori" alle Regioni/PPAA)

Come puro esercizio - senza alcuna pretesa - ho provato a confrontare le stime ISS con i risultati ottenuti con l'equazione (1), spostando verso sinistra (anticipando) di 4 giorni le mie stime (punti verdi). Come vedete, l'andamento generale è abbastanza simile, ma le stime ISS sono troppo basse proprio nei giorni 13 e 20 gennaio a causa delle ben note motivazioni:

Gli stessi dati della figura precedente, ma il risultato della eq. (1) è stato spostato a sinistra (anticipato) di 4 giorni per tenere grossolanamente conto del tempo medio che intercorre tra la comparsa dei sintomi e la diagnosi di positività. Si vede che - almeno da un punto di vista qualitativo - i due andamenti sono abbastanza simili.
 

Probabilmente, se i dati forniti dal Trentino all'ISS per effettuare le stime di Rt a gennaio avessero contenuto un maggiore contributo percentualmente di positivi molecolari, le stime ISS per i giorni 13 e 20 gennaio sarebbero state decisamente più alte. Non avremmo potuto vantarci di "avere l'indice Rt più basso d'Italia", ma è possibile che la stima del 27 gennaio (quella che ci ha formalmente mandato in zona arancione) sarebbe stata un po' più bassa e forse la zona arancione ce la saremmo potuta evitare. Ma ormai - come si dice - "è inutile piangere sul latte versato!"

Prima che qualcuno pensi di utilizzare la mia grossolana stima per sostenere che “il Trentino è stato messo ingiustamente in zona arancione”, lo invito a guardare bene la figura. Secondo i miei calcoli, il Trentino sarebbe potuto entrare in zona arancione già ad inizio gennaio. 
 
Senza contare che l'ISS ha fatto i conti con i dati inviati dal Trentino che è quindi l'unico responsabile sia della qualità dei dati, che della scelta (unica in Italia) di usare i tamponi antigenici (senza sollecita conferma molecolare) come strumento quasi esclusivo per trovare i nuovi positivi.
 
Cosa possiamo aspettarci per le prossime settimane? La permanenza in zona arancione potrebbe essere ancora lunga, a meno che, da qui in avanti, i contagi calino significativamente oppure quasi tutti i nuovi contagi "diventino" asintomatici.

10 commenti:

  1. Per uscire dalla zona arancione basta il limite inferiore del Rt sia <1 tra due settimane o serve altro? (mi pare gli altri indicatori abbiano poca importanza alla fin fine).
    Certo che un criterio basato sul numero di contagi procapite come fa l'ECDC o la Germania sarebbe ben più ragionevole

    RispondiElimina
    Risposte
    1. In linea di principio, bisogna rimanere sotto ad 1 per due settimane.

      Poi c'è il metodo ambrosiano che consiste nel classificare una frazione crescente dei nuovi contagiati come asintomatici e dichiarare che i dati mandati a ISS erano sbagliati. Se il Ministro ci crede (o fa finta di crederci), si esce subito!

      Elimina
    2. Buongiorno, Carlo,

      anche il criterio basato sul numero di contagi pro capite può essere aggirato, facendo meno tamponi molecolari di screening (negli ospedali o nelle RSA, passando da 2 volte la settimana a 1, oppure rendendo il tampone facoltativo quando vai a donare il sangue, oppure quando entri in ospedale solo in day hospital).

      Si veda il post di lunedì 8 febbraio:

      Coronavirus: Trentino e Alto Adige “così vicini, ma così lontani”.
      Luca Pianesi - ilDolomiti.it - 08 febbraio 2021

      Bolzano fa quasi il triplo dei tamponi e trova il triplo dei contagi. In Alto Adige negli ultimi 7 giorni sono stati fatti 51.902 tamponi e sono stati trovati 4.314 positivi. In Trentino sono stati fatti 19.479 tamponi e sono stati trovati 1.381 positivi.

      Ancora una volta Trentino e Alto Adige sembrano viaggiare su due pianeti diversi per quanto riguarda la curva del contagio a livello di comunicazione, con la Provincia di Bolzano travolta dal virus e il Trentino sempre più fuori dal tunnel.

      Ancora una volta, a guardare i numeri, però, pare proprio che la differenza la stiano facendo, più che altro, i controlli effettuati. Trento ha - di fatto - bloccato lo screening, mentre Bolzano lo ha intensificato enormemente e così negli ultimi 7 giorni, dal primo febbraio fino ad oggi, solo per usare i dati più freschi, l'Alto Adige ha fatto 51.902 tamponi, tra molecolari e antigenici, mentre il Trentino 19.479, sempre tra molecolari e antigenici.

      E guarda caso i positivi trovati (dati Protezione civile) in questi 7 giorni sono stati in totale 4.314 casi in Alto Adige mentre in Trentino 1.381 positivi. E' facile vedere che il rapporto è praticamente lo stesso moltiplicato per tre: l'Alto Adige ha fatto circa il triplo dei tamponi (il rapporto è 8,49%) del Trentino e ha trovato circa il triplo dei contagi (il rapporto è 7,14%).

      Elimina
    3. Vale sempre il principio "se non li cerchi non li trovi", anche se - in generale - non c'è una rigida proporzionalità tra tamponi fatti e contagi trovati.

      Si possono fare tanti tamponi negativi facendoli in modo non mirato. Se invece si vanno veramente a tracciare i contatati stretti dei nuovi positivi, allora molti tamponi corrispondono a molti contagi.

      Elimina
  2. Prof. Bassi, può fare per cortesia un po’ di chiarezza sul tema dell’assegnazione dei colori in funzione di Rt ed incidenza? Qualche lettore parla per Rt di superamento della soglia da parte del limite inferiore dell’intervallo di confidenza. Ho cercato di capire qualcosa dal DPCM del 14 gennaio ma si fa una certa fatica. A questo punto ritengo sia importante comprendere bene le regole della colorazione nel dettaglio, soprattutto per l’arancione, visto che ci siamo dentro. Grazie

    RispondiElimina
    Risposte
    1. La regola fa riferimento al superamento di certe soglie (1 e 1,25 per zona arancio e rossa, rispettivamente), ma il superamento deve essere "completo". Ad esempio, per entrare in zona arancione bisogna che il limite inferiore dell'intervallo di confidenza sia maggiore o uguale ad 1.

      Per l'uscita si applica una regola di isteresi per evitare che le zone cambino colore con troppa frequenza. Ad esempio, la regola dice che - per uscire dalla zona arancione - almeno il limite inferiore dell'intervallo di confidenza dell'indice Rt stimato da ISS deve essere minore di 1 per almeno due settimane. Il valore medio può anche essere maggiore di 1. L'importante è il valore del limite inferiore dell'intervallo di confidenza.

      Queste sono le regole. Poi ci sono state delle "sanatorie" dovute essenzialmente a decisioni politiche (recenti casi di Lombardia e Puglia) dove le due settimane non sono state aspettate sostenendo che i dati che avevano fatto scattare l'allerta erano sbagliati.

      In pratica le Regioni, pur maentenendo il numero complessivo di contagi costante, hanno riclassificato come asintomatici (e quindi da non includere nella stima di Rt fatta da ISS) alcuni casi che prima erano stati classificati come sintomatici. Una classica soluzione "all'italiana".

      Elimina
    2. Un nuovo *metodo” in aggiunta al classico “trentino” e all”ambrosiano” potrebbe essere quello di cercare di far aumentare le dimensioni dell’intervallo di confidenza. Vedo ad esempio che il Molise pur avendo un dato puntuale di 1,09 ha un limite inferiore molto basso rispetto alle altre regioni pari a 0,79. Mi chiedo onestamente se valutare solo il limite inferiore rispetto alle soglie e non considerare il valore puntuale ha un senso compiuto.

      Elimina
    3. Verissimo, ma funziona bene solo per le Regioni più piccole.

      Quanto all'uso di Rt, comunque la si giri, personalmente non credo abbia molto senso. Meglio usare la prevalenza e verificare che si faccia un numero adeguato di tamponi diagnostici. Incrociando con i dati degli ospedali (nuove entrate piuttosto che numero di persone ricoverate) si otterrebbe un sistema più robusto.

      Elimina
  3. La zona arancione e IL MISTERO DELL'ALGORITMO
    Fugatti: «Decisione beffa per il Trentino»
    ----------------------------------------------
    lavocedeltrentino.it - 14 Febbraio 2021

    Nella tradizionale conferenza stampa della task force di ieri il Presidente Maurizio Fugatti è tornato a parlare della nuova colorazione “arancione”, ribadendo ancora il proprio rammarico: “Se guardiamo anche ai dati odierni, con zero decessi e la situazione ospedaliera sotto controllo, la decisione dell’Istituto Superiore di Sanità appare quasi come una beffa”.

    È comunque MISTERO FITTO sui parametri dell’algoritmo usato dal Governo per definire le zone di rischio Covid, “rosse”, “arancioni” o “gialle”. E nessuno l’ha mai visto.

    Trasparenza e oggettività SONO DUBBIE. Sappiamo che c’è dietro un meccanismo automatico di determinazione dei livelli di allerta e delle conseguenti misure di contenimento. Il meccanismo è stato inserito all’interno del DPCM del 3 novembre, ed è stato definito fin dalla sua pubblicazione come UN ALGORITMO, intendendo probabilmente mettere in risalto la sua assoluta obiettività.

    Eppure qualcosa non torna. Il Trentino infatti negli ultimi 20 giorni ha visto calare le ospedalizzazioni di oltre 300 unità, le terapie intensive si sono svuotate finendo anche sotto il tetto di allerta fornito dal Comitato tecnico scientifico, e i decessi sono ridotti al minimo. E finire in zona arancione è davvero UN MISTERO.

    In tal senso, come riportato da La Nazione, secondo FEDERICO FUGA, ingegnere elettronico di Verona, “l’algoritmo che definisce i colori delle regioni, e quindi le nostre libertà, E’ POCO TRASPARENTE e fin troppo discrezionale”.

    Come ha spiegato Fuga, “lo chiamano ALGORITMO per dargli un certo tono scientifico. Il decreto con cui si identificano i 21 indicatori (tra cui il famoso Rt, il numero di pazienti in rianimazione sui posti letto disponibili) è chiaro e funziona. Purtroppo non si capisce come avvenga l’integrazione con il livello di rischio, che viene definito attraverso una serie di domande a cui si risponde “sì” o “no” e che sono poco oggettive”.

    Nel senso che vi sono domande che possono essere diverse a seconda di chi dà la risposta. Come per esempio se la situazione sanitaria è sotto controllo o se il numero dei tamponi effettuato risulta essere adeguato.

    Poi “tutto viene integrato - ma NESSUNO SA COME - dalla cabina di regia, che in qualche modo giustifica così la propria esistenza. Quando si prendono decisioni che vanno a limitare le libertà delle persone, servirebbe più chiarezza e ci vorrebbero basi scientifiche molto forti”. E invece sembra che queste basi scientifiche non ci siano. E tanto meno la chiarezza.

    RispondiElimina
    Risposte
    1. Se Fugatti fosse meno permaloso avrebbe dovuto citare me, considerato che da sempre sostengo l'incosistenza dei 21 indicatori.

      Ciò non toglie che con l'attuale circolazione del virus in Trentino, più che in zona arancione dovremmo essere in zona rossa (dove in effetti ci ha messo ECDC)

      Elimina