venerdì 22 maggio 2020

Monitoraggio ISS della Fase 2: aggiornamento relativo alla settimana 11-17 maggio

Durante la conferenza stampa di questa mattina l'Istituto Superiore di Sanità ha pubblicato il secondo aggiornamento sull'evoluzione dell'epidemia di Covid-19 in Italia nella settimana che andava dal giorno 11 fino al 17 maggio incluso. Il documento di riferimento lo potete trovare qui. Questa è la "pagella" in cui sono ripotati quelli che l'ISS ritiene i dati più salienti:

Notiamo che anche per questa settimana  il Trentino si conferma come il territorio italiano con la maggiore incidenza di nuovi casi (livello di incidenza Alto - Q4), seguito ad una incollatura dalla Lombardia. Purtroppo ancora una volta l'ISS "dimentica" di riportare i dati relativi alla densità di tamponi fatti. 
Indice di trasmissione del contagio Rt (Fonte: ISS)

D'altra parte si continua a dare molta enfasi (sbagliando grossolanamente, a parer mio) all'indice Rt, con tanto di allarme lanciato in conferenza stampa per la Val d'Aosta che avrebbe superato la fatidica soglia 1. Basta guardare la figura qui sopra per capire che le barre di errore sono talmente grandi da rendere le stime dell'indice statisticamente indistinguibili per la maggior parte delle regioni italiane. Inoltre, ricordo che i dati stimati su base regionale hanno il grosso limite di arrivare con circa due settimane di ritardo (nel caso specifico la data di riferimento è il 3 maggio). Quindi sono dati con un grosso margine di errore e ritardati: in estrema sintesi "discuterne sarebbe tempo buttato". Tanto per tornare alla realtà delle cose, la Val d'Aosta (circa 125.000 abitanti) pur avendo fatto molti tamponi ha registrato una dozzina di nuovi contagi nell'arco della settimana presa in considerazione. Indicarla come un caso da "attenzionare" mi sembra una sciocchezza. Sorprende che un Istituto come l'ISS commetta errori di interpretazione dei dati così clamorosi.

Per completare l'informazione ho cercato di evidenziare le informazioni che l'ISS si "dimentica" costantemente di fornire. Nei due grafici che seguono potete vedere la densità di nuovi casi registrati per ogni 100.000 abitanti e la densità di "nuovi" tamponi fatti sempre per ogni 100.000 abitanti. La densità dei nuovi contagi fa riferimento ai dati ISS che sono leggermente diversi da quelli del data base di Trento e dai dati della  Protezione Civile nazionale. Non si sono comunque differenze tali da modificare significativamente l'informazione e come nota l'ISS possono essere spiegate tenendo conto delle diverse tempistiche di aggiornamento dei dati. Per quanto riguarda i "nuovi" tamponi ho fatto riferimento ai dati della Protezione Civile nazionale che indicano, accanto al numero assoluto di tamponi fatti, il numero delle persone a cui sono stati fatti i tamponi (una persona può fare tre o più tamponi nel periodo in cui viene riconosciuta come contagiata). Si tratta di una stima grossolana, ma non completamente distante dalla realtà. Va notato tuttavia che questa stima sfavorisce molto le regioni come, ad esempio, il Veneto che dedicano una frazione significativa dei loro tamponi al monitoraggio periodico del personale sanitario e delle RSA. I tamponi periodici fatti ad appartenenti a queste categorie non contribuiscono ad incrementare il numero delle nuove persone sottoposte a tampone, anche se hanno una grande rilevanza nella strategia complessiva di controllo dell'epidemia. L'ISS dispone dei dati precisi, ma non li ha diffusi. In attesa che lo faccia uso la mia stima grossolana.

Il quadro che emerge si commenta da solo: il Trentino finalmente si è messo a fare i tamponi, mentre altre Regioni evitano di cercare con troppa lena i positivi asintomatici o pauci-sintomatici. La Val d'Aosta ne ha fatti quasi come il Trentino ed è stata pure "mazziata" con la storia dell'indice di contagio superiore ad uno.

Fonte dati: Istituto Superiore di Sanità

Si veda il testo per i dettagli sulla stima di questo parametro
Concludo con un consiglio per la dirigenza della nostra APSS. Almeno due tra le persone ai vertici nella Sanità trentina nei recenti colloqui che hanno avuto con me o nello scambio di e.mail hanno tenuto a farmi sapere di essere in ottimi rapporti con i vertici dell'Istituto Superiore di Sanità. Bene dico io: usino questi contatti e si facciano ascoltare. Convincano l'ISS a dare meno enfasi al traballante indice di trasmissione del contagio e a rendere pubblici i dati molto più interessanti relativi al numero di tamponi che si fanno settimanalmente per la ricerca dei nuovi contagi.


Per approfondimenti:
Coronavirus, «Rt un indice fuoriviante» avverte la Fondazione Gimbe

5 commenti:

  1. Prof. Bassi, ci può dire come pensa che ISS (in collaborazione con FBK) faccia a calcolare il valore medio di Rt e del suo intervallo min-max? Immagino, ma posso sbagliarmi ovviamente, che nel processo di calcolo per ogni regione si facciano delle ipotesi sul numero degli asintomatici, non so però quanto affidabili visto che i test effettuati sul campo sono stati pochi, seppur significativi come nel caso di Vò. Una cosa penso sia spiegare un andamento con una ipotesi di 1% di asintomatici in una certa regione o provincia, altra cosa è ipotizzare un 10-15%. Se è vero che entrano questi dati nei calcoli non sarebbe bene vedere nel rapporto ISS anche i numeri di queste ipotesi per singola regione?
    Anche se mi pare che lei ritenga sopravvalutato il parametro Rt, altra domanda che le faccio è se ritiene possa essere utile avere i dati Rt oltre che a livello regionale anche a livello provinciale o addirittura comunale. Magari sono dati che ci sono già ma che non sono di dominio pubblico. Grazie

    RispondiElimina
    Risposte
    1. L'indice R è un oggetto da manipolare con cura perché pretende di sintetizzare con un numero l'andamento di una epidemia. Finché ci limitiamo ai modelli epidemiologiciva benissimo, ma è molto più difficile da usare quando ci caliamo nella realtà. Va detto, prima di tutto, che R non si misura ma si "stima", ovvero è un parametro che viene inserito in un modello teorico (assieme ad altri parametri più o eno arbitrari) e viene aggiustato in modo che il modello teorica descriva al meglio i dati sperimentali. Si tratta quindi di una procedura indiretta, abbastanza complicata dal punto di vista tecnico. Il problema italiano è che si vuole fare una analisi su base troppo frammentata: i dati regionali sono fortunatamente pochi. Il caso della Val d'Aosta è emblematico: ci inventiamo una stima di R per descrivere una realtà dove sono stati registrati 12 casi in tutta una settimana. Contiamo i casi e tracciamoli. Senza perdere tempo con una stima che ha un indeterminazione talmente grande da renderela praticamente inutilizzabile. Ci sono tanti altri aspetti molto tecnici su cui non mi dilungo. In particolare non tutti i contagi vengono considerati ai fini del calcolo di R. Se ne usa un sotto-insieme per il quale sia stato possibile identificare la data di insorgenza dei sintomi (quindi gli asintomatici non sono considerati). Tutto questo riduce il numero di casi considerati a valori così bassi da rendere pesanti le fluttuazioni intrinseche dovute alla statistica di Poisson. Aggiungo ancora che le stime di R fatte con il metodo italiano sono in ritardo di due settimane rispetto al giorno in cui sono rese note. Quindi ancora più inutili. Molto più sensato secondo me il metodo usato in Germania da RKI che calcola R per tutto il Paese e ottiene quindi l'andamento d'insieme dell'epidemia. Inoltre usa una metodologia di nowcasting che permette di ridurre il ritardo di stima a meno di una settimana (4-7 giorni a seconda dell'accuratezza desiderata). Per monitorare le situazioni locali si ricorre alla misura della densità di nuovi casi registrata su base settimanale, avendo alle spalle una politica di somministrazione dei tamponi meno selvaggia rispetto quanto accade in Italia. Purtroppo il valore di R regionale piace molto ai politici italiani, anche a quelli che non hanno capito cosa sia. Temo che ormai, non per colpa del collega Merler che è un bravo epidemiologo, l'ISS si sia cacciato in un vicolo cieco e che questa storia dell'R regionale possa produrre molti danni, inclusa la possibilità che possa minare la credibilità dell'ISS nel monitoraggio della Fase 2.

      Elimina
    2. Il lettore MAURIZIO ha mandato un commento che, per errore, ho cancellato. Ho rcuperato il testo che scrivo qui sotto, aggiungendo che lo condivido pienamente. Mi scuso per il disguido.
      La ringrazio per la risposta ricca di stimoli molto interessanti. Partendo dalle sue considerazioni ho diviso l’Italia in 2 macro aree più o meno equivalenti dal punto di vista dimensionale. Da una parte ho messo un’area con le regioni del nord con l’aggiunta di Toscana e Marche – definendola per comodità “ITALIA NORD”, per un totale di 33 milioni di abitanti; dall’altra parte ho messo il resto d’Italia , definendolo “ITALIA SUD” per un totale di 27 milioni di abitanti.
      Ho calcolato la media pesata di Rt per ogni area (pesi calcolati come rapporto popolazione regione/popolazione area).
      Sono usciti questi risultati ( spero ovviamente di non aver sbagliato i calcoli)
      Rt “ITALIA NORD” : 0,52 ( min 0,41 ; max 0,63)
      Rt “ITALIA SUD” : 0,56 ( min 0,33 ; max 0,85)

      Ho calcolato anche la media pesata di RT su tutto il territorio nazionale ( pesi calcolati come rapporto popolazione regione/popolazione complessiva Italia) :
      Rt “ITALIA TUTTE LE REGIONI” : 0,54 ( min 0,38 ; max 0,73)

      Se questo approccio di pesatura è corretto, concordo con lei che un calcolo a livello più alto di quello regionale ha molto senso e può dare al pubblico una informazione più equilibrata senza causare isterismi alle regioni con poca popolazione e pochi casi.

      Per completare il discorso faccio invece più fatica a comprendere come in un modello non debba obbligatoriamente entrare la variabile del numero degli asintomatici ( e magari anche i risultati degli screening) ma capisco che è un discorso difficile che avrebbe bisogno di maggiore approfondimento e di maggiori conoscenze da parte mia.

      Elimina
    3. Gli asintomatici non rientrano nei calcoli italiani perché per la classificazione dellla data del contagio si fa riferimento al giorno di insorgenza dei sintomi che, in generale, è antecedente - anche di molto - rispetto alla data di esecuzione del tampone. Per molte regioni la stima di R viene fatta considerando a malapena il 30% dei contagi rilevati. Questa è una ulteriore causa della debolezza della stima.

      Elimina
  2. Mi sono scordato di indicare una informazione che può essere interessante. Nell'area ITALIA NORD come definita sopra sono stati rilevati 199.852 casi pari all'88 % del totale nazionale, mentre nell'area ITALIA SUD sono stati rilevati 27.372 casi pari al 12% del totale. I dati sono quelli del documento ISS di sorveglianza COVID al 20 maggio 2020.

    RispondiElimina