Sul sito del Ministero della Salute è disponibile un documento nel quale vengono presentati gli indicatori utilizzati per classificare le Regioni/PPAA all'interno delle classi di rischio giallo/arancio/rosso che determinano le nuove condizioni di lockdown più o meno esteso.
Come notato giustamente da molti, i dati sono aggiornati allo scorso 25 ottobre e proprio oggi dovrebbe essere rilasciato un nuovo aggiornamento settimanale. In attesa di vedere i nuovi dati sono andato a leggermi il documento del Ministero, cercando di capire un po' meglio la logica che c'è dietro alle decisioni assunte.
Vi dico subito che il documento (in realtà una presentazione utilizzata per una conferenza stampa) è abbastanza complesso e - a mio parere - le scarne note non aiutano molto a comprendere il significato di alcuni parametri. Sono sicuro che siano disponibili anche documenti più estesi che spieghino in dettaglio come sono stati analizzati i dati e non sarebbe stato male che, magari in fondo alla presentazione, fosse stata inserita una lista con i documenti di riferimento più importanti.
Proprio per la complessità del documento e per la scarsità di spiegazioni relative alle metodologie di stima di alcuni parametri non sono - al momento - in grado di esprimere un parere tecnico esaustivo sulla "robustezza" dell'analisi fatta dai tecnici ministeriali ed, in particolare, sul "peso" assegnato ai diversi indicatori. I parametri utilizzati si raggruppano in tre categorie principali: a) indicatori di processo sulla qualità di monitoraggio, b) indicatori di processo sulla capacità di accertamento diagnostico, indagine e di gestione dei contatti e c) indicatori di risultato relativi alla stabilità di trasmissione e alla tenuta dei servizi sanitari.
Il primo gruppo di indicatori è legato sostanzialmente alla capacità di raccogliere e trasmettere al Ministero i dati relativi allo sviluppo della pandemia in ciascuna realtà territoriale. Tre dei quattro indicatori appartenenti a questa categoria sono sostanzialmente inutili perché sono molto vicini a 100 per tutte le Regioni/PPAA. Sorprende che a fronte di una ben nota difficoltà mostrata da molte Regioni/PPAA nel fornire dati completi ed affidabili, ci sia scarsa traccia di tali difficoltà negli indicatori adottati. L'unico parametro per il quale si osserva una qualche discordanza è quello identificato come 1.1 ovvero il rapporto tra il numero dei casi sintomatici per il quale viene indicata la data di inizio sintomi diviso per il numero complessivo dei casi sintomatici notificati al Sistema di sorveglianza nazionale. Il dato viene calcolato sull'arco dell'ultimo mese. Ovviamente se si dilatano i tempi per l'esecuzione del tampone molecolare ai sintomatici che sono risultati positivi al test rapido antigenico, si tolgono dalla statistica molti casi e la trasmissione dei dati può apparire molto buona. Peccato che rifletta solo una parte della situazione.
La seconda categoria di indicatori è impaginata in modo errato (invertita con la terza) e la trovate alla fine della presentazione, salvo dover tornare indietro per leggere gli indicatori della seconda categoria. L'indicatore 2.1 è - secondo me - quello più debole perché viene svilito il ruolo delle attività preventive che le Regioni/PPAA dovrebbero svolgere a protezione di ospedali ed RSA (i tamponi di screening fatti sulle categorie a rischio non contano praticamente nulla). Mi sembra una pessima scelta. Sui numeri relativi al tempo che passa tra comparsa dei sintomi ed esecuzione del tampone molecolare e quelli sul numero di persone dedicate al contact-tracing (indicatore 2.2 e 2.4) mi pare che molte Regioni/PPAA abbiano fatto sfoggio di una spudorata fantasia.
Passando alla terza categoria di indicatori, incomincio a non capirci più nulla. L'indicatore 3.1 - immagino - dovrebbe essere normalizzato rispetto ad un campione di 100.000 abitanti (?), ma se confronto i valori con quelli della tabella rilasciata la scorsa settimana dall'Istituto Superiore di Sanità, trovo valori completamente diversi. Sono forse solo i casi sintomatici? Quale è il livello di sintomi per definirli tali? Come è possibile che il Trentino presenti il valore più alto d'Italia (161.6), ben superiore rispetto a quello di Regioni come Lombardia (100.8) e Piemonte (110.4) dichiarate zona rossa? Tanto per capirci, l'Alto Adige riporta come valore 113.9.
Anche sul (da me criticatissimo) indice di trasmissione del contagio i numeri non tornano. Ad esempio, per la Lombardia il dato pubblicato la settimana scorsa era 2.09 (C.I 1.77 - 2.3) che nel nuovo documento diventa 2.01 (C.I. 1.95 - 2.05). Analoghe differenze si trovano per tutti gli altri. La cosa che vorrei farvi notare è il netto restringimento della barra d'errore (ampiezza dell'intervallo di confidenza C.I.): il dato lombardo comunicato venerdi scorso aveva un intervallo di ampiezza pari a 0,53 che improvvisamente diventa 0,1. Non male come miglioramento della qualità della stima. Come è accaduta questa magia?
Riservandomi di esprimere un giudizio più completo quando sarò riuscito a leggere i documenti di riferimento, non mi pare che l'insieme di parametri adottati sia ottimale e credo che si debba fare ancora molto per garantire l'effettiva trasparenza dei dati e della loro analisi.
Anche in questo caso si può dire che, pur avendo avuto molti mesi per prepararci, siamo arrivati all'appuntamento un po' in affanno. Prababilmente la scelta di affidarsi a parametri "oggettivi" uscita dal cilindro per trovare un punto di equilibrio tra Stato e Regioni/PPAA ha colto i tecnici ministeriali impreparati e ci hanno servito quello che avevano a disposizione (anche tenuto conto dei dati molto lacunosi forniti da molte Regioni/PPAA). Come analista di dati, ritengo che si potesse (dovesse) fare molto meglio.
Potrebbe essere interessante avere
RispondiEliminadei post da parte sua per commentare
i singoli parametri ed il loro andamento recente,
al limite accorpandone due o tre insieme per ogni post.
Volentieri, appena il Ministero della Salute renderà noti dati più completi. Al momento le informazioni sono ancora troppo poche. In particolare non si capisce bene quale sia il peso dato ai diversi parametri. Immagino che ci sia un qualche tipo di algoritmo e delle soglie utilizzate per la classificazione all'interno dei tre "colori". Inoltre mi pare di aver sentito che (giustamente) sia stata introdotta una "isteresi" per evitare di oscillare tra colori vicini con cadenza settimanale (con tutti i problemi conseguenti dal punto di vista organizzativo). Vedremo nei prossimi giorni quale sarà il livello di dettaglio delle informazioni che saranno rese pubbliche.
RispondiElimina