giovedì 8 aprile 2021

Leggere sempre bene i dati: anche quelli inglesi

I decessi Covid della Gran Bretagna mostrano un netto miglioramento rispetto al picco di fine 2020 e si stanno rapidamente azzerando. Tuttavia, se uno legge bene la definizione di decesso Covid che è stata adottata nel Regno Unito alcuni mesi fa, scopre un dettaglio che fa nascere qualche dubbio sull'effettiva consistenza dei dati. Infatti vengono classificati come "decessi Covid" solo gli eventi che avvengono entro 4 settimane dalla data di rilevazione della positività al virus. 

Andamento dei decessi in Gran Bretagna. Fonte: Center for Systems Science and Engineering (CSSE) at Johns Hopkins University
 

Durante i momenti di picco pandemico, la particolare definizione di decesso Covid adottata dalla Gran Bretagna non incide in modo particolarmente significativo sul risultato delle statistiche. Tuttavia quando - come in questo momento - si affronta la fase terminale di un picco pandemico, una parte importante dei decessi avviene all'interno della "coda" di pazienti che hanno contratto il virus anche due o tre mesi prima e che sono rimasti ricoverati in ospedale per lunghi periodi. In termini percentuali sono pochi casi rispetto al totale delle persone che erano state contagiate assieme a loro, ma questo contributo si accumula nel tempo e diventa importante in termini assoluti quando i nuovi contagi si stanno azzerando. Usando il criterio dei 28 giorni, tutti questi casi vanno "fuori statistica" ed il numero di decessi Covid si azzera più velocemente. 

Il criterio adottato dalla Gran Bretagna ha il vantaggio di fornire numeri più direttamente legati alla situazione epidemica del momento, ma rende i dati britannici più difficilmente confrontabili con quelli degli altri Paesi che contano tutti i decessi, indipendentemente dalla data del contagio.

Il sostanziale azzeramento dell'ondata pandemica è stato senz'altro un grande successo della strategia di gestione della pandemia attivata in Gran Bretagna (lungo lockdown e vaccinazione di massa), ma i numeri reali non sono così brillanti come appare dalla statistica ufficiale dei decessi Covid.

3 commenti:

  1. Hanno consegnato I DATI COVID agli studiosi “sbagliati”: quelli dei Lincei non li sanno usare
    Andrea Presbitero, economista alla SAIS della Johns Hopkins University (Bologna) – Domani - 13 aprile 2021

    Dall’inizio della pandemia molte voci si sono levate per chiedere l’accesso a dati dettagliati e tempestivi per monitorare la diffusione del Covid-19 e capire l’efficacia delle varie misure di contenimento messe in atto da governo e amministrazioni locali. A distanza di oltre un anno, questi dati non sono ancora pienamente disponibili a ricercatori e studiosi. L’ISS dichiara che i dati sono accessibili alla comunità scientifica, ma le procedure di accesso sono tutt’altro che trasparenti e lasciano ampia discrezionalità all’ISS.

    A novembre 2020 inoltre l’ISS ha siglato un accordo per la condivisione dei micro dati sia con l’Accademia dei Lincei sia con INFN. A 5 mesi da quell’accordo, Giorgio Parisi, presidente dell’Accademia dei Lincei, dichiara a Fanpage giovedì 8 aprile che all’Accademia stanno «studiando il database, e [poichè] si tratta di 1 GIGABYTE di materiale, [stanno] scrivendo dei programmi per leggere questi dati». A leggere queste parole non si può che rimanere sbalorditi ed è difficile trattenere un sorriso, che però cede il passo ad amarezza e sconforto.

    Il database che l’ISS trasferisce settimanalmente ai Lincei «contiene circa 3.5 MILIONI DI RIGHE, i dati di tutti i pazienti che sono stati registrati come malati di Covid». Queste parole rivelano quanto poco lungimirante sia stata la scelta di affidare l’elaborazione e l’analisi dei dati all’Accademia dei Lincei. Un dataset con poco più di 3 milioni di osservazioni non ha nulla di straordinario. Economisti applicati lavorano con dataset di dimensioni ben maggiori in molteplici ambiti, dal mercato del lavoro a quello del credito. Non si tratta nemmeno di avere accesso a chissà quali tecnologie: un buon laptop e l’accesso a un server sono più che sufficienti per la maggior parte delle analisi.

    Ciò che più sorprende è il seguito dell’intervista: Parisi dichiara che l’Accademia STA LAVORANDO con l’INFN per sviluppare «un sito Internet in cui, su richiesta, potremmo fornire alla comunità scientifica dei dati aggregati estratti da quel grosso database. Anche perché i dati disaggregati sono difficili da utilizzare per un'analisi. Il database in sé è utile solo come sorgente DI DATI AGGREGATI».

    La prima domanda che sorge spontanea è come sia possibile che in oltre 5 mesi questa piattaforma non sia ancora stata messa a punto e resa disponibile al pubblico. Dati e analisi SERVONO ORA, in tempo reale. Non averli avuti negli scorsi mesi ha comportato costi in termini di minori informazioni per gestire la pandemia e averli tra qualche mese sarà, speriamo, inutile.

    Dichiarare che i dati disaggregati sono difficili da utilizzare e sono utili sono a generare statistiche aggregate significa sostenere esattamente l’opposto di ciò che afferma la comunità scientifica. Le statistiche AGGREGATE sono largamente insufficienti a studiare l’evoluzione della pandemia e gli effetti delle policy. Esistono ormai molti studi che mostrano le potenzialità dei dati disaggregati per capire come meglio contrastare la crisi sanitaria.

    Con un ACCESSO LIBERO ai dati, la comunità scientifica avrebbe potuto produrre analisi e studi in grado di informare governo e amministratori locali sulle possibili conseguenze e rischi delle diverse strategie di lockdown, dall’apertura delle scuole a quello degli esercizi commerciali, su cui a distanza di mesi non c’è ancora un consenso.

    Invece, nonostante l’accesso privilegiato ai dati, nella sezione del sito dei Lincei dedicata al Covid-19, non si trovano documenti, dichiarazioni o pareri (nè tantomeno articoli scientifici) della “Commissione Lincea Covid-19” nel corso del 2021.

    Affidare in maniera quasi esclusiva dati fondamentali in un momento così drammatico a un gruppo di accademici, molti dei quali non più attivi nella ricerca da anni, si è rivelata l’ennesima occasione sprecata.

    RispondiElimina
    Risposte
    1. Ahimé, non posso che concordare con i contenuti di questo articolo.

      Elimina
  2. Coronavirus, la statistica è stata manipolata e vilipesa: si recuperi la precisione
    Nicola Cirillo - 14 aprile 2021

    Nel campo della Covid sono state schierate tante discipline: virologia, epidemiologia, infettivologia, chimica, tutte con una dignità propria da difendere e affermare, a volte a scapito delle altre. Ma una scienza in particolare, la statistica, è stata strumentalizzata solo per avallare ipotesi o condizionare l’opinione pubblica, per indirizzare scelte politiche o scelte d’affari.

    E’ stata vilipesa, manipolata per ignoranza o per malafede. Una sorella povera, ma intelligente, che - se usata bene - sarebbe in grado di mettere in riga le sorelle arroganti e meno intelligenti. Se dobbiamo appellarci a una scienza, allora, perché non alla statistica? Alla buona, onesta statistica, ovviamente.

    A volte penso che se all’università avessi esposto i dati come fanno la Protezione Civile Nazionale e l’Istituto Superiore della Sanità parlando di curve di contagi, molto probabilmente mi avrebbero bocciato all’esame di Statistica.

    Ricorderete che nei primi mesi della pandemia venivano annunciati solo dati assoluti di nuovi contagi, senza considerare il numero e la qualità dei tamponi effettuati? “Oggi i nuovi positivi sono 1550”, “oggi 300, perché è domenica”.

    Poi, per non abusare troppo della nostra ignoranza, nella comunicazione è stato introdotto l’INDICE DI POSITIVITA’, che calcola il numero di positivi sul totale dei tamponi effettuati, ma con la brillante idea di far decidere alle Regioni, in piena autonomia, cosa comunicare come “numeratore” e cosa come “denominatore”.

    Le Regioni adottano procedure legittime, ma non uniformi: la Sicilia, solo per fare un esempio, per 1 positivo al tampone rapido effettua 1 tampone molecolare, che se positivo incide nel data set come 2 tamponi effettuati per lo stesso positivo, riducendo così il tasso di positività comunicato, ma fornendo un’indicazione evidentemente errata.

    Che dire poi della superficialità con cui vengono confusi concetti come “incidenza”, “frequenza” e “probabilità” quando si parla degli eventi avversi dei vaccini? Riviste e opinionisti per tranquillizzare sugli effetti del vaccino ripetono paragoni confusi:
    - “è più probabile avere una trombosi se sei sovrappeso, fumatore e prendi l’aereo”
    - “è più probabile morire affogati nella vasca da bagno”
    - “è più probabile avere una trombosi usando un contraccettivo”

    Ma il punto è che casi avversi si sono verificati anche in soggetti non fumatori e sovrappeso. Molti una vasca non la vedranno mai in vita loro perché preferiscono la doccia, e tanti la pillola anticoncezionale non la prenderanno, perché maschi o in età non fertile. Ma tutti, magari, faranno il vaccino.

    Questi paragoni SVILISCONO la statistica, che è una scienza umile, ma precisa. Sa bene che quello che può offrire sono solo dati, elaborazioni o indicazioni, a volte aleatorie. Sa che la scelta della pallina bianca o della pallina rossa in un bussolotto riguarda le palline, non vite umane, ma fornisce il suo modello alla politica, che prenderà le decisioni più sagge – si spera – per le vite umane. Non ha l’arroganza di chi difende strenuamente una molecola, una diagnosi, una cura, salvo poi smentirsi un mese o un anno dopo.

    Perché le scienze – le altre scienze – sono fallibili: è il tempo, l’esperienza e lo studio che perfezionano molecole, diagnosi e cure. La forza delle scienze risiede proprio nella loro fragilità e nella coltivazione del dubbio, perché è ciò che le rende “PROGRESSIVE”. Il DUBBIO è quello che le distingue dalle teorie complottistiche.

    Il tempo e l’esperienza, invece, sono variabili che la statistica maneggia CON LUCIDITA’ per supportarle nella loro ricerca, nella loro abilità.

    RispondiElimina