mercoledì 18 novembre 2020

Perché l'indice R NON ha valore predittivo

Si discute molto - e spesso a vanvera - a proposito dell'indice di riproduzione del contagio R (molti lo chiamano Rt). Considerata l'attualità della discussione e l'uso che se ne fa in Italia, vorrei riassumere in questo post alcuni punti importanti relativi alla sua stima. 

Prima di entrare nel dettaglio tecnico vorrei ricordare come nasce l'indice R e quale è il suo significato originale. L'indice di trasmissione del contagio ci fornisce una stima del numero di persone a cui (in media) ciascun infettato trasferisce il contagio. Quando il valore dell'indice supera 1 vuol dire che i nuovi contagi crescono, quando scende sotto ad 1 i nuovi contagi diminuiscono. Nel caso in cui il valore dell'indice si stabilizzi intorno ad 1, il numero dei nuovi contagi rimane più o meno costante nel tempo.

Il processo del contagio è molto complesso ed il valore di R dipende da una molteplicità di fattori microbiologici, medici, fisici, chimici, ambientali e sociali. Oltre naturalmente dalla composizione della popolazione ed, in particolare, dalla frazione di persone che abbiano acquisito (essendo già stati contagiati o tramite vaccino) una specifica immunità per il virus.

Quando un virus sconosciuto (come il SARS-CoV-2) incomincia a circolare tra una popolazione che non lo ha mai visto, tutti possono essere contagiati (si dice che sono suscettibili all'infezione), nessuno adotta comportamenti sociali o utilizza strumenti atti a limitare i contagi e quindi il virus è libero di circolare. In queste condizioni, il valore dell'indice di trasmissione del contagio viene chiamato R0. Per il SARS-CoV-2 questo valore è compreso tra 2,5 e 3. Questo valore potrebbe aumentare nel caso in cui, in futuro, dovessero diffondersi nuovi ceppi virali più contagiosi rispetto a quelli attualmente in circolazione.

Man mano che le persone, spontaneamente o perché costrette dai loro governanti, adottano azioni per limitare la circolazione del virus (distanziamento sociale, lavaggio delle mani, uso della mascherina, ecc.) il valore di R scende. Il valore di R dipende criticamente anche dalla capacità di individuare le persone contagiose (anche asintomatiche) e di porle prontamente in isolamento fino all'avvenuta guarigione. Finché la gran parte delle persone è ancora sensibile al virus il valore di R può essere ridotto dall'adozione di regole di salute pubblica, dal comportamento dei singoli e dalla capacità di individuare e di isolare prontamente le persone virologicamente positive. C'è poi un ulteriore effetto che incide sull'indice ed è quello che in inglese viene chiamato harvesting (raccolto). L'indice è più alto quando ci sono in circolazione molte persone fragili (con un sistema immunitario indebolito). Una volta "raccolte" queste persone, l'epidemia si calma per un po' fino a che, a causa del naturale processo di invecchiamento, si rende disponibile una nuova "messe" di persone fragili. Le ondate che caratterizzano una epidemia possono essere descritte (in modo molto elementare) come una oscillazione dell'indice R intorno al valore critico che è pari ad 1.

Prima o poi si osserva comunque una tendenza di R verso valori più bassi dovuta alla cosiddetta immunità di gregge che si verifica quando una frazione abbastanza grande della popolazione ha acquisito gli anticorpi che la rendono immune al virus. La percentuale minima p della popolazione che deve acquisire gli anticorpi per poter ragionevolmente parlare di immunità di gregge è data dalla equazione:

p = 1- 1/R0

In assenza di un vaccino, l'immunità di gregge è solo una chimera perché le popolazioni sono soggette ad un continuo ricambio ed i nuovi nati non nascono con una immunità innata. Inoltre non è detto che chi ha già fatto la malattia ( o sarà vaccinato) rimanga immune per sempre (quanto duri effettivamente l'immunità acquisita non lo possiamo ancora sapere).

Il valore di R non lo possiamo "misurare", ma lo possiamo solo "stimare" sulla base dell'andamento dei nuovi contagi. La differenza tra "misura" e "stima" è sostanziale: una stima richiede l'adozione di un modello che contiene al suo interno molti parametri, alcuni espliciti ed altri impliciti. A seconda del modello adottato e dei valori assegnati ai parametri del modello stesso, il risultato della stima può cambiare notevolmente.

Poiché i contagiati asintomatici sono più difficili da individuare e non ci forniscono un riferimento temporale certo per risalire alla data del contagio, in genere le stime di  R si fanno considerando solo i casi sintomatici, classificati in base alla data di comparsa dei sintomi. Non importa se i sintomi sono lievi o gravi. L'importante è che ci sia una data certa per l’inizio dei sintomi.

Anche considerando solo i casi sintomatici, c'è comunque una grossa approssimazione, perché noi sappiamo che il tempo mediano tra il momento del contagio e la comparsa dei sintomi è pari a 5 giorni (parlo del SARS-CoV-2, naturalmente). Tuttavia il valore del singolo caso potrebbe variare da circa 2 giorni fino a due settimane. Possiamo fare delle ipotesi più o meno arbitrarie sulla distribuzione di probabilità del tempo che intercorre tra contagio e comparsa dei sintomi. Sono - lo ripeto - ipotesi "ragionevoli", ma comunque basate su modelli arbitrari difficilissimi da verificare sperimentalmente. Questo porta ad un rimescolamento delle date del contagio che si riflette fatalmente sulla accuratezza della stima di R, soprattutto nei periodo in cui l'indice è soggetto ad un forte cambiamento. Per questo motivo bisogna sempre aspettare almeno due settimane prima di vedere gli effetti sui contagi dovuti ad eventuali misure di limitazione  della mobilità sociale.

Un grosso problema legato alla stima di R è quello dell'affidabilità dei dati relativi ai contagi. Come dicono gli inglesi: "garbage in, garbage out". Ad esempio, se si calcolasse  R con i numeri dei contagi ufficiali del Trentino misurati nel corso del corrente mese di novembre si troverebbe un valore prossimo ad 1, ma sarebbe una stima completamente falsata dalla mancanza dei dati dei sintomatici rilevati solo con i tamponi antigenici

In generale, quando abbiamo a che fare con territori di dimensioni limitate il numero di casi da analizzare non è mai molto grande come valore assoluto (anche se può essere altissimo in proporzione al numero di abitanti). Come sempre in statistica, le fluttuazioni dei dati riducono l'attendibilità della stima. Per ovviare a questo inconveniente si media il risultato della stima su un congruo numero di giorni.

In Germania, il dato è calcolato solo a livello nazionale e viene mediato su 4 oppure 7 giorni. Un ulteriore ritardo di circa 4 giorni interviene a causa della necessità di raccogliere e classificare i dati. I tedeschi usano una tecnica chiamata nowcasting per ridurre al minimo l'intervallo di tempo tra la data in cui si valuta la stima ed i giorni durante i quali i dati sono stati raccolti. In questo modo, giornalmente, forniscono una stima aggiornata di  R non più vecchia di 11 giorni.

In Italia, ci siamo intestarditi nel fare una stima su base regionale che per le Regioni/PPAA più piccole non ha molto significato statistico. I campioni sono troppo piccoli e bisogna mediare su ben 14 giorni per avere una stima che non abbia un eccessivo livello di incertezza. Poiché ci mettiamo una settimana per elaborare i dati, risulta che i valori di  R su cui il nostro Paese ha incentrato le sue politiche di contenimento dell'epidemia sono costruiti su dati che abbiamo iniziato a raccogliere tre settimane fa, mediati sull'arco di ben due settimane. 

Faccio un esempio concreto per spiegarmi meglio. Se andiamo a vedere l'ultimo rapporto dell'ISS relativo al Trentino scopriamo che R = 1,32 (CI: 0,93 - 1,74). Cosa vuol dire questa notazione? Il valore medio dell'indice è 1,32, ma c'è una probabilità del 95% che il vero valore dell'indice cada all'interno di un intervallo che va da 0,93 (notate, addirittura minore di 1) fino a 1,74. 

Una domanda che ho fatto molte volte ai miei studenti di Fisica: "sulla base di questi dati potreste discriminare se il valore dell'indice sia minore di 1, compreso tra 1 e 1,25, compreso tra 1,25 e 1,5 oppure superiore ad 1,5"? La risposta giusta è NO e tutti gli studenti che mi hanno risposto SÌ sono stati immediatamente bocciati. Purtroppo l'Istituto  Superiore di Sanità usa questi dati per assegnare il colore delle zone. Che sia una valutazione incongruente non lo dico solo io, ma anche tanti illustri colleghi a cominciare dal prof. Parisi, presidente dell'Accademia dei Lincei.

Forse qualcuno in ISS si è preoccupato di queste critiche. Infatti se andate a vedere un'altra parte dello stesso documento trovate la tabella dei dati utilizzati per l'assegnazione dei "colori" dove per il Trentino (inizio pag.3) viene riportato per R il seguente valore 1.3 (CI: 1.21-1.4). Il valore medio è più o meno lo stesso riportato sopra (parliamo - lo ricordo - di parti diverse dello stesso documento ufficiale), ma l'intervallo di confidenza si è ristretto ed è circa un quarto del valore precedente. Come sia possibile che nello stesso documento l'ISS riporti stime così differenti è un mistero che non sono riuscito a chiarire. La stessa cosa è successa per tutte le altre Regioni/PPAA e - a mio avviso - mina sensibilmente la credibilità degli indicatori adottati da ISS.

Passiamo ora alla seconda domanda d'attualità: la stima dell'indice R ha valore predittivo, ovvero ci consente di fare previsioni almeno a medio termine? La risposta giusta è NO! Mi spiace criticare il lavoro di un collega, ma spero che quello che riportano vari mezzi di informazione sia solo frutto di un fraintendimento. Comunque se qualcuno volesse sostenere che sono io ad essermi sbagliato, è invitato a scrivermi e sarò lieto di pubblicarlo.

Le mie affermazioni sono basate sulle seguenti argomentazioni:

  1. Aldilà dell'incertezza statistica, la stima dell'indice fotografa la situazione della circolazione del contagio vecchia di due-tre settimane. Supporre che l'indice possa essere utilizzato per fare previsioni presuppone che nel frattempo nulla sia cambiato in termini di comportamenti sociali, condizioni ambientali e norme di salute pubblica. Questa è una ipotesi irragionevole e del tutto arbitraria.
  2. A brevissimo termine (pochi giorni) possiamo anche supporre (sperare) che le cose non siano cambiate troppo, ma man mano che passa il tempo l'ipotesi diventa sempre più debole. In altre parole, possiamo fare delle estrapolazioni basate sull'assunzione (non provata) che le condizioni di propagazione del contagio siano immutate nel tempo, ma questo non ha nulla a che fare con quello che si definisce "valore predittivo".
  3. Ma allora potremmo chiederci, perché i dati reali stanno comunque all'interno di una specie di forbice che si allarga con il progredire del tempo? Questo è un effetto dell'ampio margine di incertezza legato alla stima dell'indice. La forbice si calcola assumendo che il valore dell'indice corrisponda al valore minimo dell'intervallo di confidenza oppure al suo valore massimo. Ecco che paradossalmente, siccome la stima è molto incerta allora bene o male i dati reali cadono comunque all'interno della forbice.
  4. Ci sono metodi alternativi per fare proiezioni a medio termine? Purtroppo NO. I modelli matematici sono utilissimi per farci capire qualitativamente l'andamento dell'epidemia, ma il sistema è troppo complesso (non-lineare e non stazionario) per essere descritto da un semplice modello matematico. Un modello meno grossolano dovrebbe tener conto, ad esempio, dei cambiamenti che intervengono non solo nelle misure di salute pubblica, ma soprattutto nei comportamenti sociali. Bisognerebbe integrare i big data relativi ai contagi, alla cura dei pazienti Covid ed alla mobilità delle persone con metodi di intelligenza artificiale. Si tratta di progetti molto complessi che sono ancora in una fase di sviluppo abbastanza primitiva e che - per il momento - non garantiscono ancora una adeguata affidabilità.
In conclusione, credo che in Italia l'inusuale e - per me incomprensibile - rilevanza data alla stima dell'indice di trasmissione del contagio ci abbia fatto perdere un sacco di tempo ed abbia generato una grande confusione in testa a troppi decisori politici. Tutti ne parlano, ma pochissimi sanno di cosa stanno parlando. Una sorta di pandemia informativa che alla fine finisce per danneggiare tutti noi.

2 commenti:

  1. Relativamente alla problematica dei valori di Rt diversi nel documento di monitoraggio ISS uscito in data 13 novembre (report 26) io l’ho capita cosí. Il dato Rt presente nelle singole schede regionali è quello medio su 14 gg, nel caso specifico nel periodo 22 ottobre- 4 novembre.

    Il dato che viene inserito nel documento di monitoraggio è invece il valore di Rt calcolato a metà periodo e cioè al 28 ottobre.

    In effetti facendo i conti si vede che il valore medio ha un rapporto tra l’estensione dell’intervallo di confidenza e la stima di Rt medio a 14 gg è pari al 61,12 % ( con min 21,68% e max 121,97%).

    Per quanto riguarda Rt puntuale il rapporto tra intervallo di confidenza e stima di Rt puntuale è per contro mediamente pari al 12,30% ( con min 0,68% e max 45,80%) per cui con un margine di errore molto limitato. Credo sia giusto cosí dato che questa stima puntuale fatta in una data specifica ( 14 gg prima di quella del documento ISS) che determina per le regioni l’assegnazione della fascia gialla, arancione o rossa.

    Mi sembra di intuire inoltre che un margine di errore limitatissimo per Rt puntuale come è successo ad esempio per la Lombardia ( Rt puntuale 1,46 con min 1,45 e max 1,46) è legato sia alla naturale abbondanza di dati che alimentano la stima , sia (forse) ad una certa stabilità nella crescita lineare del parametro Rt nel corso del periodo esaminato.

    Non so se ho detto cose inesatte.

    RispondiElimina
  2. Difficile commentare se ISS non chiarisce quali siano le metodologie di calcolo dell'indice.
    Mi pare di intuire che su questi parametri ci stiano mettendo le mani troppe persone e che non sempre queste persone si parlino tra di loro.
    Considerato che sono i parametri chiave su cui si gioca l'assegnazione cromatica delle Regioni/PPAA ritengo che ISS abbia il dovere di chiarire al più presto cosa stia accadendo

    RispondiElimina