Campionamento.

Campionamento.

Una delle domande che più frequentemente viene rivolta a chi sta analizzando i numeri dell’attuale epidemia di COVID-19 riguarda la ragione dell’alta percentuale di morti in Italia tra gli infetti (letalità del virus).

Perchè, ad esempio, nonostante in Germania si siano ormai trovati oltre 1000 individui positivi al virus, ci sono in quella nazione meno di 20 ricoverati e nessun morto, a fronte della ben più grave situazione italiana?

Per capirlo, facciamo alcune ipotesi semplificate.

La prima è che in una data popolazione, con una letalità dell’1%, si tenda all’equilibrio a trovare un 15% di casi gravi (che comprende anche l’1% che morirà) e un 85% di casi lievi (che in massima parte non richiedono ospedalizzazione, e sono detti paucisintomatici).

Assumiamo, inoltre, che perchè un paziente manifesti sintomi, debbano passare 5 giorni e perchè finisca in ospedale per l’aggravamento dei sintomi, altri 5 giorni. Assumiamo poi che, perchè il virus provochi la morte, debbano trascorrere in media un paio di settimane dal primo ricovero.

A questo punto, consideriamo uno scenario in cui l’epidemia viene scoperta in stadio avanzato (a sinistra nella figura qui sopra), proprio perchè ha procurato i primi casi gravi (caso italiano). Si focalizzeranno gli sforzi innanzitutto nella ricerca dei positivi tra coloro che stanno arrivando negli ospedali perchè i sintomi sono più gravi; si tenderà quindi a concentrarsi su quel 15% di pazienti sintomatici più avanzati.

Questi pazienti, già prima di un paio di settimane (il tempo dall’aggravarsi dei sintomi alla morte che abbiamo ipotizzato), cominceranno a morire, perchè tra di essi vi saranno già casi gravi; nell’ipotesi fatta, la percentuale dei morti sarà molto più simile alla frazione di morti sui pazienti gravi, che non sul totale degli infetti (perchè, ricordiamo, abbiamo selezionato sintomatici in stadio più avanzato rispetto ad un campione casuale), e tenderà quindi ad essere alta, se misurata durante l’epidemia. Al limite, se ammettiamo che la letalità del virus sia 1% e che il campionamento sia concentrato solo sul 15% dei pazienti più avanzati, si avrebbe una letalità apparente dai dati di campionamenti circa uguale al 6,6% (1% diviso 15%); è una “illusione ottica”, figlia del modo in cui si è campionato.

Consideriamo adesso uno scenario in cui l’epidemia viene scoperta all’inizio del suo sorgere (a destra nella figura), oppure i soggetti positivi siano cercati fuori dagli ospedali (senza controllare cioè fin dall’inizio i casi più gravi, in ospedale).

In questo caso, il campionamento sarà concentrato su pazienti paucisintomatici o asintomatici (con pochissimi casi più gravi) o perchè si è all’inizio dell’epidemia o per scelta ; nell’ipotesi fatta, non ci sarà nessun caso grave prima di una decina di giorni, e nessun morto prima di circa un mese.

Diverse strategie di campionamento su popolazioni a stadio diverso di sviluppo dell’epidemia, quindi, unitamente al ritardo con cui si aggrava e si muore rispetto a quando ci si infetta, causano una estrema variabilità tra nazioni diverse in quella che è la letalità apparente ad una certa data. Alla fine dell’epidemia, tuttavia, in entrambi gli scenari considerati la letalità convergerà al suo valore vero (1%).

Naturalmente – e purtroppo è quello che sta succedendo in Italia – questo è vero finchè non si aggiunge un terzo fattore: la saturazione delle risorse del sistema sanitario, che, ancor più che il virus in sè, fa crescere il numero dei morti, e dunque innalza la frazione di morti causata in via diretta o indiretta dal virus.

Se non ci sforziamo con le politiche di contenimento di aiutare i nostri medici ed i nostri ospedali, “diluendo” nel tempo la curva di crescita giornaliera dei casi, possiamo aspettarci conseguenze più gravi anche dallo stesso virus che altrove causerà meno danni.

Enrico Bucci

Data lover, Science passionate, Fraud buster (when lucky...)

30 pensieri su “Campionamento.

  1. Grazie professore, molto chiaro. Si può considerare quindi, la maggior “maturità” del caso italiano rispetto a quello tedesco, ad esempio, come elemento che attesti che l’epidemia nel continente si è originata qui e non che covasse sotto traccia sia qui che nel resto dell’Europa? Contraddicendo, di fatto, le varie tesi sull’impennata di “influenze” e polmoniti dei mesi precedenti in Germania, sulla metodologia di somministrazione dei tamponi e forse anche l’ipotesi del paziente bavarese come origine del contagio. Grazie

    1. Dall’articolo: “Il calcolo comunemente utilizzato (ovvero morti/casi) e che, per ora, per la Covid-19 dà come risultato un tasso di mortalità del 2% circa […]“.

      Sbaglio o, in quell’articolo, usano l’espressione “tasso di mortalita’” che corrisponde (piu’ correttamente) al “tasso di letalita’” ?

      1. Quando in tale articolo si menziona l’espressione tasso di mortalità si fa indubbiamente riferimento al tasso di letalità (fatality rate), tanto per la SARS quanto per il COVID19

  2. Un’altra ipotesi, figlia del “pensar male”, è che in Germania non dichiarino tra i deceduti “per” Coronavisurs le persone che avevano già altre patologie e che quindi queste vengano sommate tra i deceduti per polmonite, insufficienza renale, diabete e via dicendo, anche se il virus era presente nel loro organismo. In altre parole non dichiarano i deceduti “con” Coronavirus. Mentre noi dichiariamo come deceduti “per” Coronavirus tutte le persone decedute per qualsiasi patologia che risultino anche positivi al virus. Come si spiega che il primo morto accertato per/con Coronavirus in Africa sia un turista tedesco? Forse i tedeschi sono così patrioti da andare a morire all’estero? Scusi la battuta di pessimo gusto, ma che in Germania, a fronte di oltre 1.000 contagiati non ci sia nemmeno un morto per/con Coronavirus non me la bevo. E sì che i “furbi” saremmo noi italiani.

  3. Buongiorno, Enrico, sono Lorenzo Galbiati, biologo. Il tuo ragionamento è giusto, in teoria, ma non spiega nulla del caso italiano, perché non fa il confronto con le altre nazioni. Per esempio, scrivi: La Germania, 1000 infettati ma nessun morto e solo 20 ricoverati, per te è normale perché sono a uno stadio iniziale: ma in Italia quando avevamo 1000 contagiati avevamo anche circa 100 persone in terapia intensiva e circa 300 morti. Quindi come la mettiamo? In Cina, che sono molto più avanti di noi, in termini di contagio della popolazione, non hanno mai avuto, nell’ultimo mese, una letalità cresciuta molto e che si avvicini al 5%, quindi, di nuovo come la mettiamo? Ed evito di parlare della Corea che ha un numero di casi simile all’Italia ma un numero di morti sotto i 100. Mi pare quindi che questo procedimento che illustri, di per sé ineccepibile, non spiega per nulla il caso italiano, il quale, ti faccio presente, è partito con (mi ricordo ancora, era domenica 23 febbraio e l’ho scritto su facebook) 26 casi in terapia intensiva su 132 contagiati, il 20%, poi si è stabilizzato sul 10%, e ancora oggi è sul 10%.

    1. È proprio il fatto che siamo che siamo partiti con casi gravi, che ha causato il bias di campionamento, che ha causato a sua volta la differenza arrivati a 1000 contagiati. Come specifico, dipende da ciò che si decide di campiobare preferenzialmente: sintomatici e gravi spostano verso più morti fin dall’inizio. Senza contare gli sltri effetti descritti.

      1. Non capisco la risposta: l’Italia ha tamponato all’inizio tutti i possibili contagiati, anche se asintomatici, e infatti il governo si è pure vantato del numero elevato di tamponi fatti! E solo di recente hanno cominciato a dire di tamponare solo i sintomatici, probabilmente perché sennò i tamponi avrebbero cominciato a scarseggiare. Non capisco nemmeno cosa intendi con gli altri effetti descritti, dal momento che, ripeto, si sono verificati solo in Italia e non anche in Cina e Corea.

      2. Aggiungo: il raginonamento di Bucci presuppone che in Italia l’epidemia sia stata scoperta in fase più matura e che in Germania questa fase non sia ancora arrivata. Ma la Germania a quanto pare è stato il primo paese europeo a contrarre il virus, quindi in teoria la Germania dovrebbe essere in una fase più avanzata che in Italia, non meno.

  4. Per onestà, ti dico il mio ragionamento: il tasso di letalità è cresciuto in Italia perché 1) è in atto quel che dici 2) si è passati da tamponare indiscriminatamente a tamponare solo i sintomatici 3) perché hanno iniziato a fare una selezione in terapia intensiva. Questo potrebbe spiegare l’aumento della letalità in Italia ma non spiega perché in Italia il tasso di letalità (e anche il numero di ospedalizzati (quasi metà in lombardia!!!) e il numero di quelli in terapia intensiva) sia più alto che in Cina, in Francia, in Germania ecc. insomma, abbiamo un brutto record. PS Delle mie tre ipotesi, solo il collasso dei posti in terapia intensiva potrebbe essere una spiegazione del record italiano di letalità.

    1. Beh, volendo c’è anche un’altra spiegazione: gli altri raccontano balle, e almeno per la prima delle tre direi che è semplicemente ridicolo dare credito alle cifre che comunicano, viste tutte le esperienze passate, recenti e meno recenti.

  5. Però, se dici che NON E’ COSì, dovresti spiegare in base a cosa (magari qualche dato ufficiale comparato?) sostieni che in Italia fin dall’inizio si sono tamponati solo quelli con sintomi gravi mentre nel resto del mondo hanno tamponato sintomatici e asintomatici. Se è una tua impressione priva di fondamento verificabile, ok, siamo al confronto tra impressioni diverse – e io almeno potrei citarti gli articoli di giornali che dicono che in Italia all’inizio si tamponava tutti e solo dopo si è deciso di tamponare i sintomatici. Tu cosa puoi citare? Perché sai, io vorrei tanto sbagliarmi, ed essere convinto da te, ma avrei bisogno di qualche spiegazione suffragata da dati verificabili. Un saluto

  6. Data: 26 febbraio: “Da oggi verranno eseguiti i tamponi per il coronavirus “solo sui soggetti sintomatici” (LIVEBLOG – FONTANA A SKY TG24: “CONTAGIATI IN MODO LIEVE 4 MINORI” – IN CALO IL NUMERO DEI CONTAGI IN CINA). Lo ha detto il direttore del Consiglio Superiore di Sanità Franco Locatelli alla protezione civile. I tamponi effettuati finora “hanno dato nel 95% dei casi esito negativo”, ha spiegato, confermando che il rischio contagio “è elevato nei soggetti sintomatici mentre è marcatamente più basso nei soggetti asintomatici”. Da qui la “scelta di eseguire i tamponi solo sui soggetti sintomatici, visto che siamo in un periodo di pandemia”. Ad oggi sono stati effettuati 9462 tamponi in Italia e sono emersi, finora, poco più di 370 casi positivi. 23 le province interessate dal contagio in 10 regioni italiane.” Direi che possiamo escludere che i tamponi si siano concentrati sul 15% dei casi gravi, come supposto nell’articolo.

  7. Buongiorno, grazie infinite.
    Aggiungerei un quarto fattore che è la maggior incidenza sulla popolazione degli ultra ottantenni, che hanno percentuali di ricovero, rianimazione e letalità n volte superiore.
    Saluti

  8. Buongiorno, grazie per l’articolo.

    Come penso molti in questi giorni, sto cercando di capire di più come leggere i numeri del Covid-19 (con la dovuta premessa che io sono assolutamente ignorante in medicina e della statistica ne capisco la complessità ma non la padroneggio), e le chiedo se potrebbe aiutarmi in tal senso.

    Ho parecchie domande, anche risposte parziali o solo ad alcune sarebbero le benvenute 🙂

    1) In generale, come si fa a determinare il tasso di letalità di una determinato virus su persone affette da una o più patologie?
    Mi spiego: paziente A affetto da patologia X e virus Y, muore. Come si fa a distinguere se è morto “per Y” o solamente “con Y”?
    Più nel profondo: ha senso questa mia domanda di distinzione tra “per Y” e “con Y”?
    A logica (viziata però dalla mia ignoranza di cui sopra), mi verrebbe da dire che un procedimento del tipo:
    – su 100 pazienti affetti da patologia X ne muoiono il k%.
    – su altri 100 pazienti affetti da patologia X e virus Y ne muoiono il z%.
    Ecco, in questo caso avrei dei dati statistici per quantificare la letalità di Y, ma non so se ho detto una corbelleria o se magari si fa così o altro; riuscirebbe a chiarirmi questo punto?
    Quando muore una persona, il medico gli assegna una *e una sola* causa di morte sempre e comunque (ed in questo caso come decide quale?), oppure ne effettua una ripartizione a varie concause da far rientrare nel computo statistico?

    Help me 🙂

    2) In generale, ha senso accorpare/mostrare il numero di morti di un determinato virus Y per “zero o una patologia”?
    Mi riferisco a quanto pubblicato dall’ISS e riportato da numerosi quotidiani:
    http://www.salute.gov.it/portale/news/p3_2_1_1_1.jsp?lingua=italiano&menu=notizie&p=dalministero&id=4163
    “Complessivamente, l’15.5% del campione presentavano 0 o 1 patologie, il 18.3% presentavano 2 patologie e 67.2% presentavano 3 o più patologie. La comorbidità più rappresentata è l’ipertensione (presente nel 74,6% del campione), seguita dalla cardiopatia ischemica (70,4%) e dal diabete mellito (33,8%).”
    Di nuovo mi trovo spiazzato.
    Da profano in medicina mi sembra assurdo accorpare/presentare il dato grezzo “15,5%” dato dalla somma di chi aveva zero patologie e di chi ne aveva una, e chiedo appunto lumi se questa è una pratica “standard” in medicina, o altro.

    1. Se un cardiopatico è coinvolto in un incidente stradale e muore per arresto cardiaco secondario ad emorragia, l’incidente stradale sarebbe (intuitivamente) il fattore scatenate e non certo la preesistente cardiopatia.

      Da profano leggo che si tratti di persone morte “con la polmonite” che fino ad allora avevano patito eventuali patologie croniche senza esiti fatali. La probabilità di morire “con la polmonite”, data la presenza concomitante di altra patologia, potrebbe essere (plausibilmente) maggiore ma la polmonite rimane il fattore scatenante.

    2. In attesa che le risponde l’estensore dell’articolo, credo nessuno ne avrà a male se inizio a darle le mie risposte, ben contento se altri sarà più preciso di me. 1) Quando si muore, c’è la causa di morte, che fa l’Istat, controllando tutti i dati, di solito a distanza di due anni. Per esempio per l’Istat i morti per influenza sono di solito da 50 a 100, mentre le complicazioni sono molte di più (le illazioni arrivano fino a 8000 ma non verificate), anche se non verificate. Esempio: se uno muore per infarto, non può essere l’influenza o il coronavirus la causa diretta di morte, ma al massimo una concausa. Se uno muore per insufficienza respiratoria, quella è appunto la conseguenza più grave del coronavirus. 2) No, non ha senso, dato che tra 0 e 1 c’è una bella differenza, direi molto di più che tra 1 e 3.

  9. Ho trovato questo articolo sulla Germania: da loro l’età media dei contagiati è 40 anni, fino all’altro ieri, da noi, stando sempre all’articolo, è di 60 anni. Direi che questa differenza di età possa spiegare bene, almeno in parte, la differenza tra il tasso di letalità tedesco e quello italiano: “Nella consueta conferenza stampa del lunedì con il ministro della Sanità Jens Spahn, il direttore dell’Istituto Koch, Lothar Wieler, ha spiegato che è un puro caso che ci siano ancora così pochi morti in Germania, rispetto all’Italia: “L’eta dei casi in Italia è diversa: l’età media dei morti è 80 anni, e in Italia sono stati intercettati dei contagiati meno giovani”. In Germania, invece, “il 70% dei casi ha tra 20 e 50 anni, e l’età media degli infettati è 40”. In Italia, secondo dati ufficiali, è 60. Wieler si è anche detto convinto che “nelle prossime settimane e mesi” i dati di Italia e Germania si allineeranno. In altre parole: i morti dipendono dai focolai, dal modo in cui si è sparso il virus, dalla fascia di età che ha colpito maggiormente. “

    1. Potrebbe essere vera l’ipotesi che gli anziani in Germania siano morti in precedenza, senza che fosse stata individuata la causa nel coronavirus.

  10. Grazie. Avrei solo “capovolto” la grafica per rendere leggibile “cronologicamente” i fatti. Cioè dall’alto in basso: popolazione infetta > Tampone> mrti

  11. Prof. una domanda sciocca circa la “diffusività” di questo virus. Mi lascia un po’ perplesso il fatto che una sola toccata di superficie infetta, o la vicinanza per qualche secondo a persone infette possa definire una virulenza tale da provocare quel forte danno. Per questo mi chiedo se per la sua vigorosa moltiplicazione il virus abbia una “strada” già battuta entro ogni individuo. Strada definita ad es. dal cibo comunemente acquisito e sofisticato con fertilizzanti, coloranti, conservanti, dolcificanti e non so quant’altro usato nelle coltivazioni intensive e nelle grandi aziende multinazionali di alimentari. Latte di mucche rese forzatamente gravide (senza toro) ogni anno e vitelli tolti dalle mamme dopo il solo colostro (6 giorni). E poi carne da entrambi, carne rossa solo alla luce delle lampade del banco di vendita.. Prosciutto rosso sangue, infiltrato di grasso e molle da far schifo. Latticini ‘senza lattosio’ che latticini saranno? Tutto appare snaturato: frutta insapore, mele tutte uguali fra loro, e così i pomodori e le arance ecc. Si compra tanta plastica, il pane è secco dopo un solo giorno. E ancora smodato uso di detersivi. Nelle spiagge dell’Adriatico l’acqua è schiumosa. Stessimo raccogliendo i frutti della terra che stiamo inquinando ovunque e in ogni maniera? Non penso che la riproduttività sia da addurre solo a quel virus. Tutto quel che ho detto, però è solo idea da incompetente (quale sono), accetterei volentieri una obiezione che mi faccia riflettere seriamente. Grazie.

  12. Salve, e grazie per questi articoli molto utili alla comprensione del fenomeno. Questa spiegazione, però, se mi sembrava convincente qualche giorno fa, ora mi sembra davvero poco sostenibile. Se si fosse trattato di un bias dovuto al diverso campionamento, questo avrebbe dovuto iniziare a ridursi col passare del tempo, a meno che non si accetti che il “vero” tasso di letalità sia quello tedesco e che tutti gli altri paesi stiano osservando un campione biased concentrando i tamponi sui sintomatici. Anche se in Germania campionassero in maniera completamente un-biased (cioè in maniera completamente random) prima o poi i casi seri e le morti dovrebbero iniziare a crescere, cosa che invece non sta succedendo. Hanno (ad oggi) quasi 4k casi con 8 morti e 9 ICU. Questo davvero non si spiega. Non stanno contando correttamente i morti e i casi critici? Non stanno classificando come morti da coronavirus tutti quelli che hanno anche altre patologie? Oppure per qualche ragione in Germania l’epidemia non si è diffusa tra gli anziani? Non saprei come spiegare questi numeri altrimenti. Grazie.

    1. Al momento, possiamo solo limitarci ad osservare che i dati tedeschi sono anomali e non quadrano con nessun caso di diffusione del virus (nemmeno quello “controllato” sulla Diamond Princess).
      Per questo, bisogna necessariamente ipotizzare che il campionamento (e le attribuzioni) della malattia stia procedendo in maniera diversa.

  13. D’accordissimo su tutto. Io sono convinto che il tasso di mortalità possa essere usato in una certa maniera per stimare in un certo senso quanto l’epidemia sia sotto controllo, nel senso di “quanto si riesce a tracciare bene lo sviluppo dell’epidemia”, cosa che sarebbe essenziale nella prevenzione. Purtroppo credo che in Lombardia (ma anche in misura minore in Emilia Romagna) il virus abbia oramai superato la linea Maginot passando per le Ardenne e quindi l’epidemia è in fase molto avanzata causando quel che sappiamo sul nostro sistema sanitario. Necessario quindi agire sulla prevenzione se no al prossimo giro siamo punto a capo. Tracciare il virus è fondamentale per il suo contenimento, e il contenimento è l’unica strategia possibile. Vedendo i dati internazionali, direi che dovremmo studiarci la Corea del Sud e la sua abilità di rintracciare i movimenti di ogni pazienti che sono anonimizzati ma resi pubblici. Mentre sì, i dati della Germania sono talmente anomali che è impossibile non considerare una differenza di metodologia nel conteggio. Saluti e grazie mille del lavoro

Rispondi a lorenznewsAnnulla risposta

Scopri di più da Cattivi Scienziati

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continue reading