Esponenziale.

Esponenziale.

Insieme al prof. Enzo Marinari, fisico della Sapienza di Roma, e con la supervisione e l’aiuto del prof. Giorgio Parisi, abbiamo sviluppato una piccola analisi della attuale epidemia di coronavirus in corso nel nord Italia.

Oltre all’analisi tecnica, è possibile in breve stabilire che:

  • Il tempo di raddoppio dei casi è attualmente leggermente inferiore a 4 giorni (EDIT: è di poco più di due giorni, vedi nota aggiunta sotto);
  • L’andamento dell’epidemia italiana ricorda molto quello dell’epidemia in Sud Corea, ove struttura della popolazione e sistema sanitario sono abbastanza paragonabili;
  • Non è il momento di abbassare la guardia e sospendere le misure di mitigazione, ed anzi conviene espanderne alcune ove possibile (ad esempio il telelavoro).

Trovate qui il documento.

EDIT:
L’ottimo Marco Pagani ci segnala una svista, che abbiamo provveduto a correggere. Abbiamo erroneamente indicato come “tempo di raddoppio” nel documento originale il tempo caratteristico dell’esponenziale.
Ne consegue che il tempo di raddoppio è circa pari a 2.4 giorni.

Come afferma:

“Considerando i casi in T.I. negli ultimi 6 giorni, la crescita esponenziale ha una costante di tempo di 0.2936, pari a un tempo caratteristico tau=1/k=3,4 giorni, mentre il tempo di raddoppio è t2=ln(2)/k=2.36 giorni. E’ possibile che qui sopra si sia fatto confusione tra tempo caratteristico (crescita di un fattore e=2.71828…) e tempo di raddoppio (crescita di un fattore 2)?”

Enrico Bucci

Data lover, Science passionate, Fraud buster (when lucky...)

47 pensieri su “Esponenziale.

  1. Ragazzi, di virologia capisco però qualsiasi curva esponenziale che abbia il trend in figura equivale a stimare il contagio dell’intera popolazione italiana nel giro di meno di un mese.
    Penso che una polinomiale di secondo grado approssimerebbe molto meglio la crescita con risultati meno fantascientifici.
    Considerate poi che qualsiasi statistica sarà falsata dal vincolo del numero massimo di tamponi che la nostra sanità è e sarà in grado di fare.
    Quindi in sostanza considerando la crescita del contagio molto rapida, quello che stiamo stimando è la crescita dell’efficienza del sistema di tracciamento del contagio.
    Per carità dato assolutamente interessante ma la cosa andrebbe chiarita!😉

    1. E’ proprio per evitare il problema del campionamento dei tamponi che abbiamo fittato casi gravi (e morti), ed è per questo che siamo relativamente indipendenti dalla stima di tracciamento del contagio.
      Inoltre, solo la fase iniziale dell’epidemia ha andamento esponenziale – al primo flesso, la curva diventerà una curva a saturazione.

      1. Forse magari c’è già nel sito e non l’ho trovata: sarebbe possibile aggiornare il grafico di giorno in giorno, per verificare sia l’andamento della curva cumulata reale, ma anche la curva “di best fit”, tanto per aver un’idea di quando ci sarà un eventuale flesso. grazie mille.

  2. Ok, la distribuzione dei dati (ancora pochi per la verità) fa pensare a un bell’esponenziale. Ricordiamoci che fra tutte le funzioni elementari, l’exp è quella che varia più rapidamente, in questo caso è quella che cresce più rapidamente possibile.. Quindi, se quella curva non inizia presto a flettere (punto di flesso) come per una sigmoide, significherà che le contromisure e precauzioni prese sono inefficaci. Esse avranno forse solo variato la ‘costante di tempo’ della funzione. In altri termini i guai non sarebbero ancora arrivati ma sarebbero prossimi. Cmq, se può consolare, ma non proprio tranquillizzare, nei ‘sacri’ testi di fisica sperimentale, spesso è scritto che anche una ottima interpolazione non da la certezza dei valori estrapolati. A proposito, in un ben noto trattato della vecchia URSS si sottolineava che ‘è impossibbile prevedere il futuro’.

  3. Il risultato è questo se il flusso di ingresso (numero tamponi effettuati giornalmente) rimane costante. Altrimenti non può essere accettata come analisi. Mi sembra di aver capito che si è cambiato l’approccio al tampone. Per cui di fatto abbiamo cambiato modello di stima.

    1. No. Il numero di casi gravi (morti + terapia intensiva) su cui è stato fatto il fitting non è influenzato dal numero di tamponi (naturalmente è invece influenzato dal numero di posti letto massimi disponibili in terapia intensiva: quando saranno saturati, non avremo più dati)

    1. Sono dati diversi (lei usa il totale dei positivi). In particolare, essendo la policy di campionamento piuttosto caotica al momento, i dati sui positivi (al contrario dei morti e dei ricoverati in terapia intensiva, indipendenti dal campionamento) non sono affiabili.

  4. anch’io ho fatto un po’ di esperimenti con la logistica, e la correlazione coi dati è migliore (0.996-0.999, massimizzando correlazione o minimizzando residui) dell’esponenziale (0.962 circa, fit lineare in scala log-lin). molto variabili i parametri, ovviamente, della logistica: tempo di inflessione da 8 a 12 gg, max infettati da 8000 a 16000 etc. siamo nella fase iniziale, e nei prossimi giorni diventerà più chiaro.

    con i dati di morti e ICU (peraltro un po’ scarsetti come numero) si ha pressochè lo stesso risultato. naturalmente 0.99 vs 0.96 è ancora una bella gara…

  5. Sarebbe utile, a mio avviso, mantenere aggiornata l’analisi ed eventualmente fare uso dei nuovi dati per aggiornare il modello.

  6. ho fatto un po’ di ottimizzazione dei parametri della logistica, e mi viene una cosa tipo totale infettati max circa 15700, saturazione circa il 25 marzo; terapie intensive cumulative circa 4000, saturazione circa il 31 marzo. ambedue con correlazione alla Pearson sullo 0.998, e quel ritardo che sembra plausibile

  7. ieri sera ho fatto un fit logistico al numero di pazienti intensivi con un metodo di fit non lineare di scipy; atterra da solo in un minimo unico indipendentemente dal guess iniziale, buon segno.

    la predizione, qui sotto, è che il picco è tipo oggi, e satura a 800 cumulativi. correlazione 0.998, correlazione dell’esponenziale 0.96.

    https://www.dropbox.com/s/swxnvtw6jji5qnm/Screenshot%202020-03-05%2023.37.10.png?dl=0

      1. Salve ragazzi, buone e anche belle le interpolazioni. Ma io non riesco a liberarmi dell’idea infusa da questa frase scritta da …un certo Zeldovich.
        The solution of extrapolation problems requires a careful study of the matter in each specific instance. Such problems cannot be solved in a formal manner merely by using a selected formula. This ideas was put very neatly by Kretya Patachkuvna in the book ‘Pi’, when she said “It is very ard to foresee anything, particulary if it’s in the future”.
        E in effetti, sembra che con la scelta di questa unica forma analitica (in definitiva solo sigmoidale) sarebbe come dire ‘so come andranno le cose’. Forse, sarebbe opportuno iniziare a cercar di individuare la presenza di un flesso, con i soli dati sperimentali e NON con la funzione interpolatrice scelta a priori,. E’ il flesso che separa due concavità opposte. Se il flesso è vicino (speriamolo pur dubitandone) i punti indicherebbero a una distribuzione rettilinea (in un intorno del flesso, s’intende).

      2. mah, la predizione di saturazione è sempre la stessa da due giorni (tipo 800). per gli altri è meno chiaro, dipende dal guess iniziale della saturazione (tempo di salita e ritardo sono stabili). comunque che siano logistiche è abbastanza chiaro.

      3. in ogni caso all’atto pratico per le ICU reali fa poca differenza per il momento, dato che la salita dell’exp nella logistica è quasi la stessa dell’exp puro.

      4. ehm, sì, entertaining, ma:

        1) la sigmoide ha il pregio (contrariamente all’esponenziale) di saturare a un valore finito, il che è ovviamente obbligatorio per qualunque modello. ma siccome non prendo royalties sulla sigmoide, possiamo anche usare altre approssimazioni al gradino, tipo erf o Fermi-Dirac.
        2) come determineresti altrimenti la presenza di un flesso “dai dati sperimentali” ? fittando una retta localmente ? ma in quale regione ? oppure ?

        insomma, una ipotesi va fatta e l’una non vale necessariamente l’altra.

        come update: al momento, con i dati di oggi 6 marzo, tutti i metodi non lineari convergono indipendemente dal guess iniziale (ne ho usati 5 diversi) con qualità numerica alta (correlazione, sdev, R^2). la predizione dei contagiati è circa 9000 e le ICU sui 1200 (il punto di oggi era altino). in compenso i decessi (e le guarigioni) ora convergono a valori umani, benchè probabilmente ancora troppo grandi (oggi oltre 1200, ieri 50000 :D).

      5. Inizierei, ma solo per iniziare, a “fiutare” un possibile flesso che la sigmoie (like Fermi o like la Epstein) possiede, e non da una interpolazione diretta fatta con una qualsivoglia f(t), ma valutando le differenze seconde (v Moretti ‘Analisi Matematica’ ed. Hoepli 1952) con i soli dati sperimentali i quali, a dire il vero, sono ancora pochini. Ok, la sigmiode può indicare una concreta possibile saturazione. Ma questa saturazione avverrà? Anche la f(t) nel processo di carica nel semplicissimo RC diventa asintotica, pur presentandosi costante nella sua concavità. Allora, stiamo attenti alle sigmoidi antisimmetriche, poichè in quel caso il flesso sarebbe una scelta aprioristica. Come si può essere sicuri che dopo l’augurato flesso (che vedo ancora lontanuccio) la f(t) non cambi rappresentazione analitica, diventi. oscillante magari attorno alla tangente su quel punto. Direi, pertanto, di divertirci con l’analisi numerica ma non farci prendere la mano tanto da trarre conclusioni attribuendo a esse valore epidemiologico, specialmente se allettanti.

      6. PS ho verificato che Fermi-Dirac dà gli stessi risultati (bella forza; 1-f_fermi è la sigmoide stessa) e così le funzioni di Brillouin (saturazione sui 10000 coi dati di oggi, e circa 1000 ICU). Tutta roba che ha un gradino e il comportamento esponenziale (funzioni iperboliche) asintotico. Ma naturalmente non è generale: la error function, o meglio (erf+1)/2, che pure è approssimabile da una tangente iperbolica, dà saturazione circa doppia, e la Langevin circa metà…

        Vabbè, questo per dire che più o meno basta una funzione a gradino di tipo asintoticamente esponenziale.

  8. Giusto valutare le variazioni dei ricoverati.
    Ho notato però che, ad oggi, l’incremento dei morti è leggermente più rapido di quello dei guariti… e questo ovviamente preoccupa.

  9. Il ministero ha appena rilasciato i dati aggiornati: il numero di ricoverati in terapia intensiva ad oggi è 461 (attribuendo un errore poissoniano l’incertezza è ~21), a fronte di 430 attesi dal fit di Edoardo Gorini. Un po’ sopra la predizione ma sostanzialmente in linea.

    Sarei curioso a questo punto di vedere il chi2 che si ottiene dalla aggiungendo il punto sperimentale di oggi al best fit di ieri e ovviamente i parametri del best fit di oggi.

    1. d’altra parte i morti sono di meno dei previsti (207 con la sigmoide ottimizzata alla Levenberg-Marquardt). il succo è che la sigmoide, o altre funzioni a gradino con asintoto esponenziale, sta descrivendo bene questa fase. la mia stima è che siamo circa a metà dell’evento, cioè vicini all’inflessione. la saturazione, come Gorini, mi viene poco sotto 10000 con i dati odierni.

  10. Ciao a tutti, per i profani e i non esperti, che ogni giorno sentono il “bollettino di guerra” della protezione civile senza avere adeguate ed ulteriori spiegazioni in merito, potreste riassumere in parole semplici la situazione attuale? Siamo in una situazione fuori controllo o sotto controllo? Previsioni dei modelli matematici?

      1. Buonasera, ci sono aggiornamenti dopo gli ultimi bollettini (non positivi) della protezione civile? Leggevo anche che un algoritmo avrebbe previsto per oggi, nella peggiore delle ipotesi,14.000 contagi, noi ne abbiamo “solo” la metà. Per farla breve, com’è la situazione aggiornata ad oggi?

  11. Con i dati del 07.03, il foto da un ritmo di crescita in Italia maggiore di quello coreano e, soprattutto, un ritmo di crescita in tutta l’Europa occidentale (DE, FR, BE, NL, CH) maggiore di quello italiano.

  12. Salve, Prof ho provato a interpolare il numero totale dei contagiati (compresi defunti e miracolati) fornito per ogni giorno da ilsole24ore. L’equazione differenziale dalla quale deriva la funzione esponenziale semplice (exp x) è una del primo ordine a variabili separabili. Sappiamo che essa indica che la percentuale di cui varia la f nell’unità di tempo è costante dN/Ndt=cost. Ora, il grafico che riporta detto rapporto in funzione del tempo non è affatto costante, anzi è ben rappresentato da una bell’arco di parabola positivo ovunque. Questo, almeno, entro l’intervallo coperto dai dati numerici (dal 25 febbraio a oggi 8 marzo). L’equazione allora è: dN/Ndt=ax2+bx+c, e la sua soluzione non è certo piacevole da maneggiare algebricamente. Semplificando un po, cioè usando il classico grafico Ln(N) in funzione del tempo, tale grafico è lineare ma non troppo perchè interpolato perfettamente! con una parabola concava verso il basso, e non altrettanto bene con una retta. La corrispondente equazione, ovviamente è: N=No*exp(-at.^2+bt). Vale a dire una curva di Gauss con massimo in t= 22.5 giorni (18 marzo). In quella data Nmax=14400. Per il dopo con la ‘mia’ matematica non so sbirciare minimamente. Questo risultato mi suona assurdo, o quasi, e anzi spero che io mi sia sbagliato, e che abbia ragione Zeldovich. Voi ditemi solo che ho sbagliato tutto, nel nome della gente che dovrebbe subire il martirio delle terapie intensive o dei familiari che dovessero ricorrere alle Onoranze Funebri. Poco fa, alla televisione ho sentito dire che se la situazione dovesse aggravarsi seriamente, fino al collasso sanitario, si dovranno curare solo pazienti scelti. Questo non succedeva nemmeno nella Milano della peste manzoniana. Anzi, consiglio a tutti di rileggere quei tre capitoli.

  13. Sorry for not speaking Italian, we will have to do this in English. I agree with the fact the the initial growth is exponential, but in a closed population where everyone becomes infected with a stationary growth factor the proper differential equation is dy/dt = (N-y)/N lambda y where y(t0) = y(0) = 1. I’ve tried to fit WHO data to this model and posted something on facebook and twitter about this. For the current Italian data I find N=43900 and lambda=0.245 with t starting at 1-feb-2020 with y(0) = 1, for the Netherlands I found lambda=0.364 and N=1771 with t0 at 22-feb-2020 and y(0) = 1; for the South Korean data I found lambda=0.310 N=8250 and t0 = 3-feb-2020, with China it is lambda=0.230 N=80700 at t0=22-dec-2019. So it is a search method where you solve t0 N and lambda, it is a matlab script doing this for me.

    1. Of course! We are not claiming that the exponential is a proper fit but in the initial phases … our only aim was exactly to characterize the initial epidemic phase, to understand where we were – at the time nobody yet uncovered the exponential growth of the cases. This allowed a rapid prediction of the saturation of ICU resources, with high accuracy as verified a week after our initial predictions.
      We did not intend to model the evolution of the epidemics, but only to make it clear that it was uncontained and to highlight the upcoming ICU crisis (which, unfortunately, followed precisely our model).

Rispondi a Vincenzo Fiorentini Annulla risposta

%d blogger hanno fatto clic su Mi Piace per questo: