Analisi dei dati genomici prodotti da CORVELVA sul vaccino Priorix Tetra

Analisi dei dati genomici prodotti da CORVELVA sul vaccino Priorix Tetra

di:
ENRICO BUCCI (Temple University, USA)
RAFFAELE CALOGERO (Università di Torino, Italia)
PIERO CARNINCI (Riken Institute, Giappone)

CONSIDERAZIONI PRELIMINARI

L’analisi che segue è stata effettuata in seguito a numerose dichiarazioni pubbliche dell’associazione veneta cosiddetta “free-vax” CORVELVA e del presidente dell’ordine nazionale dei biologi, dottor Vincenzo D’Anna.

Accogliendo l’invito rivolto alla comunità scientifica ad esaminare i dati e a non ignorare i presunti risultati ottenuti mi sono avvalso della collaborazione di due esperti di fama internazionale nell’ambito della genomica e del sequenziamento con piattaforma Illumina: i professori Raffaele Calogero (Università di Torino) e Piero Carninci (Riken Institute, Giappone).

Sono stati esaminati i seguenti documenti:

a) Relazione CORVELVA rilasciata online, intitolata “Vaccinegate: Report analisi metagenomiche su Priorix Tetra”, avente ad oggetto la caratterizzazione genomica del vaccino Priorix Tetra;

b) Articolo sottomesso al sito F1000, sponsorizzato da CORVELVA, intitolato ” Do you cov me? Effect of coverage reduction on species identification and genome reconstruction in complex biological matrices by metagenome shotgun high-throughput sequencing”, per la parte che riguarda l’analisi genomica dello stesso vaccino di cui al punto precedente.

Preliminarmente, è necessario osservare che nella relazione di cui al punto a) è riportata in nota a pagina 8 la seguente dichiarazione:

“the original documents are protected subject-matter by a nondisclosure agreement with the analysis laboratory and the researchers who performed the tests. All subject-matter will be presented to the investigation bodies as an attachment to a Complaint to the Public Prosecutor’s Office.”

Da questa dichiarazione si desume come il documento in questione sia stato utilizzato per ingenerare un pubblico allarme, senza al contempo mettere a disposizione della comunità scientifica e dei cittadini tutti i dati in originale, al fine di verificare le dichiarazioni rese, come ci si attenderebbe da un’analisi fatta secondo i canoni, globalmente accettati, del metodo scientifico[1].

Ci si chiede come questa pratica di segretezza, contraria ad ogni criterio di condivisione dei dati, si possa conciliare con le continue richieste di trasparenza rivolte dall’associazione CORVELVA e dal presidente dell’Ordine Nazionale dei Biologi in tema di sicurezza vaccinale: è lecito lanciare un’allarme, senza fornire tutti i dati necessari alla valutazione della sua consistenza?

Come possono la comunità scientifica ed i cittadini valutare il peso di certe affermazioni, se i dati originali completi sono tenuti segreti, in attesa che un pubblico ministero decida se e come procedere in un’azione giudiziaria?

Per quanto riguarda l’articolo sottomesso al sito F1000 per la peer review (di cui al precedente punto b), si osserva come esso sia riportato sul sito dell’ordine nazionale dei biologi come articolo sottoposto a valutazione, omettendo di riportare, come vedremo, che il documento ha in realtà passato un primo stadio di revisione ed è stato bocciato da entrambi i revisori che lo hanno esaminato. Questa omissione è fuorviante, perchè omette l’informazione più rilevante, ovvero che l’articolo è stato unanimemente giudicato scientificamente insufficiente dai revisori.

ANALISI DEL DOCUMENTO CORVELVA

Il documento in questione è relativo alle analisi di sequenziamento del DNA e RNA su due lotti del vaccino tetravalente Priorix Tetra, in grado di conferire immunità a morbillo, parotite, rosolia e varicella.

Preliminarmente, si nota una notevole incongruenza che riguarda tutte le 5 tabelle riportanti i dati di sequenziamento: il numero di sequenze (reads) totali riportate in testa ad una data tabella non coincidono con la somma di tutte le reads elencate nel prosieguo della tabella stessa. A titolo di mero esempio, si richiama la tabella relativa al sequenziamento di RNA presente nel secondo lotto di Priorix esaminato, riportata di seguito con alcune annotazioni aggiuntive.

Si può agevolmente osservare come il totale di reads indicato in alto a sinistra (evidenziato in giallo) è pari a oltre 6 milioni; tuttavia, la somma di tutte le reads divise per classe di organismo è pari a circa 5 milioni e mezzo, con un “ammanco” di oltre 700.000 reads (e una somma percentuale, indicata dal box rosso, pari a 88%).
Questa semplice addizione, ripetuta su tutte le tabelle, pone la domanda di dove siano finite le reads mancanti (una percentuale non certo trascurabile) e perchè non siano state riportate. Resta chiaramente aperta la possibilità che i ricercatori abbiamo sbagliato le somme.

Al netto di questo dubbio di carattere generale, si riassumono di seguito le conclusioni più rilevanti tratte dagli estensori del documento a partire dalle analisi effettuate:

  1. il genoma del virus della rosolia, uno dei virus attenuati necessari a conferire l’immunogenicità, non sarebbe presente;
  2. si rileverebbero i genomi di numerosi organismi contaminanti appartenenti a numerosi taxa, tra cui elminti, batteri e virus patogeni umani avventizi;
  3. vi sarebbe un’eccessiva contaminazione di DNA derivante da cellule “fetali” umane;
  4. il DNA umano rilevato sarebbe ad alto peso molecolare e la copertura del genoma umano sarebbe totale, cosicchè sarebbe l’intero genoma delle cellule fetali umane e non porzioni di esso ad essere presente nei lotti di vaccino esaminati.

In merito al primo punto, si rileva quanto segue.
Il documento in esame presenta una analisi di prova volta a calibrare correttamente il metodo di sequenziamento del DNA utilizzato per le successive indagini. In particolare, si effettua l’analisi di una miscela standard contenente DNA derivato da 20 diversi microorganismi in quantità note (misurate come percentuale di reads attese in una analisi di sequenziamento). La calibrazione effettuata è consistita nel sottoporre ad analisi il campione standard, per vedere se, con la metodica prescelta, fosse possibile rivelare tutti i microorganismi del campione con percentuali di reads non distanti da quelle attese.
A pagina 10 del documento CORVELVA si riporta una tabella così etichettata:

“Risultati dell’analisi DNA-seq eseguite con il software Kraken su uno standard genomico a composizione nota (​20 Strain  Staggered Mix Genomic Material, ATCC® MSA-1003TM​)”

La tabella è riprodotta di seguito:

Facendo attenzione alle righe evidenziate in giallo, si può notare come il metodo di sequenziamento/analisi bioinformatica utilizzato fallisce nel rilevare un microorganismo presente nello standard (prima riga in giallo dall’alto), nel senso che, laddove dovrebbero ottenersi circa 9000 reads, pari a circa lo 0,18% del totale, se ne rivelano solo 2 – un numero al di sotto del rumore statistico. Non a caso, infatti, un consistente numero di sequenze non viene assegnato a nessun microorganismo (ultima riga in basso, evidenziata in giallo), in corrispondenza della fallita identificazione del microorganismo Actinomyces odontolyticus.
Si è quindi in presenza di un falso negativo, cioè della mancata identificazione di una specie presente nel campione in studio; il che non dovrebbe sorprendere, visto che è ben noto agli esperti del settore come non esista un “metodo universale” di sequenziamento, ma le analisi debbano essere ottimizzate a seconda di ciò che si intende rivelare.

La rivelazione a livelli molto bassi, al limite del rumore statistico, di un microorganismo nel campione in esame non dipende quindi dalla sua assenza, ma dal metodo di identificazione non ottimizzato.
La stessa, identica difficoltà può incontrarsi per l’identificazione di qualunque altro genoma, per il quale il metodo di analisi non sia stato opportunamente calibrato; la mancata rivelazione del genoma del virus della rosolia (oltretutto un virus a singola elica incapsulato) è ascrivibile quindi al metodo utilizzato, senza la necessità di invocare la sua assenza nei lotti vaccinali esaminati.

Passando all’esame del secondo punto, l’eventuale presenza di numerosi genomi contaminanti all’interno dei campioni esaminati, si possono fare le seguenti osservazioni.

Innanzitutto, vi sono numerose specie elencate nelle tabelle del report, che sono ritrovate sulla base di un numero di reads pienamente rientrante nel rumore statistico. A giudizio di entrambi gli esperti di sequenziamento consultati, dichiarare la presenza di qualcosa sulla base di 3 o meno reads è una procedura azzardata che porta ad un alto numero di falsi positivi. Come avviene normalmente nell’uso di queste tecnologie che generano milioni di dati è necessaria, per confermare la presenza di specifici elementi a bassa rappresentatività, la validazione con una tecnologia alternativa, ad esempio la PCR. Quindi la presenza della maggior parte delle specie contaminanti nei campioni esaminati è da ritenersi non supportata da dati sufficientemente robusti da essere considerati veritieri.
In particolare, la rivelazione di virus patogeni come HIV-1 (il virus dell’AIDS) in uno dei lotti esaminati o di virus dell’epatite è totalmente non supportata, così come quella della maggior parte degli altri genomi avventizi elencati nelle tabelle (ripetiamo, tutti quelli per cui si hanno tre reads o meno).
Inoltre, raggruppare reads in taxa superiori alla specie non meglio attribuiti (per esempio quelli nel gruppo dei Microviridae a pagina 7) senza ulteriore approfondimento analitico dei dati è parimenti scorretto: le reads corrispondenti potrebbero infatti essere un assemblaggio eterogeneo di falsi positivi, ricondotti dal software utilizzato ad una categoria tassonomica superiore.
Vi è poi un’ulteriore problema nelle tabelle presentate, costituito dalla abbondante frequenza di sequenze riconducibili a virus integrati nel genoma umano (endovirus di varia natura) o a sequenze retrovirali note per essere reperibili nel genoma umano normale (questo è il caso ad esempio di sequenze retrovirali integrate che possono essere scambiate per HIV) o nel genoma delle cellule embrionali di pollo usate per la produzione del vaccino, tipicamente riscontrabili come false assegnazioni a genomi contaminanti nel sequenziamento di DNA o RNA a seconda della particolare endosequenza considerata.

Al netto di queste tre considerazioni, e visto che DNA umano e DNA di pollo sono attesi perchè il vaccino è prodotto utilizzando cellule provenienti da questi due organismi, gli unici potenziali contaminanti degni di nota che sopravvivono sono i seguenti:

  1. Batteri del genere Bradyrhizobium rivelato nell’analisi di sequenziamento del DNA del primo lotto;
  2. Il verme piatto Spirometra erinaceieuropaei rivelato nell’analisi di sequenziamento di RNA del secondo lotto;
  3. Il verme nematode Elaeophora elaphi rivelato nell’analisi di sequenziamento di RNA del secondo lotto.

Per quel che riguarda il primo di questi potenziali contaminanti, il batterio azotofissatore non patogeno del suolo Bradyrhizobium, il suo “apparire” nei laboratori di sequenziamento è ben noto come problema legato alla preparazione dei campioni da sequenziare, ascrivibile a contaminazione dei kit di purificazione del DNA, l’acqua e i reagenti da utilizzare. Un problema ben conosciuto, a causa del quale nei lavori di genomica “esplorativa” in genere si sequenzia in parallelo al campione sotto esame un campione di controllo, per esempio contenente acqua.

Per quello che riguarda i due tipi di vermi rivelati nell’analisi di sequenziamento di RNA, è sufficiente osservare come essi non siano presenti nelle corrispondenti analisi di sequenziamento del DNA, dove dovrebbero essere molto meglio rilevabili; di conseguenza, l’effettiva presenza delle due specie appare come un artefatto, non confermabile alla luce degli stessi dati di sequenziamento di DNA presentati.

Alla luce delle considerazioni fatte, non è quindi possibile confermare la presenza di nessuno dei genomi contaminanti riportati, ed esistono forti indizi che portano a pensare alla presenza di numerosi falsi positivi.

In merito al terzo e al quarto punto sollevati, la presenza eccessiva di DNA umano, che per di più sarebbe presente sotto forma di genomi interi, non frammentati, si fanno le seguenti considerazioni.

Preliminarmente, è utile richiamare che, come riportato nello stesso documento CORVELVA, non esistono limiti di legge in Europa che fissino una soglia per l’ammontare di DNA umano presente in un lotto vaccinale.
La ragione è semplice: vi è da tempo evidenza che anche dosi altissime di DNA umano non sia in grado di indurre rischi significativi neppure su periodi di osservazione lunghi, come confermato da studi su primati non umani, dall’esperienza clinica con i vaccini e altri farmaci biologici e da studi recenti di valutazione del rischio che suggeriscono come anche in quei paesi non europei dove esistono soglie al quantitativo di DNA iniettabile tali soglie siano inutilmente stringenti. Fatta questa considerazione preliminare, che esaurisce la discussione su cosa sia da considerarsi “eccesso” di DNA umano e su quali basi, resta il punto inerente al maggior rischio associato all’iniezione di DNA umano poco o nulla frammentato, riflesso nella seguente frase rinvenibile nel report CORVELVA (grassetto in originale):

“nel vaccino Priorix Tetra il DNA genomico umano è ad alto peso molecolare (>10.000bp) e la totale copertura in sequenza dell’intero genoma umano di riferimento (HG-19) ​dimostra che è l’intero genoma delle cellule fetali utilizzate per la coltura dei virus vaccinici ad essere presente e non solo porzioni di esso​. 

Nessuna evidenza diretta è data per l’affermazione riportata, fatta salva la presenza di DNA di peso intorno a 100.000 basi rivelato mediante gel elettroforesi dagli autori (documentato con una figura di scarsa qualità nel documento CORVELVA, della quale sarebbe opportuno ottenere un originale ad alta risoluzione per valutare se i dati siano presentati in maniera integra). Gli autori tuttavia dimenticano che il DNA di alcuni dei virus attenuati presenti nel vaccino in esame è di dimensioni circa pari a quanto da loro rivelato nel gel (per esempio, il DNA del virus della varicella è di 125 kb); pertanto, pur volendo intravedere traccia di DNA ad alto peso nell’immagine di gel presentato, questo può chiaramente essere imputato al DNA dei virus attenuati presenti del vaccino, e non a frammenti di DNA umano. Ancora una volta, siamo di fronte ad una sovrainterpretazione del risultato sperimentale.
Per quello che riguarda il secondo elemento su cui si basa l’affermazione di CORVELVA, cioè che sarebbe presente nei vaccini l’intero genoma umano, ricordiamo che non vi è nemmeno bisogno di avere accesso ai dati di copertura dettagliati per pesarne la consistenza: alla profondità di sequenziamento utilizzata e con il numero di reads ottenute, questa affermazione è totalmente implausibile. Inoltre la tecnica di sequenziamento utilizzata, basata su sequenze corte, 125 nucleotidi, non permette di definire se un genoma sia frammentato. La tecnica di sequenziamento utilizzata permette solo di stimare la frazione di DNA genomico sequenziato.

ANALISI DELL’ARTICOLO SOTTOMESSO AL SITO F1000.

CORVELVA e lo stesso presidente dell’ordine dei biologi hanno spesso richiamato la sottomissione di un articolo scientifico in cui la metodica di sequenziamento utilizzata e i dati ottenuti su Priorix Tetra sarebbero perfettamente descritti.

In questa sede, sarà sufficiente richiamare i seguenti concetti:

a) Il manoscritto è stato rigettato, ancora una volta per lacune principalmente metodologiche, da entrambi i revisori che lo hanno esaminato (José F. Cobo Diaz, Laboratoire Universitaire de Biodiversité et Ecologie Microbienne, IBSAM, ESIAB, Université de Brest, Plouzané, France; e Alejandro Sanchez-Flores, Institute of Biotechnology, National Autonomous University of Mexico, UNAM, Cuernavaca, Mexico). Per valutare nel merito le critiche sollevate, si rimanda al sito di F1000.

b) Una preliminare rianalisi informatica dei dati, effettuata dal professor Raffaele Calogero, porta in prima battuta ad evidenziare numerose incongruenze da un punto di vista puramente numerico rispetto a quanto pubblicato dagli autori. Per il resto, valgono le stesse considerazioni fatte a proposito del report in merito a contaminanti e identificazione dei virus attenuati immunogenici.
La rianalisi dei dati ottenuti per i due lotti di vaccino (denominati dagli autori B1 e B2) effettuata dal professor Raffaele Calogero è disponibile qui e qui.

CONCLUSIONI

Al netto di tutti i dettagli e le considerazioni fatte, è possibile affermare che:

  1. Le conclusioni del documento CORVELVA circa l’assenza di uno dei virus attenuati nel vaccino Priorix Tetra non tengono conto dell’errore negativo di identificazione, che il metodo dimostra di avere in sede di calibrazione; si tratta di un errore atteso, visto la scarsa ottimizzazione della metodologia adoperata.
  2. Le conclusioni del documento CORVELVA circa la presenza di numerosi genomi contaminanti avventizi non sono supportate, ed in massima parte i dati appaiono sovrainterpretati oltre il loro reale significato.
  3. Il manoscritto sottoposto a F1000 appare ricco di difetti metodologici, ad un livello tale da essere stato unanimemente respinto dai due referees internazionali che lo hanno esaminato;
  4. L’analisi dei dati allegati al manoscritto sottoposto a F1000 appare evidenziare alcune incongruenze, sia rispetto a quanto riportato da CORVELVA nel proprio documento sia rispetto a quanto riportato dagli autori nel proprio manoscritto; su queste incongruenze ci si riserva di approfondire, prima di esprimere un giudizio definitivo.

[1] Alcuni principi sono anche qui per il progetto ENCODE https://www.encodeproject.org/about/data-use-policy/ ed il vecchio progetto genoma https://en.wikipedia.org/wiki/Bermuda_Principles

Enrico Bucci

Data lover, Science passionate, Fraud buster (when lucky...)

11 pensieri su “Analisi dei dati genomici prodotti da CORVELVA sul vaccino Priorix Tetra

  1. L’ha ribloggato su Dai quntum dots a UY Scuti, per parlare di tutto un po'e ha commentato:
    Un aricolo da leggere fino in fondo e sui cui riflettere.
    Purtroppo molti, troppi, credono ai complotti e non alla verita’, si lasciano furviare da dati presentati volutamente in maniera distorta al punto tale da stravolgere la realta’.
    Mi ricordo una volta la presentazione di un gruppo che elogiava le grandi qualita’ di una bacca sudamericana, adducendo anche una vasta letteratura scientifica. Dopo aver visionato tale letteratura, del tutto leggittima e ben fatta, mi sono resa conto che avevan fatto dei voli pindarici impressionanti. Questa bacca contiene anti-ossidanti, gli anti-ossidanti hanno un ruolo nella prevenzione del cancro, ergo la bacca ha valora anti-tumorale. Gia’, peccato che nussuno degli articili citati aveva in alcun modo testato tale bacca direttamente. Non parliamo poi del fatto che si sono rivolti a un pubblico che direttamente o indirettamente, si sono trovati a lottare contro questa malattia.
    Alla fin fine era sono un modo per vendere a caro prezzo un prodotto esotico, le cui proprieta’ organolettiche e anti-ossidanti sono paragonabili a tanti nostri frutti, come i mirtilli. Tutto cio’ fatto sfruttando le paure e l’ingenuita’ delle persone, non diversamente da quello che sta accadendo con i vaccini.

    1. Se si tratti di manipolazione intenzionale, è impossibile dirlo a questo stadio. Quello che è certo è che vi è traccia di un preconcetto talmente forte, da oscurare la capacità analitica di chi pretende di condurre sperimentazioni scientifiche; unitamente ad una certa dose di ignoranza di base delle tecniche e alla inesperienza di chi interpreta i risultati, si ottiene un mix letale, che viene aggressivamente utilizzato per ingenerare paura nei confronti dei vaccini.

Rispondi a Marco VenaruzzoAnnulla risposta

Scopri di più da Cattivi Scienziati

Abbonati ora per continuare a leggere e avere accesso all'archivio completo.

Continue reading