A novembre l'Istituto superiore di sanità e l'Accademia dei Lincei hanno siglato un accordo, della durata di un anno, con il quale il primo si impegnava a mettere a disposizione dei membri dell'Accademia tutti i dati raccolti sull'epidemia di Covid in Italia, "per sviluppare modelli che analizzino l’andamento dell’epidemia e l’impatto sul sistema sanitario nazionale". Gli scienziati dei sue enti avrebbero poi collaborato per effettuare analisi ed elaborare le informazioni disponibili, continuando a monitorare la diffusione del Covid-19, pianificando le attività di ricerca e divulgazione dei risultati. In particolare, si legge nel testo, l'accordo comprende lo svolgimento delle seguenti attività: "Condividere apertamente i dati della sorveglianza Covid-19"; "Sviluppare, valutare, scambiare metodologie scientifiche di analisi e informazioni nell'ambito del monitoraggio e controllo dell'epidemia sa Sars-Cov-2"; "Valorizzare i risultati dal punto di vista scientifico e di Sanità Pubblica"; "Divulgare i risultati e le conoscenze presso la comunità scientifica e la cittadinanza".

Era stato l'allora presidente del Consiglio Conte ad annunciarlo, spiegando appunto "di aver chiesto all’Iss di condividere i dati del monitoraggio e che siano accessibili alla comunità scientifica e a tutti i cittadini". La notizia era stata accolta positivamente anche dall'Associazione Coscioni: "Ci auguriamo che l’Iss dia immediatamente seguito pubblicando però non i dati aggregati e in formato chiuso – aveva commentato Marco Cappato – Ma tutti i dati disaggregati e in formato aperto, in modo da consentire elaborazione e analisi autonome e indipendenti".

Ma i dati raccolti non possono essere messi a disposizione dell’intera comunità scientifica, per motivi di privacy. A sei mesi dalla firma di quell'accordo abbiamo chiesto al presidente dell'Accademia dei Lincei, il fisico Giorgio Parisi, dove sono i dati promessi e a che punto è il lavoro di analisi.

Conte aveva annunciato che l'Iss avrebbe fornito i dati disaggregati all'Accademia dei Lincei. Che fine ha fatto l'accordo stipulato a novembre?

I dati ci sono stati trasferiti circa un mese fa: si tratta di un database che contiene circa 3 milioni e mezzo di righe, i dati di tutti i pazienti che sono stati registrati come malati di Covid, dall'inizio dell'epidemia ad ora. E ogni settimana l'Iss continua a inviarci il database aggiornato. Ma i dati disaggregati contenuti in questo database sono coperti da privacy, e quindi non possono essere diffusi, come ha spiegato anche l'Iss. Perché si potrebbe, facendo qualche indagine, risalire facilmente all'identità delle persone contagiate, soprattutto di quelle decedute.

Quindi voi che tipo di lavoro state facendo?

Noi stiamo studiando il database, e si tratta di un gigabyte di materiale, stiamo scrivendo dei programmi per leggere questi dati. Una delle prime sfide è stata quella di velocizzare l'analisi di ciascun file. Poi abbiamo avuto un colloquio con Antonio Zoccoli, presidente dell'Istituto Nazionale di Fisica Nucleare (INFN), che ha fatto con l'Iss un accordo simile al nostro, e stiamo programmando insieme un sito Internet in cui, su richiesta, potremmo fornire alla comunità scientifica dei dati aggregati estratti da quel grosso database. Anche perché i dati disaggregati sono difficili da utilizzare per un'analisi. Il database in sé è utile solo come sorgente di dati aggregati.

Quando potrebbe essere pronto il sito?

È ancora un progetto in fase embrionale, ma io spero che entro un mese ce la possiamo fare. Poi però dovremmo discutere con l'Iss e con il Garante della privacy per capire cosa possiamo effettivamente divulgare, perché le leggi in Italia sono molto stringenti in questo senso. Per fare un esempio nei report regionali dell'Istituto superiore di sanità, che si fanno settimanalmente, si trova una mappa in cui vengono segnalati i Comuni che hanno avuto dei casi Covid, specificando il numero dei contagi. Ma i Comuni in cui si sono registrati meno di cinque casi non sono segnati sulla mappa, proprio per proteggere la privacy degli ammalati. Forse è un po' eccessivo, però in Italia c'è quest'interpretazione della norma.

Che tipo di informazioni si possono ricavare dal database?

Una domanda a cui si potrà rispondere è per esempio come è variata nel tempo la mortalità nelle varie province, per le diverse classi di età.

Per ogni paziente quali sono informazioni a disposizione?

Quello che ci è stato trasmesso è un database schematico e generale, in cui non ci sono le indagini epidemiologiche. Per ciascun caso noi sappiamo: la data in cui è entrato nella statistica, l'età, il sesso, se è un lavoratore del sistema sanitario, la data d'inizio dei sintomi, se si tratta di un soggetto ospedalizzato o meno, la data eventuale di ospedalizzazione, l'eventuale ingresso o meno in terapia intensiva, l'outcome, cioè se il paziente è guarito, è ancora positivo o è deceduto, l'eventuale data di morte, l'indicazione della provincia in cui si è infettato, il luogo di residenza, quali sono le precondizioni di salute, se ha avuto bisogno di un supporto respiratorio, cioè se è stato intubato, se si tratta di un caso importato dall'estero o se siamo in presenza di un caso autoctono. Non abbiamo informazioni specifiche sui tamponi, esistono sicuramente diversi database, anche regionali.

Alla luce di quello che è accaduto in Sicilia, dove i dati dei morti venivano arbitrariamente ‘spalmati' su più giorni, falsando di fatto le statistiche, c'è il rischio che altri casi simili emergano in altre Regioni?

Non lo so, ma la mia impressione è che le bugie abbiano le gambe corte, non mi pare che sia un'operazione conveniente. Non abbiamo indagato, ma se avessimo voluto approfondire, visto che i dati che abbiamo sono certificati, e i casi sono stati registrati indicando il codice fiscale delle persone, da qualche parte avremmo trovato un database super protetto, con tutte le informazioni delle province, che non è facilmente falsificabile. Si tratti insomma di episodi che possono essere ricostruiti a posteriori. Un conto è, come si evince dalle intercettazioni, dichiarare 20 morti invece che 40; un'altra cosa è cancellare le informazioni delle persone. Dalle indagini infatti è risultato che i dati sui decessi sono stati ‘spalmati', ma sono assolutamente convinto che il database sia corretto. Magari possono esserci delle piccole imperfezioni, nulla di più.

Che responsabilità ha secondo lei il governo in questa vicenda? Avrebbe dovuto controllare meglio i dati che arrivavano dalle Regioni?

Il nostro è un sistema decentrato. Cosa si dovrebbe fare? Organizzare un sistema alternativo, in cui gli ospedali comunicano tutte le informazioni direttamente al governo centrale? Sarebbe un'assurdità.