Fosca Giannotti è direttrice di ricerca di informatica presso l’Istituto di Scienze e Tecnologie dell’Informazione “A. Faedo” del CNR di Pisa: “Cittadini adeguatamente informati, in un modo rispettoso dei loro diritti, possono decidere di contribuire in maniera volontaria al bene comune attraverso la condivisione dei dati”
Stando a uno studio condotto da un pool di ricercatori in Data Science e Intelligenza artificiale e dall’infrastruttura di ricerca europea SoBigData, poter contare su più dati e riconoscere il loro controllo ai cittadini, che possono dunque decidere se e come condividerli, può aiutare a tenere sotto controllo la diffusione del Covid. Si tratta di un approccio che punta a creare conoscenza e consapevolezza sul mondo dei big data per metterne a terra tutto il valore.
Ne parliamo con Fosca Giannotti, data mining expert e Director of Research all’Istituto di Scienza e Tecnologie dell’Informazione “A. Faedo” del Consiglio Nazionale delle Ricerche. Peraltro, dal prossimo novembre, la professoressa Giannotti diventerà titolare della prima cattedra di Informatica della Scuola Normale di Pisa, un passaggio storico, a proposito del quale ha dichiarato al Corriere della Sera: “Ritengo importante sottolineare che la cattedra è stata assegnata a una donna. Quando io ho scelto di fare Informatica, alla fine degli anni Settanta, le ragazze erano circa la metà. Poi c’è stato un progressivo abbandono, ed è un problema perché con Intelligenza Artificiale e Data Science stiamo progettando la società del futuro. Alla Normale sarò l’unica donna fra i professori ordinari di prima fascia nell’area Scienze: spero di contribuire a creare quella diversità che serve e di non rimanere l’unica”.
Secondo lo studio in questione, che è stato pubblicato sulla rivista Ethics and Information Technology, le app adottate nei diversi Paesi per tracciare la trasmissione del virus e, dunque, individuare i focolai si basano su una spinta centralizzazione dei dati che solleva tra i cittadini una certa preoccupazione. Un’altra via è possibile?
Un’altra via è certamente possibile e passa attraverso un approccio decentralizzato. Sulla base di tale approccio chi partecipa a una raccolta dati come quella sulle reti di trasmissione del virus non rivela dove si trova attraverso le indicazioni del gps del suo device: invia, invece, un dato adeguatamente anonimizzato che non è che un pezzo della somma delle persone che si trovano nell’area geografica. Per fare un esempio estremamente semplificato di come agiscano gli agenti decentralizzatori, immaginiamo di volere calcolare l’età media di un gruppo di individui: ebbene, la computazione decentralizzata non richiede che ciascuno di loro riveli la propria età, ma fa sì che ciascun dispositivo individuale esegua un pezzetto di questo calcolo. Per tornare alle app di tracciamento della trasmissione del virus, grazie all’approccio decentralizzato i dati spazio-temporali vengono dunque raccolti negli archivi dei dati personali dei singoli cittadini e condivisi in maniera volontaria solo nel caso in cui l’individuo risulti positivo al Covid. La computazione decentralizzata, che è corroborata da device che stanno diventando sempre più intelligenti, consente insomma di conciliare la protezione della privacy con la protezione del bene pubblico, in questo caso la salute.
Diventa dunque importante informare e sensibilizzare i cittadini, in modo che siano più consapevoli nel momento di decidere se e quali dati condividere. È questa la direzione che ci aspetta?
Stiamo parlando di un tema che è al centro delle attuali ricerche sull’innovazione. E certamente parliamo di questo, di cittadini adeguatamente informati e che, in un modo che è rispettoso dei loro diritti, possono decidere di contribuire in maniera volontaria al bene comune – magari per supportare, come abbiamo visto, le istituzioni sanitarie durante una pandemia -, oppure possono decidere di contribuire su molteplici obiettivi specifici: per esempio, attraverso i dispositivi che usano possono mettere a disposizione i dati sulla loro spesa alimentare o, chessò, sui consumi elettrici. Le applicazioni sono infinite.
Ma non dovrebbe farci sorridere questo sollevare dubbi sulla violazione della privacy quando nella prassi quotidiana non facciamo che cedere dati personali e di ogni sorta a Google, a Facebook e a moltissime altre entità che agiscono nella rete?
Io, personalmente, ravvedo una certa contraddizione tra l’esporre senza riserve le foto dei propri figli su Instagram e non accettare che l’app Immuni riveli la propria posizione. Questa è una schizofrenia culturale che, sì, manifesta una certa inconsapevolezza sui temi dei dati personali e della privacy. Trovo, però, interessante che sempre più persone comincino a riflettere e a farsi domande a proposito delle tantissime informazioni che, mentre sono connessi, cedono su stessi e sulla propria vita. La consapevolezza sta via via crescendo.
Tornando al tema del Covid e, dunque, alla possibilità di proteggere la salute pubblica e, al contempo, la privacy dei cittadini, questa consapevolezza è cruciale se si vuole coinvolgere il cittadino nel processo di decisione sui suoi dati. E allora, come si fa, secondo lei, a creare consapevolezza, per fare sì che i cittadini decidano di dare con cognizione di causa il proprio contributo?
Io credo che già per il fatto che queste questioni entrano nel dibattito pubblico contribuiscono a svegliare l’attenzione delle persone e a stimolare la riflessione. Il dibattito che nei mesi scorsi è scaturito sull’app Immuni e la privacy ha, a mio parere, contribuito a fare riflettere sulle tracce che lasciamo nelle connessioni. Il punto è che non dobbiamo limitarci a evocare i timori e dunque a sensibilizzare il cittadino sui rischi: dobbiamo, in contemporanea, informarlo sulle opportunità che una raccolta rispettosa dei dati e la loro osservazione comporta, fornendogli i mezzi per avere consapevolezza e controllo dei propri dati, in modo che poi possa decidere consapevolmente se, come e quando condividerli. Naturalmente, bisogna anche fare sì che l’espressione del consenso sia agevole e quindi occorre che la tecnologia faccia dei passi avanti anche in questa direzione.
A parte il tracciamento della diffusione del virus, quali sono i campi in ambito sanitario che potranno a breve beneficiare dei big data?
Gli ambiti di applicazione in medicina sono molteplici. Penso, per esempio, alla possibilità per i medico di compiere diagnosi ultra mirate per il singolo paziente usando i dati di milioni di persone con la medesima patologia, così come per le istituzione di potenziare ed efficientare il processo decisionale sulle politiche sanitarie. La tecnologia c’è e spesso anche i dati: la sfida ora è rimuovere le barriere che impediscono di usarla. Una di queste è l’eterogeneità dei sistemi e degli approcci, così come le difformità nella gestione della privacy, il che ostacola la fruizione a livello nazionale dell’insieme dei dati. Ho lavorato nella task force del Ministero dell’Innovazione e spesso è stato difficile avere dal Ministero della Sanità il numero di positivi dei singoli Comuni, una cosa apparentemente molto semplice. Accadeva per motivazioni di varia natura: non c’era il dato pronto, o il dato era trattato male. I nostri colleghi inglesi, invece, avevano accesso al singolo dato di ogni singolo paziente, dopo che, naturalmente, il paziente aveva dato il consenso. Ma io sono positiva sul fatto che il nostro Paese si doti di una governance sui big data: tra l’altro, stiamo finalmente cercando di equipaggiarci di una strategia sull’intelligenza artificiale che punta ad aumentare le competenze e le offerte formative, anche grazie ai finanziamenti dell’Unione europea.
La foto in alto è di Panumas Nikhomkhai da Pexels.