C’è una buona notizia in materia di Big Data che arriva da Bruxelles. La Commissione Europea, nel programma Horizon 2020, ha deciso di finanziare l’avvio di una nuova infrastruttura di ricerca chiamata SoBigData, Social Mining & Big Data Ecosystem. SoBigData è una rete di centri europei, con coordinamento italiano, che mette a disposizione dati, strumenti e competenze di data scientist per condurre grandi e piccoli esperimenti di big data analytics da parte di ricercatori, innovatori, startuppers, policy-makers, istituzioni pubbliche. Esperimenti rivolti ad estrarre senso dalle tracce digitali delle attività umane registrate appunto nei Big Data, ed usare la conoscenza estratta per nuove scoperte scientifiche, ad esempio in campo sociale ed economico, per nuovi servizi e prodotti, o a supporto delle decisioni.
SoBigData, insomma, ha l’ambizione di diventare un ecosistema di tecnologie e di persone in grado di liberare il potenziale dei Big Data come commons, come bene pubblico, aperto e accessibile, in un quadro etico di valori imprescindibili: trasparenza dei processi e delle finalità, rispetto della privacy, fiducia e responsabilità.
In un certo senso, SoBigData si propone come il Cern dei Big Data. La comunità scientifica e gli innovatori e startupper potranno usare i servizi di SoBigData, in modalità virtuale ma più spesso “in-situ”, come una “galleria digitale del vento”. Un luogo che rende possibili esperimenti di analisi e simulazioni sociali su grande scala, così come prototipi di nuovi servizi e prodotti che facciano forza sulla conoscenza nascosta nei Big Data. C’è un grande bisogno di un luogo del genere, perché nonostante le promesse dei Big Data sbandierate da tutti, la maggior parte dei dati più ricchi di informazione risiede al chiuso dei forzieri delle grandi corporation del web e degli operatori di telecomunicazioni e di telematica. E non si può fare ricerca e innovazione sui Big Data senza dati provenienti da una pluralità di fonti di diverse. Perché questa ricerca e innovazione si basa proprio sull’uso creativo ed imprevisto di dati eterogenei, raccolti in origine per finalità del tutto diverse. Come ad esempio misurare il benessere o prevedere le epidemie attraverso i dati della telefonia mobile, oppure stimare la fiducia con le tracce dei nostri acquisti o la disoccupazione con i record delle ricerche sul web. O imparare a comprendere e gestire le emergenze, come un terremoto, combinando segnali dai dati telefonici, dalle tracce Gps dei veicoli e dalle conversazioni sui social media. Quindi, innanzitutto, accesso ai dati, in un contesto aperto ma sicuro, creativo ma responsabile. Ma non basta: occorre anche la capacità di gestire ed analizzare i dati, raccontare le storie che i dati hanno da raccontare. Per questo, una infrastruttura come SoBigData non è solo una “apparecchiatura”, una piattaforma di calcolo ad alte prestazioni, ma un ecosistema in cui i dati coesistono con le tecniche di social mining e le capacità dei data scientist. Perché solo così può essere utile a comunità interdisciplinari di scienziati ed innovatori, creando nuove opportunità nelle Ict e nelle scienze umane, sociali ed economiche, facilitando il confronto, il riuso e l’integrazione di Big Data, Open Data, Linked Data, metodi analitici e servizi, promuovendo una scienza aperta e riusabile. Solo così potrà funzionare da “wind tunnel” per esplorare, attraverso simulazioni e modelli, i futuri possibili che possiamo aspettarci come conseguenza delle nostre decisioni, sia a livello collettivo che a livello personale.
In concreto, SoBigData è:
- una piattaforma per la procura e l’accesso ai Big Data all’interno di una cornice etica e rispettosa della privacy, in prospettiva mediante metodi il coinvolgimento delle persone non solo come fornitori di dati ma come fruitori e creatori di conoscenza;
- una piattaforma aperta di metodi analitici di social mining e di competenze per il loro uso, inclusi i meccanismi per preservare e condividere i processi e i risultati degli esperimenti;
- una rete di opportunità di alta formazione in social mining per a creare la nuova generazione di “data scientists”.
SoBigData vuol essere un luogo di lavoro per i progetti di innovazione sociale che affrontano le grandi sfide della contemporaneità: il monitoraggio e previsione del benessere e della crescita demografica, dei conflitti sociali e della diffusione di opinioni, comportamenti ed epidemie, l’analisi e il contrasto delle disuguaglianze eccessive nella distribuzione delle risorse economiche, le soluzioni per le città intelligenti e per trasporti efficienti e sostenibili, il monitoraggio del mercato del lavoro e contrasto alla disoccupazione e all’esclusione, la partecipazione dei cittadini alla vita politica, le smart grid per la generazione e distribuzione intelligente dell’energia. Lo pensiamo come un acceleratore della conoscenza, capace di stimolare creatività, innovazione e cultura, nuovi modelli di business per start-up nei più disparati settori – dall’energia all’arte, nuovi modelli di consapevolezza degli individui e delle comunità nel contesto globale. Vorremmo che aiutasse a consolidare un modello europeo della conoscenza sociale come bene comune e fattore di progresso, in alternativa alle grandi concentrazioni monopolistiche.
Il coordinamento dell’infrastruttura europea è del laboratorio SoBigData, una iniziativa che aggrega università ed enti di ricerca della Toscana. I soci fondatori sono il Consiglio Nazionale delle Ricerche con gli istituti Isti e Iit e l’università di Pisa, insieme con la Scuola Normale Superiore di Pisa e la Scuola Imt (Istituzioni, Mercati, Tecnologie) di Lucca. I partner europei sono l’università di Sheffield, il King’s College di Londra, il Fraunhofer tedesco, l’università Leibniz di Hannover, l’università estone di Tartu, l’università finlandese Aalto, l’Eth di Zurigo, e la Technische Universiteit di Delft in Olanda. Una rete di 12 centri di eccellenza scientifica sui temi chiave: data and text mining, social media analytics, analisi delle reti sociali e della mobilità, visualizzazione e analitica visuale, web analytics, e-government data analytics, open data, e-health data, privacy ed etica delle Ict.
Un embrione di quel sistema nervoso digitale per la nostra società, aperto e partecipato, di cui abbiamo assolutamente bisogno per comprendere la complessità della società che abitiamo, connessa e immersa nelle macchine. E rimettere l’umano al centro.
SoBigData sarà un luogo dove dati, metodi per analizzarli e risultati degli esperimenti saranno “curati”, resi “trovabili” ed “interoperabili ” così da essere resi disponibili per l’accesso da parte di altri ricercatori, e potranno essere riutilizzati e combinati per fare nuovi esperimenti e creare nuova conoscenza. Questo è il mattone base per rendere una scienza moderna basata sui dati aperta, verificabile e riusabile e davvero bene comune.