Sviluppare nuovi codici informatici attraverso metodi innovativi, automatici e sicuri grazie all'archivio universale del codice sorgente Software Heritage.
È questo l'obiettivo di "Bologna Big Code Lab", il laboratorio congiunto di conoscenza e sperimentazione nato grazie a una convezione tra ENEA e Università di Bologna, in collaborazione con Software Heritage e il sostegno di iFAB, International Foundation Big Data and Artificial Intelligence for Human Development. Il progetto si basa sull'immensa biblioteca digitale di Software Heritage, realizzata sotto l'egida UNESCO dall'ente francese INRIA (Istituto nazionale per la ricerca nell'informatica e nell'automazione) e di cui il Centro Ricerche ENEA di Bologna ospita una copia. In tre anni saranno sviluppati sistemi automatici per produrre velocemente e in modo affidabile nuovi codici attingendo e aggregando i programmi sorgente già catalogati e memorizzati nell'archivio.
"I codici sorgente sono sequenze di istruzioni, comprensibili e modificabili dall'uomo ma eseguiti da calcolatori. Stanno dentro computer o cellulari, grazie a loro possiamo controllare satelliti ma anche far funzionare siti web e la maggior parte degli oggetti con i quali interagiamo ogni giorno", spiega Simonetta Pagnutti della Divisione ICT dell'ENEA, che rappresenta l'Agenzia nell'Associazione Big Data.
Nel 2019, proprio grazie a una iniziativa ENEA, è stato siglato l'accordo con INRIA per mettere a punto il primo "mirror" istituzionale europeo dell'archivio Software Heritage, che dal 2016 raccoglie, conserva e rende accessibile il codice sorgente di tutti i software pubblicamente disponibili al mondo del mondo.
"Un progetto di grande rilevanza culturale, sociale e scientifica sponsorizzato anche da grandi big come Microsoft, Intel e Google. Navigando tra i quasi dodici miliardi di file conservati nell'archivio, ci si può imbattere nel codice di sessantamila linee che ha guidato il computer di bordo dell'Apollo11 portando 50 anni fa l'uomo sulla luna. Oppure si può curiosare dentro "TAUmus", uno dei primi software al mondo realizzato negli anni Settanta alla base della computer music", continua la ricercatrice. "Quello che abbiamo replicato presso il Centro ENEA di Bologna è un backup vitale che rende accessibili tutti gli oltre 170 milioni di progetti archiviati. L'accesso a una simile libreria, una vera biblioteca di Alessandria del software, darà la possibilità ai ricercatori e agli scienziati dell'Agenzia e dell'Università di studiare e analizzare codici e algoritmi, sviluppando metodiche per ricavare informazioni e produrre nuova conoscenza. Così, in analogia a quanto avviene con i "Big Data" potremo parlare di "Big Code". Si tratta di un filone attuale, ancora da esplorare, ma ricco di ricadute. Una linea di ricerca con un orizzonte di lungo respiro, destinata ad avere una valenza strategica rilevante che apre nuove opportunità per i giovani ricercatori: i codici sono l'imprescindibile componente dell'High Performance Computing, dell'Intelligenza Artificiale e di ogni applicazione digitale" conclude la Pagnutti.
Oltre al lavoro di ricerca, il progetto prevede anche diverse attività di formazione e alfabetizzazione digitale per riflettere su temi fondamentali legati allo sviluppo delle tecnologie informatiche, con l'obiettivo di creare maggiore consapevolezza rispetto ai profondi cambiamenti in atto in campo economico, culturale e sociale legati all'utilizzo sempre più diffuso delle nuove tecnologie.
Il primo appuntamento divulgativo "Software Heritage, l'Archivio Universale dei Codici - Divagazioni sul tema" si terrà il 16 marzo presso l'Aula Giorgio Prodi del Dipartimento Informatico dell'Università di Bologna, disponibile anche in diretta streaming. Sarà una giornata dedicata all'open source, ai nuovi archivi digitali e ai codici, intesi sia come protagonisti della rivoluzione digitale che come parte del nostro patrimonio culturale e, come tali, da conservare e tutelare.
L'evento ha in programma seminari e incontri destinati a un pubblico ampio ma in particolare ai più giovani attraverso il coinvolgimento attivo di quattro scuole. Si parlerà di cos'è un codice sorgente e del perché scrivere codice sia importante, per tutti. Verranno presentati alcuni tra i codici che hanno cambiato il mondo e saranno premiate le motivazioni più spiritose, originali e brillanti fornite dai partecipanti al contest "Qual è il tuo codice preferito, quale vorresti salvaguardare per i posteri?" a cui è possibile aderire seguendo il link https://bobcl.cs.unibo.it/. Si potrà decidere, motivando la propria preferenza, quale software preservare scegliendone uno tra gli 8 proposti: da quello di Eliza, la prima voce digitale in grado di risponde alle nostre domande, a quello che ha fatto nascere Wikipedia; dal primo codice in grado di battere l'occhio umano nel riconoscimento di un'immagine fino agli algoritmi di "clustering" grazie ai quali oggi Google, Netflix o Spotify sanno ciò che preferiamo.
Tra gli ospiti della giornata anche Roberto di Cosmo, Professore ordinario di Informatica all'Università di Parigi Diderot nonché direttore e fondatore dell'infrastruttura mondiale Software Heritage. È previsto anche un saluto del Ministro per l'Istruzione Patrizio Bianchi.
Il progetto Bologna Big Code Lab e l'iniziativa del 16 marzo sono attività che nascono e si sviluppano nell'ambito del Tecnopolo di Bologna, oggi sede del Data Center del Centro Europeo per le Previsioni Meteorologiche a Medio Termine (ECMWF), e che a breve ospiterà Leonardo, uno dei più potenti supercomputer al mondo gestito da Cineca. Qui troveranno anche spazio start-up e laboratori di ricerca, creando un perfetto ambiente di raccordo tra ricerca e tessuto industriale.