Rivista tecnico-scientifica ambientale dell'Arma dei Carabinieri                                                            ISSN 2532-7828

TECNOLOGIA 
L’IMPORTANZA DEI DATI E DEL “SUPERCALCOLO” PER ELABORARE MODELLI PREVISIONALI E DI RISCHIO
08/06/2023
di Gabriella SCIPIONE 

Responsabile dell’area Data Management e Analytics,
Dipartimento di Supercalcolo, Cineca



figura 1Un supercalcolatore è un sistema di elaborazione progettato per ottenere capacità di calcolo molto elevate, ai fini di eseguire operazioni matematiche particolarmente onerose, ad altissime prestazioni. 
Sono molti i domini applicativi che possono far uso di potenza computazionale ad elevata prestazione e per capire meglio cos’è un supercalcolatore e quali sono le sfide scientifiche che si possono affrontare, proviamo a fare un esempio.  Un supercalcolatore è paragonabile ad una infrastruttura di ricerca, come il CERN ad esempio, dove ricercatori italiani e europei possono andare a effettuare i loro esperimenti. Nel caso di un supercalcolatore, gli esperimenti scientifici sono realizzati in silico, cioè attraverso la modellizzazione, la simulazione e la visualizzazione. 
Il vantaggio è che spesso i supercalcolatori sono progettati in modo da essere General Purpose, cioè capaci di soddisfare le esigenze di numerosi domini scientifici contemporaneamente.
In generale i supercalcolatori sono indispensabili per studiare fenomeni:
- molto grandi, si pensi ai fenomeni atmosferici alla base della meteorologia e della climatologia, alla cosmologia, ma anche allo studio dei processi che avvengono sulla superficie o nell'interno della Terra; 
- molto piccoli, si pensi alla progettazione di nuovi farmaci o di nuovi materiali;
- molto complessi, come ad esempio i processi alla base della fluidodinamica e dei fenomeni di turbolenza; 
- troppo pericolosi o costosi per essere realizzati all’interno di laboratori, ad esempio per la simulazione di guasti, test nucleari, analisi di incidenti. 
Recentemente, si è assistito alla convergenza fra Supercalcolo e Big Data. Infatti, nella nostra era sempre più connessa e digitalizzata, vengono generati volumi sempre maggiori di dati. Ma la quantità di dati non sta solo crescendo, sta crescendo in modo esponenziale. Con l'aumento del volume dei dati aumentano anche le sfide associate che in alcuni casi possono essere risolte grazie all’uso dei supercalcolatori, che consentono di abilitare i flussi di lavoro emergenti di analisi e Intelligenza Artificiale (IA) e le opportunità che ne derivano. 
 In ambito meteo - clima il supercalcolo è necessario almeno in 3 settori:
A) Simulazioni ad altissima risoluzione
Sappiamo quanto sia importante e strategico conoscere in anticipo l’occorrenza di eventi meteorologici pericolosi che possano determinare danni rilevanti in settori come l’agricoltura, i trasporti, la produzione e distribuzione di energia, solo per citarne alcuni.  La conoscenza dei modelli previsionali è fondamentale anche per la pianificazione delle attività in ognuno di tali settori. 
Tali eventi estremi ad elevata intensità si abbattono sempre più spesso su aree geografiche dell’ordine di pochissime centinaia di chilometri quadrati in tempi molto brevi (più di 200-300 mm di pioggia in pochissime ore), rendendo molto difficoltosa la previsione di tali eventi. Per ottenere previsioni meteorologiche adeguate occorre usare una modellistica meteorologica ad altissima risoluzione spaziale (al di sotto del Km di passo griglia).
Se volessimo ad esempio far girare modelli globali con risoluzioni al di sotto del km, avremmo bisogno di poter girare il modello sul 90% della partizione accelerata di Leonardo (il calcolatore del Cineca fra i più potenti al mondo con più di 3000 nodi) in circa 24 ore.
In ambito clima, nel recente progetto HIGHLANDER  coordinato dal Cineca e in collaborazione con la Fondazione Centro Euro-Mediterraneo sui Cambiamenti Climatici (CMCC), si è riusciti a ottenere 90 anni di simulazione del clima ad altissima risoluzione (2.2 km) sull’Italia utilizzando il  20% circa del supercalcolatore Galielo100  per la durata di 10 mesi, equivalente a circa 25 milioni di ore di calcolo messe a disposizione dal Cineca. Se avessimo usato un laptop da 8 core ci sarebbero voluti 357 anni.

Figura 3

Figura 3: Il Tecnopolo di Bologna

B) Gestione e analisi di grandi moli di dati.
I dati generati sia dai diversi sistemi modellistici sia meteo che climatici vengono in generale utilizzati da un vasto parco di utenti.  Per poter quindi mettere a disposizione i dati delle modellistiche nazionali e i dati osservativi necessari alle previsioni meteorologiche stesse per determinare le condizioni iniziali, nel progetto europeo Mistral (the Meteo Italian SupercompuTing PoRtAL) , ora piattaforma dell’Agenzia ItaliaMeteo e aperta a tutti gli stakeholder nazionali, si è lavorato alla realizzazione del Portale Nazionale degli Open Data Meteorologici  allo scopo di consentire la condivisione, la visualizzazione, l’accesso e il riutilizzo di dati osservativi, di analisi e di previsioni storiche e in tempo reale, con elevata accuratezza. Si tratta di una piattaforma per l’aggregazione dei dati meteo a livello nazionale che consente di rendere accessibili a tutti in modalità open data CC by 4.0 più di 500GB di dati al giorno. Fra questi i dati previsionali sull’Italia e sul Mediterraneo, i dati Radar, i dati osservativi delle stazioni a terra. Tutto ciò grazie alla collaborazione con la Protezione Civile, l’Agenzia ItaliaMeteo Arpa Emilia Romagna, Arpa Piemonte e l’Aereonautica Militare.
Cineca ha avuto in Mistral un triplice ruolo: oltre a coordinare il progetto, ha fornito risorse di calcolo e implementato l’intera piattaforma Meteo-Hub per la gestione e il post processing dei dati, nello specifico sviluppando diversi strumenti di visualizzazione dei dati osservati e previsionali. 
Un’azione simile è stata portata avanti dal Cineca anche in ambito clima. Infatti, il territorio italiano, situato al centro della regione mediterranea, sarà particolarmente colpito dai cambiamenti indotti dal riscaldamento globale, a causa della sua maggiore suscettibilità a eventi estremi più frequenti e più intensi. Inoltre, le osservazioni degli ultimi decenni indicano che le temperature medie ed estreme sono aumentate in diverse regioni del Mediterraneo e che le precipitazioni sono diminuite, soprattutto nella stagione calda.
L'agricoltura intelligente e le pratiche di gestione del territorio richiedono di affrontare sia le sfide che le opportunità legate all'adattamento alla variabilità climatica e alla mitigazione dei cambiamenti climatici. Per sostenere tali percorsi, è possibile sfruttare le nostre crescenti capacità di calcolo e la crescente quantità e qualità dei dati. 
Un elemento essenziale del progetto HIGHLANDER citato precedentemente è la realizzazione del portale dati dove sono disponibili i dataset creati nel contesto del progetto ma anche l’accesso ad una serie di applicazione a valle dei dati climatici prodotti grazie all’uso del supercalcolo che gli utenti possono visualizzare ed esplorare.
Fra queste applicazioni ad esempio gli utenti possono accedere a servizi per la disponibilità delle risorse idriche, la prevenzione degli incendi e la tutela del patrimonio boschivo, con algoritmi in grado di fare simulazioni sulla pericolosità dell'innesto di un incendio in un determinato ambiente; la valutazione della possibile erosione del suolo e quindi quali scelte compiere per perdere meno massa possibile, ma anche quantificare il rischio frane di una determinata zona, la vocazione agricola dei diversi territori, il cambiamento degli habitat boschivi, il benessere umano e degli animali.
La possibilità di utilizzare proiezioni climatiche ad alta risoluzione sull’Italia ha permesso di arrivare ad alcuni risultati in ambito agricoltura e territorio interessanti, come: la coltivazione del kiwi, molto diffusa in Romagna, messa seriamente a rischio perché richiede troppa acqua; quella del mais minacciata dalle micotossine, il cui proliferare è favorito dalle alte temperature.
Misurando i valori di temperatura e umidità si può valutare l'indice di malessere sia per le persone che per gli animali. Secondo possibili scenari si è arrivati a prevedere che nel 2050 ogni singola mucca potrà produrre quotidianamente fino a mezzo litro di latte in meno rispetto a oggi. Le tome d'alpeggio in Piemonte che non avranno più le stesse caratteristiche, senza più l'erba e i fiori che conferiscono al latte vaccino quel sapore inconfondibile. 
Anche l'estensione e la vivacità di certe produzioni vitivinicole - e il profumo e l'acidità di alcune etichette – saranno messe a rischio.

figura 2

Figura 2: Il supercomputer Leonardo del Cineca.

Cosa sta succedendo in Italia e in Europa in ambito Supercalcolo?

L’Italia nel 2018 ha deciso di far parte dell’iniziativa EuroHPC Joint Undertaking, un’iniziativa congiunta tra l’Unione Europea, i paesi firmatari e partner privati creata per aprire la strada al supercalcolo europeo. 
La sua missione è sviluppare un ecosistema implementando supercomputer di livello mondiale in tutta Europa.
Il supercomputer Leonardo  è stato progettato dal CINECA , oggi il centro di calcolo più grande d’Italia, uno dei più importanti al mondo, ed è stato installato a ottobre 2022 nel nuovo data center costruito appositamente per ospitare un sistema così complesso. Leonardo è il risultato di un investimento congiunto di 240 milioni di euro, da una parte EuroHPC Joint Undertaking e dall’altra il Ministero dell'Università e della Ricerca italiano. 
Posizionatosi al 4° posto della Top500 , la classifica che censisce i più potenti supercomputer al mondo, con solo il 65% dell’intera configurazione, ha potenza di calcolo di 240petaflop, cioè 240 milioni di miliardi di operazioni al secondo.
Leonardo è stato ospitato nel Tecnopolo di Bologna, sito in cui risiedono già da più di 2 anni anche i due cluster del centro meteo europeo ECMWF. 
Questo supercalcolatore supporterà ricercatori nella conduzione di progetti di ricerca anche “di frontiera”, come la medicina personalizzata, il cambiamento climatico, la ricerca di nuove fonti di energia, lo sviluppo di nuovi materiali, la bioingegneria, ma anche progetti di ricerca industriale ad esempio basati sull’intelligenza artificiale, o lo sviluppo di digital twin.
Cineca è l’ente che ha coordinato il progetto ed è anche responsabile di gestire il supercalcolatore. È un Consorzio Interuniversitario senza scopo di lucro formato da 112 Enti pubblici tra cui 2 ministeri, 70 università, 40 istituzioni pubbliche nazionali. Costituito nel 1969, Cineca oggi è il maggiore centro di calcolo in Italia, uno dei più importanti a livello mondiale e offre supporto alle attività della comunità scientifica tramite il supercalcolo e le sue applicazioni.