• Non ci sono risultati.

GPU computing at work: nuove prospettive per il calcolo ad alte prestazioni

N/A
N/A
Protected

Academic year: 2021

Condividi "GPU computing at work: nuove prospettive per il calcolo ad alte prestazioni"

Copied!
3
0
0

Testo completo

(1)

Jazz, il nuovo cervello elettronico basato su Gra-phics Processing Unit (GPU), darà ai ricercatori una nuova visione della scienza del futuro, quella fatta daicervelli umani, appunto, senza i quali il solo si-licio è di poca o nulla utilità. Fornisce, inoltre, un innovativo modello di interazione tra le persone impegnate nel GPU computing che, con capacità e passione, hanno ottenuto risultati mai raggiunti dal Consorzio nel calcolo ad alte prestazioni.

L’avvio del nuovo sistema Jazz, basato sulle GPU Fermi di NVIDIA, ha aperto innovativi orizzonti per il calcolo scientifico fornendo, nell’ambito delle scienze computazionali, soluzioni alternative ai problemi più impegnativi. Il nuovo sistema di calcolo sarà, per i ricercatori, un eccezionale strumento, dove visione grafica avanzata e cal-colo numerico intensivo forniranno una piattaforma integrata per l’avanzamento delle conoscenze, per fare cioè, la scienza del futuro. Al CASPUR, nell’ambito del progetto GPU computing, è stato realizzato un modello di interazione uomo-macchina che estende la rete fisica a quella delle persone e delle loro idee coinvolte nel-l’ottimizzazione della nuova risorsa. Una rete fatta soprattutto da esseri umani che, con capacità e passione, hanno agito in sincronia da varie parti del globo per rendere disponibile agli utenti del Consorzio il primo sistema in Europa basato su questa innovativa tecnologia, capace di prestazioni da supercomputer, ma ad una frazione dei costi di esercizio dei sistemi HPC tradizionali. Il sistema Jazz, sin dal suo arrivo ad agosto, ha suscitato l’in-teresse sia, ovviamente, dei costruttori sia dei ricercatori più orientati alle nuove tecnologie del supercalcolo. Questa spinta ha indotto il Consorzio a costituire, nel settore HPC, un gruppo interno di lavoro con il compito di installare i sistemi operativi sul nuovo sistema, fornirlo di tutto il software di sviluppo necessario e corredarlo di tutte quelle applicazioni user-ready che la nostra utenza ha a disposizione su gli altri sistemi di supercalcolo

GPU COMPUTING AT WORK: NUOVE PROSPETTIVE

PER IL CALCOLO AD ALTE PRESTAZIONI

Massimiliano Fatica mfatica@nvidia.com NVIDIA Corporation Xavier Pillons xavier.pillons@microsoft.com Microsoft Corporation Nico Sanna n.sanna@caspur.it Gruppo HPC del CASPUR

Fig. 1Scalabilità del codice HPL sul cluster Jazz (2 Procs per nodo).

HPL benchmark

Windows HPC Server 2008 R2 Linux 5.4

(2)

20

del Consorzio. Allo stesso tempo, una volta che il cluster è stato messo in linea in via sperimentale (dopo una sola settimana) sono iniziate le attività di ottimizzazione della configurazione del sistema per ottenere le sue migliori prestazioni. Appena rilasciato il sistema Jazz in pre-release, la società NVIDIA USA ha iniziato il lavoro di registrazione “fine” del codice High Performance Linpack (HPL) adattandolo alla configurazione via via resa disponibile dal CASPUR e i primi risultati non si sono fatti attendere. Infatti, già i primi di settembre il cluster è stato usato per le esercitazioni della Scuola estiva di Calcolo Avanzato 2010 con prestazioni di nodo (2 CPU + 2 GPU) pari a 650 GFLOPS.

Successivamente è iniziata una fase di rifinitura delle condizioni ottimali per il funzionamento del codice HPL, con l’ottimizzazione dei suoi parametri interni, delle modalità di comunicazione tra i nodi di calcolo e della con-figurazione delle GPU Fermi (Tesla S2050). Contemporaneamente, la Microsoft francese, ha iniziato i primi test della versione Windows HPL e, non appena possibile, sono stati eseguiti i run di prova, oltre che su Linux, anche su sistema operativo Windows con il risultato finale di avere una configurazione dual-boot ottimizzata per i due ambienti di calcolo. Intanto, procedeva sempre più speditamente il lavoro svolto dal gruppo GPU sui codici di scienze computazionali e sempre più codici venivano compilati e provati sul nuovo sistema; inoltre, quando ne-cessario, si provvedeva ad un ulteriore rifinitura della configurazione per ottenere le massime prestazioni. Nella seconda metà di ottobre, l’intero sistema era pronto per le misure di benchmark HPL e dei consumi elettrici con l’obiettivo, ora, di ottimizzare oltre alle prestazioni anche i consumi energetici. I risultati sono stati esaltanti e utilizzando l’intero cluster Jazz è stato possibile ottenere fino a 23 TFLOPS con un consumo di corrente elettrica di soli 26 KW (escluso il raffreddamento). Questo risultato equivale ad avere un rapporto prestazioni/consumi di 886 MFLOPS/Watt e ha permesso al CASPUR di entrare nella lista di novembre 2010 della Little Green 500 al 5° posto assoluto (1° centro in Europa). Un traguardo di prestigio ottenuto sia con l’impegno del personale del Consorzio, sia grazie alle aziende che hanno creduto in questa iniziativa, formando un team eccezionale per capacità e conoscenze sulle tecnologie di supercalcolo e sulle loro applicazioni. Un obiettivo certamente da citare con orgoglio, ma anche un risultato tangibile verso un supercalcolo “sostenibile” che permetterà al Con-sorzio un ingente risparmio nei consumi di energia elettrica, in quanto consuma circa un quinto dei sistemi multi-core (fatti cioè di sole CPU) di pari prestazioni.

Ma questo risultato non ha fermato la spinta a procedere verso i nuovi orizzonti forniti da questa architettura ibrida e sempre più applicazioni1sono state portate sulla nuova macchina. Vari utilizzi di Matlab sono stati provati

e valutati nelle funzionalità al momento più efficienti, così come codici di comunità scientifica quali AMBER, GROMACS e NAMD sono stati ottimizzati in innumerevoli serie di test, per non dimenticare i codici per la grafica

(3)

come il Reality Server di Mental Images con prestazioni di rendering strabilianti sulla nostra piattaforma GPU multinodo. Giusto a titolo di esempio è il caso di citare i benchmark di Dinamica Molecolare classica eseguiti sul sistema STMV di oltre un milione di atomi dove il cluster Jazz è stato capace di arrivare fino a 0.3 days / ns (circa 7 ore per nanosecondo). Un risultato eccezionale se si considera che utilizzando una sola delle CPU di Jazz ci sarebbero voluti 166 days / ns, ovvero un incremento di prestazioni di oltre 500 volte.

Questi risultati sono stati riconosciuti da NVIDIA USA che ha nominato il CASPUR come Cuda Research Center per gli anni 2010 e 2011. Questo è stato anche un attestato alle qualità espresse dal Consorzio negli ultimi anni nel campo del GPU computing che lo hanno portato in una posizione di vertice che comprende i venti centri più all’avanguardia al mondo in questo innovativo settore tecnologico del supercomputing.

NOTE

1AbInit; AMBER; AutoDock; BEAST/beagle; BigDFT; CP2K; CUDABLAST; GPUMAT; GROMACS; LAMMPS;

Kooderive-QuantLib; MATLAB; NAMD; SCELib. BIBLIOGRAFIA ESSENZIALE

HPL benchmark: Dongarra, J., et al. (2003). The LINPACK Benchmark: past, present and future, Concurrency Computat, Pract. Exper. 15(9), 803-820, http://dx.doi.org/10.1002/cpe.728.

Lista Little Green 500: http://www.green500.org/lists/2010/11/little/list.php. Cuda Research Center: http://research.nvidia.com/content/cuda-research-centers.

Riferimenti

Documenti correlati

Daniel Béguin (University of Applied Sciences and Arts Western Switzerland) Patrice Prunier (University of Applied Sciences and Arts Western Switzerland) Rüdiger Kaufmann (University

• Strumenti finanziari risk rate sensitive: modelli di pricing e misurazione del capitale a rischio (DIBAM e ICCREA Banca, holding delle Banche di Credito Cooperativo), il cui

Durante il 2007, il calcolo scientifico è stato, come al solito, l’elemento trainante di buona parte delle attività del Consorzio; nel corso dell’anno abbiamo riscontrato un

• When a kernel function is launched from the host side, execution is moved to a device where a large number of threads are generated and each thread executes the statements

• When the __device__ qualifier is used by itself, it declares the variable resides in global memory. Is accessible from all the threads within the grid and from the host through

More specifically, the GPU is especially well-suited to address problems that can be expressed as data-parallel computations the same program is executed on many data elements

Trentini, Claudia 2009, Essays on Human Capital Accumulation and Inequality European University Institute... Figure 1: Transition labor

I nuraghi con maggior portata visiva sono Puisteris, Serra Sa Furca, Cobaia, Cuccurada, Is Carrelis e Pranu Ollastus (valori tra 1.5 e 1.2 milioni di celle), tutti posizionati