Event description
Il seminario riporta le tecniche utilizzate per il porting di una libreria per il calcolo su GPU CUDA Nvidia GV100. Il codice di partenza in C++ con multithreading su openMP e l’instruction set AVX256 per il calcolo vettoriale è stato ottimizzato da 13 secondi (24 thread) a 1.3 secondi sulla scheda GPU utilizzando la doppia precisione.