SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Fischer Jens)
 

Sökning: WFRF:(Fischer Jens) > (2015-2019) > Nek5000 with OpenACC

Nek5000 with OpenACC

Gong, Jing (författare)
KTH,SeRC - Swedish e-Science Research Centre,Parallelldatorcentrum, PDC
Markidis, Stefano (författare)
KTH,High Performance Computing and Visualization (HPCViz),SeRC - Swedish e-Science Research Centre
Schliephake, Michael (författare)
KTH,High Performance Computing and Visualization (HPCViz),SeRC - Swedish e-Science Research Centre
visa fler...
Laure, Erwin (författare)
KTH,High Performance Computing and Visualization (HPCViz),SeRC - Swedish e-Science Research Centre
Henningson, Dan (författare)
KTH,Stabilitet, Transition, Kontroll,SeRC - Swedish e-Science Research Centre
Schlatter, Philipp (författare)
KTH,Stabilitet, Transition, Kontroll,SeRC - Swedish e-Science Research Centre
Peplinski, Adam (författare)
Hart, Alistair (författare)
Doleschal, Jens (författare)
Henty, David (författare)
Fischer, Paul (författare)
visa färre...
 (creator_code:org_t)
2015-02-19
2015
Engelska.
Ingår i: Solving software challenges for exascale. - Cham : Springer International Publishing. - 9783319159751 - 9783319159768 ; , s. 57-68
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Nek5000 is a computational fluid dynamics code based on the spectral element method used for the simulation of incompressible flows. We follow up on an earlier study which ported the simplified version of Nek5000 to a GPU-accelerated system by presenting the hybrid CPU/GPU implementation of the full Nek5000 code using OpenACC. The matrix-matrix multiplication, the Nek5000 gather-scatter operator and a preconditioned Conjugate Gradient solver have implemented using OpenACC for multi-GPU systems. We report an speed-up of 1.3 on single node of a Cray XK6 when using OpenACC directives in Nek5000. On 512 nodes of the Titan supercomputer, the speed-up can be approached to 1.4. A performance analysis of the Nek5000 code using Score-P and Vampir performance monitoring tools shows that overlapping of GPU kernels with host-accelerator memory transfers would considerably increase the performance of the OpenACC version of Nek5000 code.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)

Nyckelord

GPU programming
Nek5000
OpenACC
Spectral element method

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy