SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:umu-145462"
 

Sökning: onr:"swepub:oai:DiVA.org:umu-145462" > On solving separabl...

  • Myllykoski, Mirko,1988-Umeå universitet,Institutionen för datavetenskap,Department of Mathematical Information Technology, University of Jyväskylä (författare)

On solving separable block tridiagonal linear systems using a GPU implementation of radix-4 PSCR method

  • Artikel/kapitelEngelska2018

Förlag, utgivningsår, omfång ...

  • Elsevier,2018
  • electronicrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:umu-145462
  • https://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-145462URI
  • https://doi.org/10.1016/j.jpdc.2018.01.004DOI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:art swepub-publicationtype

Anmärkningar

  • Partial solution variant of the cyclic reduction (PSCR) method is a direct solver that can be applied to certain types of separable block tridiagonal linear systems. Such linear systems arise, e.g., from the Poisson and the Helmholtz equations discretized with bilinear finite-elements. Furthermore, the separability of the linear system entails that the discretization domain has to be rectangular and the discretization mesh orthogonal. A generalized graphics processing unit (GPU) implementation of the PSCR method is presented. The numerical results indicate up to 24-fold speedups when compared to an equivalent CPU implementation that utilizes a single CPU core. Attained floating point performance is analyzed using roofline performance analysis model and the resulting models show that the attained floating point performance is mainly limited by the off-chip memory bandwidth and the effectiveness of a tridiagonal solver used to solve arising tridiagonal subproblems. The performance is accelerated using off-line autotuning techniques.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • Rossi, TuomoDepartment of Mathematical Information Technology, University of Jyväskylä (författare)
  • Toivanen, JariDepartment of Mathematical Information Technology, University of Jyväskylä; Department of Aeronautics & Astronautics, Stanford University (författare)
  • Umeå universitetInstitutionen för datavetenskap (creator_code:org_t)

Sammanhörande titlar

  • Ingår i:Journal of Parallel and Distributed Computing: Elsevier115, s. 56-660743-73151096-0848

Internetlänk

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Myllykoski, Mirk ...
Rossi, Tuomo
Toivanen, Jari
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datavetenskap
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Programvarutekni ...
Artiklar i publikationen
Journal of Paral ...
Av lärosätet
Umeå universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy