SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:umu-145462"
 

Sökning: onr:"swepub:oai:DiVA.org:umu-145462" > On solving separabl...

LIBRIS Formathandbok  (Information om MARC21)
FältnamnIndikatorerMetadata
00003479naa a2200445 4500
001oai:DiVA.org:umu-145462
003SwePub
008180305s2018 | |||||||||||000 ||eng|
024a https://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-1454622 URI
024a https://doi.org/10.1016/j.jpdc.2018.01.0042 DOI
040 a (SwePub)umu
041 a engb eng
042 9 SwePub
072 7a ref2 swepub-contenttype
072 7a art2 swepub-publicationtype
100a Myllykoski, Mirko,d 1988-u Umeå universitet,Institutionen för datavetenskap,Department of Mathematical Information Technology, University of Jyväskylä4 aut0 (Swepub:umu)mimy0006
2451 0a On solving separable block tridiagonal linear systems using a GPU implementation of radix-4 PSCR method
264 1b Elsevier,c 2018
338 a electronic2 rdacarrier
520 a Partial solution variant of the cyclic reduction (PSCR) method is a direct solver that can be applied to certain types of separable block tridiagonal linear systems. Such linear systems arise, e.g., from the Poisson and the Helmholtz equations discretized with bilinear finite-elements. Furthermore, the separability of the linear system entails that the discretization domain has to be rectangular and the discretization mesh orthogonal. A generalized graphics processing unit (GPU) implementation of the PSCR method is presented. The numerical results indicate up to 24-fold speedups when compared to an equivalent CPU implementation that utilizes a single CPU core. Attained floating point performance is analyzed using roofline performance analysis model and the resulting models show that the attained floating point performance is mainly limited by the off-chip memory bandwidth and the effectiveness of a tridiagonal solver used to solve arising tridiagonal subproblems. The performance is accelerated using off-line autotuning techniques.
650 7a NATURVETENSKAPx Data- och informationsvetenskapx Datavetenskap0 (SwePub)102012 hsv//swe
650 7a NATURAL SCIENCESx Computer and Information Sciencesx Computer Sciences0 (SwePub)102012 hsv//eng
650 7a NATURVETENSKAPx Data- och informationsvetenskapx Programvaruteknik0 (SwePub)102052 hsv//swe
650 7a NATURAL SCIENCESx Computer and Information Sciencesx Software Engineering0 (SwePub)102052 hsv//eng
653 a Fast direct solver
653 a GPU computing
653 a Partial solution technique
653 a PSCR method
653 a Roofline model
653 a Separable block tridiagonal linear system
653 a business data processing
653 a administrativ databehandling
700a Rossi, Tuomou Department of Mathematical Information Technology, University of Jyväskylä4 aut
700a Toivanen, Jariu Department of Mathematical Information Technology, University of Jyväskylä; Department of Aeronautics & Astronautics, Stanford University4 aut
710a Umeå universitetb Institutionen för datavetenskap4 org
773t Journal of Parallel and Distributed Computingd : Elsevierg 115, s. 56-66q 115<56-66x 0743-7315x 1096-0848
856u https://umu.diva-portal.org/smash/get/diva2:1187714/FULLTEXT01.pdfx primaryx Raw objecty fulltext:postprint
856u https://jyx.jyu.fi/bitstream/123456789/57129/1/myllykoskirossitoivanenonsolving.pdf
8564 8u https://urn.kb.se/resolve?urn=urn:nbn:se:umu:diva-145462
8564 8u https://doi.org/10.1016/j.jpdc.2018.01.004

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Myllykoski, Mirk ...
Rossi, Tuomo
Toivanen, Jari
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datavetenskap
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Programvarutekni ...
Artiklar i publikationen
Journal of Paral ...
Av lärosätet
Umeå universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy