High-Performance I/O Programming Models for Exascale Computing

↓ Direkt till sidans innehåll
↓ Direkt till sidans sekundära innehåll (sidomenyn)

Sökning: onr:"swepub:oai:DiVA.org:kth-263196" > High-Performance I/...

1 av 1
Föregående post
Nästa post
Till träfflistan

High-Performance I/O Programming Models for Exascale Computing

Rivas-Gomez, Sergio (författare): KTH,Beräkningsvetenskap och beräkningsteknik (CST)

Markidis, Stefano (preses): KTH,Beräkningsvetenskap och beräkningsteknik (CST)

Laure, Erwin (preses): KTH,Beräkningsvetenskap och beräkningsteknik (CST)

visa fler...

Schulz, Martin (opponent): Technical University of Munich, 85748 Garching b. Munchen (Germany)

visa färre...

(creator_code:org_t)

ISBN 9789178733446
KTH Royal Institute of Technology, 2019
Engelska 135 s.
Serie: TRITA-EECS-AVL ; 2019:77

Relaterad länk:: https://kth.diva-por... (primary) (Raw object); visa fler...; https://urn.kb.se/re...; visa färre...

Doktorsavhandling (övrigt vetenskapligt/konstnärligt)

Abstract Ämnesord

Stäng

The success of the exascale supercomputer is largely dependent on novel breakthroughs that overcome the increasing demands for high-performance I/O on HPC. Scientists are aggressively taking advantage of the available compute power of petascale supercomputers to run larger scale and higher-fidelity simulations. At the same time, data-intensive workloads have recently become dominant as well. Such use-cases inherently pose additional stress into the I/O subsystem, mostly due to the elevated number of I/O transactions.As a consequence, three critical challenges arise that are of paramount importance at exascale. First, while the concurrency of next-generation supercomputers is expected to increase up to 1000x, the bandwidth and access latency of the I/O subsystem is projected to remain roughly constant in comparison. Storage is, therefore, on the verge of becoming a serious bottleneck. Second, despite upcoming supercomputers expected to integrate emerging non-volatile memory technologies to compensate for some of these limitations, existing programming models and interfaces (e.g., MPI-IO) might not provide any clear technical advantage when targeting distributed intra-node storage, let alone byte-addressable persistent memories. And third, even though compute nodes becoming heterogeneous can provide benefits in terms of performance and thermal dissipation, this technological transformation implicitly increases the programming complexity. Hence, making it difficult for scientific applications to take advantage of these developments.In this thesis, we explore how programming models and interfaces must evolve to address the aforementioned challenges. We present MPI storage windows, a novel concept that proposes utilizing the MPI one-sided communication model and MPI windows as a unified interface to program memory and storage. We then demonstrate how MPI one-sided can provide benefits on data analytics frameworks following a decoupled strategy, while integrating seamless fault-tolerance and out-of-core execution. Furthermore, we introduce persistent coarrays to enable transparent resiliency in Coarray Fortran, supporting the "failed images" feature recently introduced into the standard. Finally, we propose a global memory abstraction layer, inspired by the memory-mapped I/O mechanism of the OS, to expose different storage technologies using conventional memory operations.The outcomes from these contributions are expected to have a considerable impact in a wide-variety of scientific applications on HPC, both in current and next-generation supercomputers.

Framgången för superdatorer på exaskala kommer till stor del bero på nya genombrott som tillmötesgår ökande krav på högpresterande I/O inom högprestandaberäkningar. Forskare utnyttjar idag tillgänglig datorkraft hos superdatorer på petaskala för att köra större simuleringar med högre fidelitet. Samtidigt har dataintensiva tillämpningar blivit vanliga. Dessa skapar ytterligare påfrestningar på I/O subsystemet, framförallt genom det större antalet I/O transaktioner. Följdaktligen uppstår flera kritiska utmaningar som är av största vikt vid beräkningar på exaskala. Medan samtidigheten hos nästa generationens superdatorer förväntas öka med uppemot tre storleksordningar så beräknas bandvidden och accesslatensen hos I/O subsystemet förbli relativt oförändrad. Lagring står därför på gränsen till att bli en allvarlig flaskhals. Kommande superdatorer förväntas innehålla nya icke-flyktiga minnesteknologier för att kompensera för dessa begränsningar, men existerande programmeringsmodeller och gränssnitt (t.ex. MPI-IO) kommer eventuellt inte att ge några tydliga tekniska fördelar när de tillämpas på distribuerad intra-nod lagring, särskilt inte för byte-addresserbara persistenta minnen. Även om ökande heterogenitet hos beräkningsnoder kommer kunna ge fördelar med avseende på prestanda och termisk dissipation så kommer denna teknologiska transformation att medföra en ökning av programmeringskomplexitet, vilket kommer att försvåra för vetenskapliga tillämpningar att dra nytta av utvecklingen.I denna avhandling utforskas hur programmeringsmodeller och gränssnitt behöver vidareutvecklas för att kringgå de ovannämnda begränsningarna. MPI lagringsfönster kommer presenteras, vilket är ett nytt koncept som går ut på att använda den ensidiga MPI kommunikationsmodellen tillsammans med MPI fönster som ett enhetligt gränssnitt till programminne och lagring. Därefter demonstreras hur ensidig MPI kommunikation kan vara till gagn för dataanalyssystem genom en frikopplad strategi, samtidigt som den integrerar kontinuerlig feltolerans och exekvering utanför kärnan. Vidare introduceras persistenta coarrays för att möjliggöra transparant resiliens i Coarray Fortran, som stödjer “failed images” funktionen som nyligen införts i standarden. Slutligen föreslås ett globalt minnesabstraktionslager, som med inspiration av minnes-kartlagda I/O mekanismen hos operativsystemet exponerar olika lagringsteknologier med hjälp av konventionella minnesoperationer.Resultaten från dessa bidrag förväntas ha betydande påverkan för högprestandaberäkningar inom flera vetenskapliga tillämpningsområden, både för existerande och nästa generationens superdatorer.

Hitta via bibliotek

High-Performance I/O Programming Models for Exascale Computing (Sök publikationen i LIBRIS)

Till lärosätets databas

1 av 1
Föregående post
Nästa post
Till träfflistan

Hitta mer i SwePub

Av författaren/redakt...: Rivas-Gomez, Ser ...; Markidis, Stefan ...; Laure, Erwin; Schulz, Martin

Om ämnet

NATURVETENSKAP: NATURVETENSKAP; och Data och informa ...; och Datorteknik

Delar i serien: TRITA-EECS-AVL ;

Av lärosätet: Kungliga Tekniska Högskolan

Sök utanför SwePub

Sök vidare i:: Google; Google Book Search; Google Scholar

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

LIBRIS.kb.se

High-Performance I/O Programming Models for Exascale Computing

Ämnesord

Publikations- och innehållstyp

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Sök utanför SwePub