SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:research.chalmers.se:efecdbb6-0ca1-48a2-ad65-1dfc8dacfa6b"
 

Sökning: id:"swepub:oai:research.chalmers.se:efecdbb6-0ca1-48a2-ad65-1dfc8dacfa6b" > Towards automated d...

Towards automated detection of data pipeline faults

Munappy, Aiswarya Raj, 1990 (författare)
Chalmers tekniska högskola,Chalmers University of Technology,Chalmers
Bosch, Jan, 1967 (författare)
Chalmers tekniska högskola,Chalmers University of Technology,Chalmers
Olsson, Helena Holmström (författare)
Malmö universitet,Institutionen för datavetenskap och medieteknik (DVMT)
visa fler...
Wang, Tian J. (författare)
Telefonaktiebolaget L M Ericsson,Ericsson,Ericsson, Gothenburg, Sweden.
visa färre...
 (creator_code:org_t)
IEEE, 2020
2020
Engelska.
Ingår i: Proceedings - Asia-Pacific Software Engineering Conference, APSEC. - : IEEE. - 1530-1362. ; 2020-December, s. 346-355, s. 346-355
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Data pipelines play an important role throughout the data management process. It automates the steps ranging from data generation to data reception thereby reducing the human intervention. A failure or fault in a single step of a data pipeline has cascading effects that might result in hours of manual intervention and clean-up. Data pipeline failure due to faults at different stages of data pipelines is a common challenge that eventually leads to significant performance degradation of data-intensive systems. To ensure early detection of these faults and to increase the quality of the data products, continuous monitoring and fault detection mechanism should be included in the data pipeline. In this study, we have explored the need for incorporating automated fault detection mechanisms and mitigation strategies at different stages of the data pipeline. Further, we identified faults at different stages of the data pipeline and possible mitigation strategies that can be adopted for reducing the impact of data pipeline faults thereby improving the quality of data products. The idea of incorporating fault detection and mitigation strategies is validated by realizing a small part of the data pipeline using action research in the analytics team at a large software-intensive organization within the telecommunication domain.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Annan data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Other Computer and Information Science (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Programvaruteknik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Software Engineering (hsv//eng)
NATURVETENSKAP  -- Biologi -- Bioinformatik och systembiologi (hsv//swe)
NATURAL SCIENCES  -- Biological Sciences -- Bioinformatics and Systems Biology (hsv//eng)

Nyckelord

fault- tolerance
failure recovery
fault detection
anomalies
component
mitigation
robustness
data quality
data pipeline

Publikations- och innehållstyp

kon (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy