SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:kth-221541"
 

Sökning: id:"swepub:oai:DiVA.org:kth-221541" > Regression Trees fo...

Regression Trees for Streaming Data with Local Performance Guarantees

Johansson, Ulf (författare)
Högskolan i Borås,Institutionen Handels- och IT-högskolan,CSL@BS
Sönströd, Cecilia (författare)
Högskolan i Borås,Institutionen Handels- och IT-högskolan,CSL@BS
Linusson, Henrik (författare)
Högskolan i Borås,Institutionen Handels- och IT-högskolan,CSL@BS
visa fler...
Boström, Henrik (författare)
Stockholms universitet,Institutionen för data- och systemvetenskap,Högskolan i Borås, Institutionen Handels- och IT-högskolan,Dept. of Computer and Systems Sciences Stockholm University, Sweden,Institutionen Handels- och IT-högskolan,CSL@BS
visa färre...
 (creator_code:org_t)
ISBN 9781479956661
IEEE, 2014
2014
Engelska.
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Online predictive modeling of streaming data is a key task for big data analytics. In this paper, a novel approach for efficient online learning of regression trees is proposed, which continuously updates, rather than retrains, the tree as more labeled data become available. A conformal predictor outputs prediction sets instead of point predictions; which for regression translates into prediction intervals. The key property of a conformal predictor is that it is always valid, i.e., the error rate, on novel data, is bounded by a preset significance level. Here, we suggest applying Mondrian conformal prediction on top of the resulting models, in order to obtain regression trees where not only the tree, but also each and every rule, corresponding to a path from the root node to a leaf, is valid. Using Mondrian conformal prediction, it becomes possible to analyze and explore the different rules separately, knowing that their accuracy, in the long run, will not be below the preset significance level. An empirical investigation, using 17 publicly available data sets, confirms that the resulting rules are independently valid, but also shows that the prediction intervals are smaller, on average, than when only the global model is required to be valid. All-in-all, the suggested method provides a data miner or a decision maker with highly informative predictive models of streaming data.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Systemvetenskap, informationssystem och informatik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Information Systems (hsv//eng)

Nyckelord

Conformal Prediction
Streaming data
Regression trees
Interpretable models
Machine learning
Data mining
data- och systemvetenskap

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy