SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:kth-221498"
 

Sökning: onr:"swepub:oai:DiVA.org:kth-221498" > Learning Decision T...

Learning Decision Trees from Histogram Data Using Multiple Subsets of Bins

Gurung, Ram B. (författare)
Stockholms universitet,Institutionen för data- och systemvetenskap,Stockholms universitet, Institutionen för data- och systemvetenskap
Lindgren, Tony (författare)
Stockholms universitet,Institutionen för data- och systemvetenskap,Stockholms universitet, Institutionen för data- och systemvetenskap
Boström, Henrik (författare)
Stockholms universitet,Institutionen för data- och systemvetenskap,Stockholms universitet, Institutionen för data- och systemvetenskap
 (creator_code:org_t)
AAAI Press, 2016
2016
Engelska.
Ingår i: Proceedings of the Twenty-Ninth International Florida Artificial Intelligence Research Society Conference. - : AAAI Press. - 9781577357568 ; , s. 430-435
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • The standard approach of learning decision trees from histogram data is to treat the bins as independent variables. However, as the underlying dependencies among the bins might not be completely exploited by this approach, an algorithm has been proposed for learning decision trees from histogram data by considering all bins simultaneously while partitioning examples at each node of the tree. Although the algorithm has been demonstrated to improve predictive performance, its computational complexity has turned out to be a major bottleneck, in particular for histograms with a large number of bins. In this paper, we propose instead a sliding window approach to select subsets of the bins to be considered simultaneously while partitioning examples. This significantly reduces the number of possible splits to consider, allowing for substantially larger histograms to be handled. We also propose to evaluate the original bins independently, in addition to evaluating the subsets of bins when performing splits. This ensures that the information obtained by treating bins simultaneously is an additional gain compared to what is considered by the standard approach. Results of experiments on applying the new algorithm to both synthetic and real world datasets demonstrate positive results in terms of predictive performance without excessive computational cost.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Systemvetenskap, informationssystem och informatik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Information Systems (hsv//eng)

Nyckelord

histogram variables
histogram tree
histogram classifier
Computer and Systems Sciences
data- och systemvetenskap

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy