SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(del Risco Norrlid Lilián)
 

Sökning: WFRF:(del Risco Norrlid Lilián) > Pitfalls of Assessi...

Pitfalls of Assessing Extracted Hierarchies for Multi-Class Classification

Del Moral, Pablo, 1989- (författare)
Högskolan i Halmstad,Akademin för informationsteknologi
Nowaczyk, Sławomir, 1978- (författare)
Högskolan i Halmstad,Akademin för informationsteknologi
Sant'Anna, Anita, 1983- (författare)
Högskolan i Halmstad,Akademin för informationsteknologi
visa fler...
Pashami, Sepideh, 1985- (författare)
Högskolan i Halmstad,Akademin för informationsteknologi
visa färre...
 (creator_code:org_t)
Engelska.
  • Annan publikation (övrigt vetenskapligt/konstnärligt)
Abstract Ämnesord
Stäng  
  • Using hierarchies of classes is one of the standard methods to solve multi-class classification problems. In the literature, selecting the right hierarchy is considered to play a key role in improving classification performance. Although different methods have been proposed, there is still a lack of understanding of what makes a hierarchy good and what makes a method to extract hierarchies perform better or worse.To this effect, we analyze and compare some of the most popular approaches to extracting hierarchies. We identify some common pitfalls that may lead practitioners to make misleading conclusions about their methods.To address some of these problems, we demonstrate that using random hierarchies is an appropriate benchmark to assess how the hierarchy's quality affects the classification performance.In particular, we show how the hierarchy's quality can become irrelevant depending on the experimental setup: when using powerful enough classifiers, the final performance is not affected by the quality of the hierarchy. We also show how comparing the effect of the hierarchies against non-hierarchical approaches might incorrectly indicate their superiority.Our results confirm that datasets with a high number of classes generally present complex structures in how these classes relate to each other. In these datasets, the right hierarchy can dramatically improve classification performance.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)

Nyckelord

Hierarchical Multi-class Classification
Multi-class Classification
Class Hierarchies

Publikations- och innehållstyp

vet (ämneskategori)
ovr (ämneskategori)

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy