SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:umu-198931"
 

Sökning: id:"swepub:oai:DiVA.org:umu-198931" > Nonparametric baggi...

Nonparametric bagging clustering methods to identify latent structures from a sequence of dependent categorical data

Abramowicz, Konrad, 1983- (författare)
Umeå universitet,Institutionen för matematik och matematisk statistik
Sjöstedt de Luna, Sara, 1964- (författare)
Umeå universitet,Institutionen för matematik och matematisk statistik
Strandberg, Johan (författare)
Umeå universitet,Statistik
 (creator_code:org_t)
Elsevier, 2023
2023
Engelska.
Ingår i: Computational Statistics & Data Analysis. - : Elsevier. - 0167-9473 .- 1872-7352. ; 177
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • Nonparametric bagging clustering methods are studied and compared to identify latent structures from a sequence of dependent categorical data observed along a one-dimensional (discrete) time domain. The frequency of the observed categories is assumed to be generated by a (slowly varying) latent signal, according to latent state-specific probability distributions. The bagging clustering methods use random tessellations (partitions) of the time domain and clustering of the category frequencies of the observed data in the tessellation cells to recover the latent signal, within a bagging framework. New and existing ways of generating the tessellations and clustering are discussed and combined into different bagging clustering methods. Edge tessellations and adaptive tessellations are the new proposed ways of forming partitions. Composite methods are also introduced, that are using (automated) decision rules based on entropy measures to choose among the proposed bagging clustering methods. The performance of all the methods is compared in a simulation study. From the simulation study it can be concluded that local and global entropy measures are powerful tools in improving the recovery of the latent signal, both via the adaptive tessellation strategies (local entropy) and in designing composite methods (global entropy). The composite methods are robust and overall improve performance, in particular the composite method using adaptive (edge) tessellations.

Ämnesord

NATURVETENSKAP  -- Matematik -- Sannolikhetsteori och statistik (hsv//swe)
NATURAL SCIENCES  -- Mathematics -- Probability Theory and Statistics (hsv//eng)

Nyckelord

Bagging methods
Categorical dependent data
Clustering
Entropy
Statistics
statistik

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Abramowicz, Konr ...
Sjöstedt de Luna ...
Strandberg, Joha ...
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Matematik
och Sannolikhetsteor ...
Artiklar i publikationen
Computational St ...
Av lärosätet
Umeå universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy