SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Åhlfeldt Hans)
 

Sökning: WFRF:(Åhlfeldt Hans) > A Data Pre-processi...

A Data Pre-processing Method to Increase Efficiency and Accuracy in Data Mining

Razavi, Amir Reza (författare)
Linköpings universitet,Medicinsk informatik,Tekniska högskolan
Gill, Hans (författare)
Linköpings universitet,Medicinsk informatik,Tekniska högskolan
Åhlfeldt, Hans (författare)
Linköpings universitet,Medicinsk informatik,Tekniska högskolan
visa fler...
Shahsavar, Nosrat (författare)
Linköpings universitet,Medicinsk informatik,Tekniska högskolan
visa färre...
 (creator_code:org_t)
Berlin, Heidelberg : Springer Berlin Heidelberg, 2005
2005
Engelska.
Ingår i: 10th Conference on Artificial Intelligence in Medicine, AIME2005 - Aberdeen, UK. - Berlin, Heidelberg : Springer Berlin Heidelberg. - 9783540278313 ; , s. 434-443
  • Konferensbidrag (övrigt vetenskapligt/konstnärligt)
Abstract Ämnesord
Stäng  
  • In medicine, data mining methods such as Decision Tree Induction (DTI) can be trained for extracting rules to predict the outcomes of new patients. However, incompleteness and high dimensionality of stored data are a problem. Canonical Correlation Analysis (CCA) can be used prior to DTI as a dimension reduction technique to preserve the character of the original data by omitting non-essential data. In this study, data from 3949 breast cancer patients were analysed. Raw data were cleaned by running a set of logical rules. Missing values were replaced using the Expectation Maximization algorithm. After dimension reduction with CCA, DTI was employed to analyse the resulting dataset. The validity of the predictive model was confirmed by ten-fold cross validation and the effect of pre-processing was analysed by applying DTI to data without pre-processing. Replacing missing values and using CCA for data reduction dramatically reduced the size of the resulting tree and increased the accuracy of the prediction of breast cancer recurrence.

Nyckelord

TECHNOLOGY
TEKNIKVETENSKAP

Publikations- och innehållstyp

vet (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy