SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:kth-116737"
 

Sökning: id:"swepub:oai:DiVA.org:kth-116737" > A cross-validation ...

A cross-validation scheme for machine learning algorithms in shotgun proteomics

Granholm, Viktor, 1986- (författare)
Stockholms universitet,Institutionen för biokemi och biofysik,Science for Life Laboratory (SciLifeLab)
Noble, William Stafford (författare)
Käll, Lukas (författare)
KTH,Genteknologi,Science for Life Laboratory, SciLifeLab,Department of Electronic and Electrical Engineering, Trinity College Dublin, Dublin 2, Ireland
 (creator_code:org_t)
Springer Nature, 2012
2012
Engelska.
Ingår i: BMC Bioinformatics. - : Springer Nature. - 1471-2105. ; 13:S16, s. S3-
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • Peptides are routinely identified from mass spectrometry-based proteomics experiments by matching observed spectra to peptides derived from protein databases. The error rates of these identifications can be estimated by target-decoy analysis, which involves matching spectra to shuffled or reversed peptides. Besides estimating error rates, decoy searches can be used by semi-supervised machine learning algorithms to increase the number of confidently identified peptides. As for all machine learning algorithms, however, the results must be validated to avoid issues such as overfitting or biased learning, which would produce unreliable peptide identifications. Here, we discuss how the target-decoy method is employed in machine learning for shotgun proteomics, focusing on how the results can be validated by cross-validation, a frequently used validation scheme in machine learning. We also use simulated data to demonstrate the proposed cross-validation scheme's ability to detect overfitting.

Ämnesord

NATURVETENSKAP  -- Biologi (hsv//swe)
NATURAL SCIENCES  -- Biological Sciences (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Bioinformatik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Bioinformatics (hsv//eng)

Nyckelord

Tandem Mass-Spectrometry
False Discovery Rate
Peptide Identification
Statistical Significance
Protein Identifications
Database Search
Spectra
Model
Probabilities
Networks
Biochemistry towards Bioinformatics

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy