SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Coster A)
 

Sökning: WFRF:(Coster A) > (2000-2004) > Capturing whole-gen...

Capturing whole-genome characteristics in short sequences using a naïve Bayesian classifier

Sandberg, R (författare)
Karolinska Institutet
Winberg, G (författare)
Karolinska Institutet
Branden, CI (författare)
visa fler...
Kaske, A (författare)
Ernberg, I (författare)
Karolinska Institutet
Coster, J (författare)
visa färre...
 (creator_code:org_t)
2001-08-01
2001
Engelska.
Ingår i: Genome research. - : Cold Spring Harbor Laboratory. - 1088-9051 .- 1549-5469. ; 11:8, s. 1404-1409
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • Bacterial genomes have diverged during evolution, resulting in clearcut differences in their nucleotide composition, such as their GC content. The analysis of complete sequences of bacterial genomes also reveals the presence of nonrandom sequence variation, manifest in the frequency profile of specific short oligonucleotides. These frequency profiles constitute highly specific genomic signatures. Based on these differences in oligonucleotide frequency between bacterial genomes, we investigated the possibility of predicting the genome of origin for a specific genomic sequence. To this end, we developed a naïve Bayesian classifier and systematically analyzed 28 eubacterial and archaeal genomes. We found that sequences as short as 400 bases could be correctly classified with an accuracy of 85%. We then applied the classifier to the identification of horizontal gene transfer events in whole-genome sequences and demonstrated the validity of our approach by correctly predicting the transfer of both the superoxide dismutase (sodC) and the bioC gene from Haemophilus influenzaeto Neisseria meningitis, correctly identifying both the donor and recipient species. We believe that this classification methodology could be a valuable tool in biodiversity studies.

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Sandberg, R
Winberg, G
Branden, CI
Kaske, A
Ernberg, I
Coster, J
Artiklar i publikationen
Genome research
Av lärosätet
Karolinska Institutet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy