SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:uu-97961"
 

Sökning: onr:"swepub:oai:DiVA.org:uu-97961" > De novo search for ...

  • Larsson, PontusUppsala universitet,Institutionen för cell- och molekylärbiologi (författare)

De novo search for non-coding RNA genes in the AT-rich genome of Dictyostelium discoideum : Performance of Markov-dependent genome feature scoring

  • Artikel/kapitelEngelska2008

Förlag, utgivningsår, omfång ...

  • 2008-03-17
  • Cold Spring Harbor Laboratory,2008
  • printrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:uu-97961
  • https://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-97961URI
  • https://doi.org/10.1101/gr.069104.107DOI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:art swepub-publicationtype

Anmärkningar

  • Genome data are increasingly important in the computational identification of novel regulatory non-coding RNAs (ncRNAs). However, most ncRNA gene-finders are either specialized to well-characterized ncRNA gene families or require comparisons of closely related genomes. We developed a method for de novo screening for ncRNA genes with a nucleotide composition that stands out against the background genome based on a partial sum process. We compared the performance when assuming independent and first-order Markov-dependent nucleotides, respectively, and used Karlin-Altschul and Karlin-Dembo statistics to evaluate the significance of hits. We hypothesized that a first-order Markov-dependent process might have better power to detect ncRNA genes since nearest-neighbor models have been shown to be successful in predicting RNA structures. A model based on a first-order partial sum process (analyzing overlapping dinucleotides) had better sensitivity and specificity than a zeroth-order model when applied to the AT-rich genome of the amoeba Dictyostelium discoideum. In this genome, we detected 94% of previously known ncRNA genes (at this sensitivity, the false positive rate was estimated to be 25% in a simulated background). The predictions were further refined by clustering candidate genes according to sequence similarity and/or searching for an ncRNA-associated upstream element. We experimentally verified six out of 10 tested ncRNA gene predictions. We conclude that higher-order models, in combination with other information, are useful for identification of novel ncRNA gene families in single-genome analysis of D. discoideum. Our generalizable approach extends the range of genomic data that can be searched for novel ncRNA genes using well-grounded statistical methods.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • Hinas, AndreaUppsala universitet,Institutionen för medicinsk biokemi och mikrobiologi(Swepub:uu)anhin676 (författare)
  • Ardell, David H.Uppsala universitet,Centrum för bioinformatik (författare)
  • Kirsebom, Leif A.Uppsala universitet,Institutionen för cell- och molekylärbiologi(Swepub:uu)leifkirs (författare)
  • Virtanen, AndersUppsala universitet,Molekylärbiologi (författare)
  • Söderbom, Fredrik (författare)
  • Uppsala universitetInstitutionen för cell- och molekylärbiologi (creator_code:org_t)

Sammanhörande titlar

  • Ingår i:Genome Research: Cold Spring Harbor Laboratory18:6, s. 888-8991088-90511549-5469

Internetlänk

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy