SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:kth-173501"
 

Sökning: onr:"swepub:oai:DiVA.org:kth-173501" > The bulk and the ta...

  • Aurell, Erik,1961-KTH,Beräkningsvetenskap och beräkningsteknik (CST),Aalto University, Finland,Computational Biological Physics, CBP (författare)

The bulk and the tail of minimal absent words in genome sequences

  • Artikel/kapitelEngelska2016

Förlag, utgivningsår, omfång ...

  • 2016-04-04
  • Institute of Physics (IOP),2016
  • printrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:kth-173501
  • https://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-173501URI
  • https://doi.org/10.1088/1478-3975/13/2/026004DOI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:art swepub-publicationtype

Anmärkningar

  • QC 20161102
  • Minimal absent words (MAW) of a genomic sequence are subsequences that are absent themselves but the subwords of which are all present in the sequence. The characteristic distribution of genomic MAWs as a function of their length has been observed to be qualitatively similar for all living organisms, the bulk being rather short, and only relatively few being long. It has been an open issue whether the reason behind this phenomenon is statistical or reflects a biological mechanism, and what biological information is contained in absent words. % In this work we demonstrate that the bulk can be described by a probabilistic model of sampling words from random sequences, while the tail of long MAWs is of biological origin. We introduce the novel concept of a core of a minimal absent word, which are sequences present in the genome and closest to a given MAW. We show that in bacteria and yeast the cores of the longest MAWs, which exist in two or more copies, are located in highly conserved regions the most prominent example being ribosomal RNAs (rRNAs). We also show that while the distribution of the cores of long MAWs is roughly uniform over these genomes on a coarse-grained level, on a more detailed level it is strongly enhanced in 3' untranslated regions (UTRs) and, to a lesser extent, also in 5' UTRs. This indicates that MAWs and associated MAW cores correspond to fine-tuned evolutionary relationships, and suggest that they can be more widely used as markers for genomic complexity.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • Innocenti, Nicolas,1986-KTH,Beräkningsvetenskap och beräkningsteknik (CST),The Hebrew University of Jerusalem, Israel,Computational Biological Physics, CBP(Swepub:kth)u1484r04 (författare)
  • Zhou, Hai-JunState Key Laboratory of Theoretical Physics, Institute of Theoretical Physics, Chinese Academy of Sciences, Beijing 100190, China (författare)
  • KTHBeräkningsvetenskap och beräkningsteknik (CST) (creator_code:org_t)

Sammanhörande titlar

  • Ingår i:Physical Biology: Institute of Physics (IOP)13:21478-39671478-3975

Internetlänk

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Aurell, Erik, 19 ...
Innocenti, Nicol ...
Zhou, Hai-Jun
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Biologi
och Biofysik
NATURVETENSKAP
NATURVETENSKAP
och Biologi
och Evolutionsbiolog ...
NATURVETENSKAP
NATURVETENSKAP
och Biologi
och Genetik
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Bioinformatik
NATURVETENSKAP
NATURVETENSKAP
och Fysik
Artiklar i publikationen
Physical Biology
Av lärosätet
Kungliga Tekniska Högskolan

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy