SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:umu-50313"
 

Sökning: id:"swepub:oai:DiVA.org:umu-50313" > Normalization of hi...

Normalization of high dimensional genomics data where the distribution of the altered variables is skewed

Landfors, Mattias (författare)
Umeå universitet,Institutionen för matematik och matematisk statistik,Klinisk bakteriologi,Patrik Rydén
Philip, Philge (författare)
Umeå universitet,Institutionen för molekylärbiologi (Teknisk-naturvetenskaplig fakultet),Per Stenberg
Rydén, Patrik (författare)
Umeå universitet,Institutionen för matematik och matematisk statistik,Patrik Rydén
visa fler...
Stenberg, Per (författare)
Umeå universitet,Institutionen för molekylärbiologi (Teknisk-naturvetenskaplig fakultet),Computational Life Science Cluster (CLiC)
visa färre...
 (creator_code:org_t)
2011-11-22
2011
Engelska.
Ingår i: PLOS ONE. - : Public Library of Science (PLoS). - 1932-6203. ; 6:11, s. e27942-
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • Genome-wide analysis of gene expression or protein binding patterns using different array or sequencing based technologies is now routinely performed to compare different populations, such as treatment and reference groups. It is often necessary to normalize the data obtained to remove technical variation introduced in the course of conducting experimental work, but standard normalization techniques are not capable of eliminating technical bias in cases where the distribution of the truly altered variables is skewed, i.e. when a large fraction of the variables are either positively or negatively affected by the treatment. However, several experiments are likely to generate such skewed distributions, including ChIP-chip experiments for the study of chromatin, gene expression experiments for the study of apoptosis, and SNP-studies of copy number variation in normal and tumour tissues. A preliminary study using spike-in array data established that the capacity of an experiment to identify altered variables and generate unbiased estimates of the fold change decreases as the fraction of altered variables and the skewness increases. We propose the following work-flow for analyzing high-dimensional experiments with regions of altered variables: (1) Pre-process raw data using one of the standard normalization techniques. (2) Investigate if the distribution of the altered variables is skewed. (3) If the distribution is not believed to be skewed, no additional normalization is needed. Otherwise, re-normalize the data using a novel HMM-assisted normalization procedure. (4) Perform downstream analysis. Here, ChIP-chip data and simulated data were used to evaluate the performance of the work-flow. It was found that skewed distributions can be detected by using the novel DSE-test (Detection of Skewed Experiments). Furthermore, applying the HMM-assisted normalization to experiments where the distribution of the truly altered variables is skewed results in considerably higher sensitivity and lower bias than can be attained using standard and invariant normalization methods.

Ämnesord

NATURVETENSKAP  -- Biologi -- Bioinformatik och systembiologi (hsv//swe)
NATURAL SCIENCES  -- Biological Sciences -- Bioinformatics and Systems Biology (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Bioinformatik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Bioinformatics (hsv//eng)
NATURVETENSKAP  -- Biologi -- Genetik (hsv//swe)
NATURAL SCIENCES  -- Biological Sciences -- Genetics (hsv//eng)

Nyckelord

skewness
normalization
genomics
array analysis
epigenetics
biology
biologi

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

  • PLOS ONE (Sök värdpublikationen i LIBRIS)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Landfors, Mattia ...
Philip, Philge
Rydén, Patrik
Stenberg, Per
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Biologi
och Bioinformatik oc ...
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Bioinformatik
NATURVETENSKAP
NATURVETENSKAP
och Biologi
och Genetik
Artiklar i publikationen
PLOS ONE
Av lärosätet
Umeå universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy