SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:umu-219262"
 

Sökning: onr:"swepub:oai:DiVA.org:umu-219262" > Finding fitness :

Finding fitness : empirical and theoretical explorations of inferring fitness effects from population-level SNP data

Andersson, Bea Angelica, 1992- (författare)
Umeå universitet,Institutionen för ekologi, miljö och geovetenskap,Umeå Plant Science Centre (UPSC),Evolutionary Biology (PI: Xiao-Ru Wang)
Wang, Xiao-Ru, Professor (preses)
Umeå universitet,Institutionen för ekologi, miljö och geovetenskap,Umeå Plant Science Centre (UPSC)
Brännström, Åke, Professor, 1975- (preses)
Umeå universitet,Institutionen för matematik och matematisk statistik
visa fler...
Slotte, Tanja, Professor (opponent)
Department of Ecology, Environment and Plant Sciences, Stockholm University, Sweden
visa färre...
 (creator_code:org_t)
ISBN 9789180702690
Umeå University, 2024
Engelska 45 s.
  • Doktorsavhandling (övrigt vetenskapligt/konstnärligt)
Abstract Ämnesord
Stäng  
  • The distribution of fitness effects (DFE) describes the likelihood that a new mutation has a specific effect on the fitness of an individual in a given population. The shape of the DFE is a result of several factors such as population size, mating system and selective environment, and can in turn influence the evolutionary potential of a species. The DFE has long been a field of intense research, but particularly since molecular methods enabled us to study of genetic variation in organisms empirically. This research has led to the development of several statistical methods that use population-level frequencies of single nucleotide polymorphisms (SNPs) to infer the DFE. However, these methods rely on assumptions about the data and the organism itself, which could potentially affect the accuracy of the inferences. In this thesis, I describe how two major factors – data quality and inbreeding – can affect the accuracy of DFE inferences. I also show how and when to (and when not to) use DFE inference methods based on SNP frequencies.All genomic datasets contain inaccuracies and some level of uncertainty. The data sets are therefore often treated to remove the gaps or less reliable information, such as genotypes with low coverage. Some data sets need heavy filtering, which could reduce the amount of data available for analysis. We show that the choice of filter method affects the size of the final data set and the accuracy of the estimated DFE.Many DFE estimation software assumes random mating within the study population. Unfortunately, this assumption induces some error when trying to estimate the DFE in inbred or selfing species. Some have assumed that this is a result of high rates of homozygosity in the data, and should only be a problem in populations with very high rates of selfing (>99%). We show that accuracy of the estimated DFE decreases already at relatively low rates of selfing (70%) and that removing homozygosity does not improve the accuracy, implying that another mechanism could be causing the error.
  • Nya mutationer kan ha olika effekt på fitness hos en individ; en mutation kan vara negativ, neutral eller positiv för överlevnad och/eller reproduktion. Sannolikheten att en mutation har en specifik påverkan på fitness kan beskrivas av fördelningen av fitnesseffekter, i vetenskaplig litteratur kallad "the distribution of fitness effects” eller DFE. Formen på DFEn hos en art eller population påverkas av faktorer såsom effektiv populationsstorlek, parningssystem och miljö, och kan i sin tur påverka artens/populationens evolutionspotential. Hur DFEn ser ut hos olika arter har länge varit ett aktivt forskningsfält, och fick ytterligare ett uppsving efter att molekylära metoder gjorde det möjligt att studera genetisk variation empiriskt. Denna utveckling ledde även till att en uppsjö av statistiska metoder utvecklades för att uppskatta DFEn från allelfrekvenser hos punktmutationer i en population. Dessa modeller bygger emellertid på ett antal antaganden om populationen och datan, där osanna antaganden kan orsaka feluppskattningar av DFEn. I denna avhandling undersöker jag hur två faktorer – datakvalitet och inavel – kan påverka hur väl dessa metoder uppskattar den korrekta DFEn. Jag beskriver även hur och när man bör (och inte bör) använda allelefrekvensbaserade metoder för att uppskatta DFE hos en art.Alla genomiska dataset innehåller en viss grad av osäkerhet och kan sakna information för vissa individer och/eller platser i genomet. Denna sortens data brukar därför förbehandlas för att exkludera obefintliga, osäkra och eventuellt felaktiga data. Vissa behandlingsmetoder kan exkludera stora delar data, beroende på hur mönstret av osäker data ser ut. Jag visar att mängden och magnituden hos feluppskattningar av DFEn beror på både valet av filtreringsmetod och storleken på det slutgiltiga datasetet.  Många metoder för DFE-uppskattning utgår ifrån teoretiska modeller som antar slumpmässig parning inom studiepopulationen. Detta antagande kan dock introducera feluppskattningar när de används på inavlade och/eller självbefruktande arter. Vissa tidigare studier har påstått att denna effekt beror på inavlade arters höga homozygositet, och bara borde vara ett problem vid stark inavel eller nästan uteslutande (>99%) självbefruktning. Jag beskriver här att feluppskattningar av DFEn blir vanligare redan vid lägre förekomst av självbefruktning (70-80%), samt att homozygositet i sig inte verkar vara den ledande orsaken till feluppskattningar av DFEn. Detta tyder därmed på att någon annan mekanism orsakar de större felmarginaler vi ser vid DFE-analys av inavlade arter.

Ämnesord

NATURVETENSKAP  -- Biologi -- Evolutionsbiologi (hsv//swe)
NATURAL SCIENCES  -- Biological Sciences -- Evolutionary Biology (hsv//eng)

Nyckelord

distribution of fitness effects
site frequency spectra
missing data filtering
downsampling
imputation
sample size
population structure
inbreeding
selfing
homozygosity
Arabidopsis
Pinus
DFE-alpha
SLiM
population genomics
adaptation
biology
biologi
evolutionär genetik
evolutionary genetics
populationsbiologi
Population Biology
molekylärbiologi
Molecular Biology
Genetics
genetik

Publikations- och innehållstyp

vet (ämneskategori)
dok (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy