SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:lup.lub.lu.se:5f7752f9-7c03-4785-a98f-b38d997bfdc2"
 

Sökning: id:"swepub:oai:lup.lub.lu.se:5f7752f9-7c03-4785-a98f-b38d997bfdc2" > Applicability Domai...

Applicability Domain Dependent Predictive Uncertainty in QSAR Regressions

Sahlin, Ullrika (författare)
Linnéuniversitetet,Lund University,Lunds universitet,Centrum för miljö- och klimatvetenskap (CEC),Naturvetenskapliga fakulteten,Centre for Environmental and Climate Science (CEC),Faculty of Science,Institutionen för biologi och miljö (BOM),Centre of Environmental and Climate Research, Lund University, Lund
Jeliazkova, N. (författare)
Ideaconsult Ltd, Sofia, Bulgaria
Öberg, Tomas (författare)
Linnéuniversitetet,Institutionen för biologi och miljö (BOM)
 (creator_code:org_t)
2013-10-07
2014
Engelska.
Ingår i: Molecular Informatics. - : Wiley. - 1868-1751 .- 1868-1743. ; 33:1, s. 26-35
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • Predictive models used in decision making, such as QSARs in chemical regulation or drug discovery, call for evaluated approaches to quantitatively assess associated uncertainty in predictions. Uncertainty in less reliable predictions may be captured by locally varying predictive errors. In the current study, model-based bootstrapping was combined with analogy reasoning to generate predictive distributions varying in magnitude over a model's domain of applicability. A resampling experiment based on PLS regressions on four QSAR data sets demonstrated that predictive errors assessed by k nearest neighbour or weighted PRedicted Error Sum of Squares (PRESS) on samples of external test data or by internal cross-validation improved the performance of the uncertainty assessment. Analogy using similarity defined by Euclidean distances, or differences in standard deviation in perturbed predictions, resulted in better performances than similarity defined by distance to, or density of, the training data. Locally assessed predictive distributions had on average at least as good coverage as Gaussian distribution with variance assessed from the PRESS. An R-code is provided that evaluates performances of the suggested algorithms to assess predictive error based on log likelihood scores and empirical coverage graphs, and which applies these to derive confidence intervals or samples from the predictive distributions of query compounds.

Ämnesord

NATURVETENSKAP  -- Geovetenskap och miljövetenskap (hsv//swe)
NATURAL SCIENCES  -- Earth and Related Environmental Sciences (hsv//eng)
NATURVETENSKAP  -- Geovetenskap och miljövetenskap -- Miljövetenskap (hsv//swe)
NATURAL SCIENCES  -- Earth and Related Environmental Sciences -- Environmental Sciences (hsv//eng)

Nyckelord

Predictive error
Variance
Reliability
Bootstrap
Risk assessment
Miljövetenskap

Publikations- och innehållstyp

art (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy