SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Ahmed Laeeq)
 

Sökning: WFRF:(Ahmed Laeeq) > Efficient iterative...

Efficient iterative virtual screening with Apache Spark and conformal prediction

Ahmed, Laeeq (författare)
KTH,Beräkningsvetenskap och beräkningsteknik (CST)
Georgiev, Valentin (författare)
Uppsala universitet,Institutionen för farmaceutisk biovetenskap,Spjuth
Capuccini, Marco (författare)
Uppsala universitet,Institutionen för farmaceutisk biovetenskap,Tillämpad beräkningsvetenskap,Spjuth
visa fler...
Toor, Salman (författare)
Uppsala universitet,Tillämpad beräkningsvetenskap
Schaal, Wesley, PhD (författare)
Uppsala universitet,Institutionen för farmaceutisk biovetenskap,Spjuth
Laure, Erwin (författare)
KTH,Beräkningsvetenskap och beräkningsteknik (CST)
Spjuth, Ola (författare)
Uppsala universitet,Institutionen för farmaceutisk biovetenskap,Spjuth
visa färre...
 (creator_code:org_t)
2018-03-01
2018
Engelska.
Ingår i: Journal of Cheminformatics. - : BioMed Central. - 1758-2946. ; 10
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • Background: Docking and scoring large libraries of ligands against target proteins forms the basis of structure-based virtual screening. The problem is trivially parallelizable, and calculations are generally carried out on computer clusters or on large workstations in a brute force manner, by docking and scoring all available ligands. Contribution: In this study we propose a strategy that is based on iteratively docking a set of ligands to form a training set, training a ligand-based model on this set, and predicting the remainder of the ligands to exclude those predicted as 'low-scoring' ligands. Then, another set of ligands are docked, the model is retrained and the process is repeated until a certain model efficiency level is reached. Thereafter, the remaining ligands are docked or excluded based on this model. We use SVM and conformal prediction to deliver valid prediction intervals for ranking the predicted ligands, and Apache Spark to parallelize both the docking and the modeling. Results: We show on 4 different targets that conformal prediction based virtual screening (CPVS) is able to reduce the number of docked molecules by 62.61% while retaining an accuracy for the top 30 hits of 94% on average and a speedup of 3.7. The implementation is available as open source via GitHub (https://github.com/laeeq80/spark-cpvs) and can be run on high-performance computers as well as on cloud resources.

Ämnesord

NATURVETENSKAP  -- Kemi (hsv//swe)
NATURAL SCIENCES  -- Chemical Sciences (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Bioinformatik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Bioinformatics (hsv//eng)

Nyckelord

Virtual screening
Docking
Conformal prediction
Cloud computing
Apache Spark

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy