SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Reichel Jane)
 

Sökning: WFRF:(Reichel Jane) > (2015-2019) > BiobankCloud :

BiobankCloud : A platform for the secure storage, sharing, and processing of large biomedical data sets

Bessani, A. (författare)
Univ Lisbon, Fac Ciencias, LaSIGE, Lisbon, Portugal.
Brandt, J. (författare)
Humboldt Univ, Berlin, Germany.
Bux, M. (författare)
Humboldt Univ, Berlin, Germany.
visa fler...
Cogo, V. (författare)
Univ Lisbon, Fac Ciencias, LaSIGE, Lisbon, Portugal.
Dimitrova, L. (författare)
Charite, Berlin, Germany.
Dowling, Jim (författare)
KTH,Programvaruteknik och Datorsystem, SCS,KTH Royal Inst Technol, Stockholm, Sweden.
Gholami, Ali (författare)
KTH,KTH Royal Inst Technol, Stockholm, Sweden.
Hakimzadeh, Kamal (författare)
KTH,Programvaruteknik och Datorsystem, SCS,KTH Royal Inst Technol, Stockholm, Sweden.
Hummel, M. (författare)
Charite, Berlin, Germany.
Ismail, Mahmoud (författare)
KTH,Programvaruteknik och Datorsystem, SCS,KTH Royal Inst Technol, Stockholm, Sweden.
Laure, Erwin (författare)
KTH,Parallelldatorcentrum, PDC,High Performance Computing and Visualization (HPCViz),KTH Royal Inst Technol, Stockholm, Sweden.
Leser, U. (författare)
Humboldt Univ, Berlin, Germany.
Litton, J. -E (författare)
Karolinska Inst, Solna, Sweden.
Martinez, R. (författare)
Karolinska Inst, Solna, Sweden.
Niazi, Salman (författare)
KTH,Programvaruteknik och Datorsystem, SCS,KTH Royal Inst Technol, Stockholm, Sweden.
Reichel, Jane (författare)
Uppsala universitet,Centrum för forsknings- och bioetik
Zimmermann, K. (författare)
Charite, Berlin, Germany.
visa färre...
Univ Lisbon, Fac Ciencias, LaSIGE, Lisbon, Portugal Humboldt Univ, Berlin, Germany. (creator_code:org_t)
2016-06-24
2016
Engelska.
Ingår i: 1st International Workshop on Data Management and Analytics for Medicine and Healthcare, DMAH 2015 and Workshop on Big-Graphs Online Querying, Big-O(Q) 2015 held in conjunction with 41st International Conference on Very Large Data Bases, VLDB 2015. - Cham : Springer. - 9783319415758 - 9783319415765 ; , s. 89-105
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Biobanks store and catalog human biological material that is increasingly being digitized using next-generation sequencing (NGS). There is, however, a computational bottleneck, as existing software systems are not scalable and secure enough to store and process the incoming wave of genomic data from NGS machines. In the BiobankCloud project, we are building a Hadoop-based platform for the secure storage, sharing, and parallel processing of genomic data. We extended Hadoop to include support for multi-tenant studies, reduced storage requirements with erasure coding, and added support for extensible and consistent metadata. On top of Hadoop, we built a scalable scientific workflow engine featuring a proper workflow definition language focusing on simple integration and chaining of existing tools, adaptive scheduling on Apache Yarn, and support for iterative dataflows. Our platform also supports the secure sharing of data across different, distributed Hadoop clusters. The software is easily installed and comes with a user-friendly web interface for running, managing, and accessing data sets behind a secure 2-factor authentication. Initial tests have shown that the engine scales well to dozens of nodes. The entire system is open-source and includes pre-defined workflows for popular tasks in biomedical data analysis, such as variant identification, differential transcriptome analysis using RNA-Seq, and analysis of miRNA-Seq and ChIP-Seq data.

Ämnesord

TEKNIK OCH TEKNOLOGIER  -- Industriell bioteknik -- Biomaterial (hsv//swe)
ENGINEERING AND TECHNOLOGY  -- Industrial Biotechnology -- Bio Materials (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Annan data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Other Computer and Information Science (hsv//eng)
MEDICIN OCH HÄLSOVETENSKAP  -- Hälsovetenskap -- Medicinsk etik (hsv//swe)
MEDICAL AND HEALTH SCIENCES  -- Health Sciences -- Medical Ethics (hsv//eng)

Nyckelord

Biological materials
Data handling
Engines
Genes
Information management
Open source software
Open systems
RNA
Storage (materials)
Adaptive scheduling
Biomedical data analysis
Computational bottlenecks
Next-generation sequencing
Parallel processing
Scientific workflow engines
Storage requirements
Transcriptome analysis
Digital storage

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy