SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Ourselin Sebastien)
 

Sökning: WFRF:(Ourselin Sebastien) > (2020-2022) > Accessible data cur...

Accessible data curation and analytics for international-scale citizen science datasets

Murray, Benjamin (författare)
King's College London
Kerfoot, Eric (författare)
King's College London
Chen, Liyuan (författare)
King's College London
visa fler...
Deng, Jie (författare)
King's College London
Graham, Mark S. (författare)
King's College London
Sudre, Carole H. (författare)
University College London,King's College London
Molteni, Erika (författare)
King's College London
Canas, Liane S. (författare)
King's College London
Antonelli, Michela (författare)
King's College London
Klaser, Kerstin (författare)
King's College London
Visconti, Alessia (författare)
King's College London
Hammers, Alexander (författare)
King's College London
Chan, Andrew T. (författare)
Massachusetts General Hospital
Franks, Paul W. (författare)
Lund University,Lunds universitet,Genetisk och molekylär epidemiologi,Forskargrupper vid Lunds universitet,Genetic and Molecular Epidemiology,Lund University Research Groups,Skåne University Hospital
Davies, Richard (författare)
Zoe Global Limited
Wolf, Jonathan (författare)
Zoe Global Limited
Spector, Tim D. (författare)
King's College London
Steves, Claire J. (författare)
King's College London
Modat, Marc (författare)
King's College London
Ourselin, Sebastien (författare)
King's College London
visa färre...
 (creator_code:org_t)
2021-11-22
2021
Engelska.
Ingår i: Scientific Data. - : Springer Science and Business Media LLC. - 2052-4463. ; 8:1
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • The Covid Symptom Study, a smartphone-based surveillance study on COVID-19 symptoms in the population, is an exemplar of big data citizen science. As of May 23rd, 2021, over 5 million participants have collectively logged over 360 million self-assessment reports since its introduction in March 2020. The success of the Covid Symptom Study creates significant technical challenges around effective data curation. The primary issue is scale. The size of the dataset means that it can no longer be readily processed using standard Python-based data analytics software such as Pandas on commodity hardware. Alternative technologies exist but carry a higher technical complexity and are less accessible to many researchers. We present ExeTera, a Python-based open source software package designed to provide Pandas-like data analytics on datasets that approach terabyte scales. We present its design and capabilities, and show how it is a critical component of a data curation pipeline that enables reproducible research across an international research group for the Covid Symptom Study.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Programvaruteknik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Software Engineering (hsv//eng)
MEDICIN OCH HÄLSOVETENSKAP  -- Annan medicin och hälsovetenskap -- Övrig annan medicin och hälsovetenskap (hsv//swe)
MEDICAL AND HEALTH SCIENCES  -- Other Medical and Health Sciences -- Other Medical and Health Sciences not elsewhere specified (hsv//eng)

Publikations- och innehållstyp

art (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy