SwePub
Tyck till om SwePub Sök här!
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Santos T.A.B.)
 

Sökning: WFRF:(Santos T.A.B.) > (2020) > No one-size-fits-al...

No one-size-fits-all solution to clean GBIF

Zizka, A. (författare)
Carvalho, F. A. (författare)
Calvente, A. (författare)
visa fler...
Baez-Lizarazo, M. R. (författare)
Cabral, A. (författare)
Coelho, J. F. R. (författare)
Colli-Silva, M. (författare)
Fantinati, M. R. (författare)
Fernandes, M. F. (författare)
Ferreira-Araujo, T. (författare)
Moreira, F. G. L. (författare)
Santos, N. M. D. (författare)
Santos, T. A. B. (författare)
dos Santos-Costa, R. C. (författare)
Serrano, F. C. (författare)
da Silva, A. P. A. (författare)
Soares, A. D. (författare)
de Souza, P. G. C. (författare)
Tomaz, E. C. (författare)
Vale, V. F. (författare)
Vieira, T. L. (författare)
Antonelli, Alexandre, 1978 (författare)
Gothenburg University,Göteborgs universitet,Institutionen för biologi och miljövetenskap,Department of Biological and Environmental Sciences
visa färre...
 (creator_code:org_t)
2020-09-28
2020
Engelska.
Ingår i: Peerj. - : PeerJ. - 2167-8359. ; 8
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • Species occurrence records provide the basis for many biodiversity studies. They derive from georeferenced specimens deposited in natural history collections and visual observations, such as those obtained through various mobile applications. Given the rapid increase in availability of such data, the control of quality and accuracy constitutes a particular concern. Automatic filtering is a scalable and reproducible means to identify potentially problematic records and tailor datasets from public databases such as the Global Biodiversity Information Facility (GBIF; http://www.gbif.org), for biodiversity analyses. However, it is unclear how much data may be lost by filtering, whether the same filters should be applied across all taxonomic groups, and what the effect of filtering is on common downstream analyses. Here, we evaluate the effect of 13 recently proposed filters on the inference of species richness patterns and automated conservation assessments for 18 Neotropical taxa, including terrestrial and marine animals, fungi, and plants downloaded from GBIF. We find that a total of 44.3% of the records are potentially problematic, with large variation across taxonomic groups (25-90%). A small fraction of records was identified as erroneous in the strict sense (4.2%), and a much larger proportion as unfit for most downstream analyses (41.7%). Filters of duplicated information, collection year, and basis of record, as well as coordinates in urban areas, or for terrestrial taxa in the sea or marine taxa on land, have the greatest effect. Automated filtering can help in identifying problematic records, but requires customization of which tests and thresholds should be applied to the taxonomic group and geographic area under focus. Our results stress the importance of thorough recording and exploration of the meta-data associated with species records for biodiversity research.

Ämnesord

NATURVETENSKAP  -- Biologi (hsv//swe)
NATURAL SCIENCES  -- Biological Sciences (hsv//eng)

Nyckelord

Automated cleaning
Automated conservation assessment
Data quality
GBIF
Neotropics
Species distributions
conservation assessments
r package
biodiversity
diversity
Science & Technology - Other Topics

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

  • Peerj (Sök värdpublikationen i LIBRIS)

Till lärosätets databas

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy