SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Franco EL)
 

Sökning: WFRF:(Franco EL) > LIBAC: An Annotated...

LIBAC: An Annotated Corpus for Automated “Reading” of the Lithium-Ion Battery Research Literature

El-Bousiydy, Hassna (författare)
Centre national de la recherche scientifique (CNRS),Université de Picardie Jules Verne,University of Picardie Jules Verne
Troncoso, Javier F. (författare)
Centre national de la recherche scientifique (CNRS),Université de Picardie Jules Verne,University of Picardie Jules Verne
Johansson, Patrik, 1969 (författare)
Chalmers tekniska högskola,Chalmers University of Technology,Centre national de la recherche scientifique (CNRS)
visa fler...
Franco, Alejandro A. (författare)
Centre national de la recherche scientifique (CNRS),Institut Universitaire de France,Université de Picardie Jules Verne,University of Picardie Jules Verne
visa färre...
 (creator_code:org_t)
2023-02-21
2023
Engelska.
Ingår i: Chemistry of Materials. - : American Chemical Society (ACS). - 1520-5002 .- 0897-4756. ; 35:5, s. 1849-1857
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • The lithium-ion battery (LIB) research literature has increased very rapidly of late. While this is an immense source of valuable knowledge and facts for the community, these are also partly “buried” in the literature. To truly make the most possible use of the information available and automate “reading”, special tools are required. Named entity recognition (NER) is one such tool, which uses supervised machine learning for information extraction. To enable efficient NER, however, a large and high-quality annotated corpus is crucial. Here, we report on our generated, semi-automatically annotated lithium-ion battery annotated corpus, “LIBAC”, for 28 different entities of LIBs, which was used for training and evaluating Tok2vec and Transformer-based models, resulting in high general accuracies for these with F1-scores of 81 and 83%, respectively. LIBAC itself was created from 6985 paragraphs randomly chosen from ca. 11,000 LIB research papers and contains 73,300 annotated spans (627,428 tokens). This is the prime stepping-stone needed to develop a large-scale information extraction system designed for the LIB research literature.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Annan data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Other Computer and Information Science (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Språkteknologi (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Language Technology (hsv//eng)
SAMHÄLLSVETENSKAP  -- Medie- och kommunikationsvetenskap -- Systemvetenskap, informationssystem och informatik med samhällsvetenskaplig inriktning (hsv//swe)
SOCIAL SCIENCES  -- Media and Communications -- Information Systems, Social aspects (hsv//eng)

Publikations- och innehållstyp

art (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy