SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Adesam Yvonne 1975)
 

Sökning: WFRF:(Adesam Yvonne 1975) > SWORD :

SWORD : Towards Cutting-Edge Swedish Word Processing

Cap, Fabienne (författare)
Adesam, Yvonne, 1975 (författare)
Gothenburg University,Göteborgs universitet,Institutionen för svenska språket,Department of Swedish
Ahrenberg, Lars (författare)
visa fler...
Borin, Lars, 1957 (författare)
Gothenburg University,Göteborgs universitet,Institutionen för svenska språket,Department of Swedish
Bouma, Gerlof, 1979 (författare)
Gothenburg University,Göteborgs universitet,Institutionen för svenska språket,Department of Swedish
Forsberg, Markus, 1974 (författare)
Gothenburg University,Göteborgs universitet,Institutionen för svenska språket,Department of Swedish
Kann, Viggo (författare)
Östling, Robert (författare)
Stockholms universitet,Avdelningen för datorlingvistik
Smith, Aaron (författare)
Wirén, Mats (författare)
Stockholms universitet,Avdelningen för datorlingvistik
Nivre, Joakim (författare)
visa färre...
 (creator_code:org_t)
2016
2016
Engelska.
Ingår i: Proceedings of SLTC 2016.
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Despite many years of research on Swedish language technology, there is still no well-documented standard for Swedish word processing covering the whole spectrum from low-level tokenization to morphological analysis and disambiguation. SWORD is a new initiative within the SWE-CLARIN consortium aiming to develop documented standards for Swedish word processing. In this paper, we report on a pilot study of Swedish tokenization, where we compare the output of six different tokenizers on four different text types. For one text type (Wikipedia articles), we also compare to the tokenization produced by six manual annotators.

Ämnesord

HUMANIORA  -- Språk och litteratur -- Jämförande språkvetenskap och allmän lingvistik (hsv//swe)
HUMANITIES  -- Languages and Literature -- General Language Studies and Linguistics (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Språkteknologi (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Language Technology (hsv//eng)
HUMANIORA  -- Språk och litteratur -- Studier av enskilda språk (hsv//swe)
HUMANITIES  -- Languages and Literature -- Specific Languages (hsv//eng)

Nyckelord

Tokenization
morphological analysis
Computational Linguistics
datorlingvistik

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Till lärosätets databas

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy