Sökning: WFRF:(Adesam Yvonne 1975) >
SWORD :
SWORD : Towards Cutting-Edge Swedish Word Processing
-
Cap, Fabienne (författare)
-
- Adesam, Yvonne, 1975 (författare)
- Gothenburg University,Göteborgs universitet,Institutionen för svenska språket,Department of Swedish
-
Ahrenberg, Lars (författare)
-
visa fler...
-
- Borin, Lars, 1957 (författare)
- Gothenburg University,Göteborgs universitet,Institutionen för svenska språket,Department of Swedish
-
- Bouma, Gerlof, 1979 (författare)
- Gothenburg University,Göteborgs universitet,Institutionen för svenska språket,Department of Swedish
-
- Forsberg, Markus, 1974 (författare)
- Gothenburg University,Göteborgs universitet,Institutionen för svenska språket,Department of Swedish
-
Kann, Viggo (författare)
-
- Östling, Robert (författare)
- Stockholms universitet,Avdelningen för datorlingvistik
-
Smith, Aaron (författare)
-
- Wirén, Mats (författare)
- Stockholms universitet,Avdelningen för datorlingvistik
-
Nivre, Joakim (författare)
-
visa färre...
-
(creator_code:org_t)
- 2016
- 2016
- Engelska.
-
Ingår i: Proceedings of SLTC 2016.
- Relaterad länk:
-
https://su.diva-port... (primary) (Raw object)
-
visa fler...
-
https://urn.kb.se/re...
-
https://gup.ub.gu.se...
-
visa färre...
Abstract
Ämnesord
Stäng
- Despite many years of research on Swedish language technology, there is still no well-documented standard for Swedish word processing covering the whole spectrum from low-level tokenization to morphological analysis and disambiguation. SWORD is a new initiative within the SWE-CLARIN consortium aiming to develop documented standards for Swedish word processing. In this paper, we report on a pilot study of Swedish tokenization, where we compare the output of six different tokenizers on four different text types. For one text type (Wikipedia articles), we also compare to the tokenization produced by six manual annotators.
Ämnesord
- HUMANIORA -- Språk och litteratur -- Jämförande språkvetenskap och allmän lingvistik (hsv//swe)
- HUMANITIES -- Languages and Literature -- General Language Studies and Linguistics (hsv//eng)
- NATURVETENSKAP -- Data- och informationsvetenskap -- Språkteknologi (hsv//swe)
- NATURAL SCIENCES -- Computer and Information Sciences -- Language Technology (hsv//eng)
- HUMANIORA -- Språk och litteratur -- Studier av enskilda språk (hsv//swe)
- HUMANITIES -- Languages and Literature -- Specific Languages (hsv//eng)
Nyckelord
- Tokenization
- morphological analysis
- Computational Linguistics
- datorlingvistik
Publikations- och innehållstyp
- ref (ämneskategori)
- kon (ämneskategori)
- Av författaren/redakt...
-
Cap, Fabienne
-
Adesam, Yvonne, ...
-
Ahrenberg, Lars
-
Borin, Lars, 195 ...
-
Bouma, Gerlof, 1 ...
-
Forsberg, Markus ...
-
visa fler...
-
Kann, Viggo
-
Östling, Robert
-
Smith, Aaron
-
Wirén, Mats
-
Nivre, Joakim
-
visa färre...
- Om ämnet
-
- HUMANIORA
-
HUMANIORA
-
och Språk och litter ...
-
och Jämförande språk ...
-
- NATURVETENSKAP
-
NATURVETENSKAP
-
och Data och informa ...
-
och Språkteknologi
-
- HUMANIORA
-
HUMANIORA
-
och Språk och litter ...
-
och Studier av enski ...
- Artiklar i publikationen
- Proceedings of S ...
- Av lärosätet
-
Stockholms universitet
-
Göteborgs universitet