SwePub
Sök i LIBRIS databas

  Utökad sökning

L773:9782951740891
 

Sökning: L773:9782951740891 > The Uppsala Corpus ...

The Uppsala Corpus of Student Writings : Corpus Creation, Annotation, and Analysis

Megyesi, Beata, 1971- (författare)
Uppsala universitet,Institutionen för lingvistik och filologi,Computational Linguistics
Näsman, Jesper (författare)
Uppsala universitet,Institutionen för lingvistik och filologi,Datorlingvistik
Palmér, Anne (författare)
Uppsala universitet,Institutionen för nordiska språk
 (creator_code:org_t)
Paris : EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA, 2016
2016
Engelska.
Ingår i: LREC 2016. - Paris : EUROPEAN LANGUAGE RESOURCES ASSOC-ELRA. - 9782951740891 ; , s. 3192-3199
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • The Uppsala Corpus of Student Writings consists of Swedish texts produced as part of a national test of students ranging in age from nine (in year three of primary school) to nineteen (the last year of upper secondary school) who are studying either Swedish or Swedish as a second language. National tests have been collected since 1996. The corpus currently consists of 2,500 texts containing over 1.5 million tokens. Parts of the texts have been annotated on several linguistic levels using existing state-of-the-art natural language processing tools. In order to make the corpus easy to interpret for scholars in the humanities, we chose the CoNLL format instead of an XML-based representation. Since spelling and grammatical errors are common in student writings, the texts are automatically corrected while keeping the original tokens in the corpus. Each token is annotated with part-of-speech and morphological features as well as syntactic structure. The main purpose of the corpus is to facilitate the systematic and quantitative empirical study of the writings of various student groups based on gender, geographic area, age, grade awarded or a combination of these, synchronically or diachronically. The intention is for this to be a monitor corpus, currently under development.

Ämnesord

HUMANIORA  -- Språk och litteratur -- Studier av enskilda språk (hsv//swe)
HUMANITIES  -- Languages and Literature -- Specific Languages (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Språkteknologi (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Language Technology (hsv//eng)

Nyckelord

student writings
digital humanities
educational applications
Datorlingvistik
Computational Linguistics
Scandinavian Languages
Nordiska språk

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

  • LREC 2016 (Sök värdpublikationen i LIBRIS)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Megyesi, Beata, ...
Näsman, Jesper
Palmér, Anne
Om ämnet
HUMANIORA
HUMANIORA
och Språk och litter ...
och Studier av enski ...
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Språkteknologi
Artiklar i publikationen
LREC 2016
Av lärosätet
Uppsala universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy