SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:uu-144989"
 

Sökning: id:"swepub:oai:DiVA.org:uu-144989" > Uncertainty Detecti...

Uncertainty Detection as Approximate Max-Margin Sequence Labelling

Täckström, Oscar (författare)
RISE,Uppsala universitet,Institutionen för lingvistik och filologi,Uppsala University, Disciplinary Domain of Humanities and Social Sciences, Faculty of Languages, Department of Linguistics and Philology.(Datorlingvistik),SICS
Velupillai, Sumithra Ulrika (författare)
tockholms universitet, Institutionen för data- och systemvetenskap,Institutionen för data- och systemvetenskap, Informationssystem
Hassel, Martin (författare)
tockholms universitet, Institutionen för data- och systemvetenskap
visa fler...
Eriksson, Gunnar (författare)
RISE,SICS,Swedish Institute of Computer Science
Dalianis, Hercules (författare)
Stockholms universitet,Institutionen för data- och systemvetenskap,tockholms universitet, Institutionen för data- och systemvetenskap
Karlgren, Jussi (författare)
RISE,SICS,Swedish Institute of Computer Science
Duneld, Martin (författare)
Stockholms universitet,Institutionen för data- och systemvetenskap
visa färre...
 (creator_code:org_t)
Association for Computational Linguistics, 2010
2010
Engelska.
Ingår i: CoNLL 2010. - : Association for Computational Linguistics. ; , s. 84-91
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • This paper reports experiments for the CoNLL 2010 shared task on learning to detect hedges and their scope in natural language text. We have addressed the experimental tasks as supervised linear maximum margin prediction problems. For sentence level hedge detection in the biological domain we use an L1-regularised binary support vector machine, while for sentence level weasel detection in the Wikipedia domain, we use an L2-regularised approach. We model the in-sentence uncertainty cue and scope detection task as an L2-regularised approximate maximum margin sequence labelling problem, using the BIO-encoding. In addition to surface level features, we use a variety of linguistic features based on a functional dependency analysis. A greedy forward selection strategy is used in exploring the large set of potential features. Our official results for Task 1 for the biological domain are 85.2 F1-score, for the Wikipedia set 55.4 F1-score. For Task 2, our official results are 2.1 for the entire task with a score of 62.5 for cue detection. After resolving errors and final bugs, our final results are for Task 1, biological: 86.0, Wikipedia: 58.2; Task 2, scopes: 39.6 and cues: 78.5.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Språkteknologi (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Language Technology (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences (hsv//eng)

Nyckelord

Computational linguistics
Datorlingvistik
Language technology
Språkteknologi
Computational Linguistics
Datorlingvistik
data- och systemvetenskap

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Till lärosätets databas

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy