SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(de Lhoneux Miryam 1990 )
 

Sökning: WFRF:(de Lhoneux Miryam 1990 ) > An Investigation of...

  • Smith, Aaron,1985-Uppsala universitet,Institutionen för lingvistik och filologi (författare)

An Investigation of the Interactions Between Pre-Trained Word Embeddings, Character Models and POS Tags in Dependency Parsing

  • Artikel/kapitelEngelska2018

Förlag, utgivningsår, omfång ...

  • Association for Computational Linguistics,2018
  • printrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:uu-371245
  • https://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-371245URI
  • https://doi.org/10.18653/v1/D18-1291DOI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:kon swepub-publicationtype

Anmärkningar

  • We provide a comprehensive analysis of the interactions between pre-trained word embeddings, character models and POS tags in a transition-based dependency parser. While previous studies have shown POS information to be less important in the presence of character models, we show that in fact there are complex interactions between all three techniques. In isolation each produces large improvements over a baseline system using randomly initialised word embeddings only, but combining them quickly leads to diminishing returns. We categorise words by frequency, POS tag and language in order to systematically investigate how each of the techniques affects parsing quality. For many word categories, applying any two of the three techniques is almost as good as the full combined system. Character models tend to be more important for low-frequency open-class words, especially in morphologically rich languages, while POS tags can help disambiguate high-frequency function words. We also show that large character embedding sizes help even for languages with small character sets, especially in morphologically rich languages.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • de Lhoneux, Miryam,1990-Uppsala universitet,Institutionen för lingvistik och filologi(Swepub:uu)mirde471 (författare)
  • Stymne, Sara,1977-Uppsala universitet,Institutionen för lingvistik och filologi(Swepub:uu)sarst212 (författare)
  • Nivre, Joakim,1962-Uppsala universitet,Institutionen för lingvistik och filologi(Swepub:uu)joani384 (författare)
  • Uppsala universitetInstitutionen för lingvistik och filologi (creator_code:org_t)

Sammanhörande titlar

  • Ingår i:Proceedings of the 2018 Conference on Empirical Methods in Natural Language Processing: Association for Computational Linguistics, s. 2711-27209781948087841

Internetlänk

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy