SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:kth-337283"
 

Sökning: id:"swepub:oai:DiVA.org:kth-337283" > Optimizing the Perf...

Optimizing the Performance of Text Classification Models by Improving the Isotropy of the Embeddings Using a Joint Loss Function

Attieh, Joseph, 1998- (författare)
KTH,Programvaruteknik och datorsystem, SCS,University of Helsinki, Helsinki, Finland;Huawei Technologies Oy., Helsinki, Finland
Woubie Zewoudie, Abraham (författare)
Silo AI, Helsinki, Finland
Vlassov, Vladimir, 1957- (författare)
KTH,Programvaruteknik och datorsystem, SCS
visa fler...
Flanagan, Adrian (författare)
Huawei Technologies Oy., Helsinki, Finland
Bäckström, Tom (författare)
Aalto University, Espoo, Finland
visa färre...
 (creator_code:org_t)
Cham : Springer Nature, 2023
2023
Engelska.
Ingår i: Document Analysis and Recognition. - Cham : Springer Nature. ; , s. 121-136
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Recent studies show that the spatial distribution of the sentence representations generated from pre-trained language models is highly anisotropic. This results in a degradation in the performance of the models on the downstream task. Most methods improve the isotropy of the sentence embeddings by refining the corresponding contextual word representations, then deriving the sentence embeddings from these refined representations. In this study, we propose to improve the quality of the sentence embeddings extracted from the [CLS] token of the pre-trained language models by improving the isotropy of the embeddings. We add one feed-forward layer between the model and the downstream task layers, and we train it using a novel joint loss function. The proposed approach results in embeddings with better isotropy, that generalize better on the downstream task. Experimental results on 3 GLUE datasets with classification as the downstream task show that our proposed method is on par with the state-of-the-art, as it achieves performance gains of around 2–3% on the downstream tasks compared to the baseline.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Språkteknologi (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Language Technology (hsv//eng)

Nyckelord

Text Classification
Isotropy
Embeddings
BERT
IsoScore
Datalogi
Computer Science

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Attieh, Joseph, ...
Woubie Zewoudie, ...
Vlassov, Vladimi ...
Flanagan, Adrian
Bäckström, Tom
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datavetenskap
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Språkteknologi
Artiklar i publikationen
Av lärosätet
Kungliga Tekniska Högskolan

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy